Analysiere XML-Schema-Definition mit Python und konvertiere sie in CSV.

Question

Analysiere XML-Schema-Definition mit Python und konvertiere sie in CSV.

Gefragt el 24 de Juni, 2014: Wann wurde die Frage gestellt
7461 Ansichten: Anzahl der Besuche der Frage
2 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich möchte die Elemente einer XML-Schema-Definition in eine CSV-Datei für Dokumentation und Analyse parsen. Mein XSD hat folgende Form;

Für einen bestimmten Elementnamen möchte ich eine CSV-Datei erstellen, die Element 1, Element 2, Element 3 usw. enthält.

Ich habe die Python lxml-Bibliothek ausprobiert, habe aber bisher nicht auf einzelne Elemente zugreifen / filtern können.

import xml.etree.ElementTree as ET
tree = ET.parse('doc.xsd')
root = tree.getroot()
for child in root:
  print child.tag, child.attrib

Gefragt el 24 de Juni, 2014 von user265603

Answer 1

2 Antworten

Answer 2

3voto

Jan Vlcinsky Punkte 40541

Der folgende Code zeigt, wie man in XSD nach Elementnamen sucht.

from lxml import etree
xsdstr = """

"""

doc = etree.fromstring(xsdstr.strip())

namespaces = {"xs": "http://www.w3.org/2001/XMLSchema"}

names = doc.xpath("//xs:element/@ref", namespaces=namespaces)
print names

Bei der Ausführung wird Folgendes gedruckt:

['element 1', 'element 2', 'element 3']

Falls Sie ein komplexeres Schema haben, müssen Sie die Namen möglicherweise genauer definieren. Hier ist ein mögliches Beispiel:

print "Versuche präziser zu zielen ------"
names = doc.xpath("//xs:element[@name='ELEMENT']//xs:sequence/xs:element/@ref", namespaces=namespaces)
print names

In unserem Fall ist das Ergebnis dasselbe.

Beantwortet el 24 de Juni, 2014 von Jan Vlcinsky (40541 Punkte )

Answer 3

0voto

Nicht registrierter Benutzer Punkte 0

Finden Sie den XSD-zu-CSV-Parser wie unten angegeben: Mit dem unten stehenden Code können auch mehrere Knoten-XMLs geparst werden.

import pandas as pd
from bs4 import BeautifulSoup

def xsd_to_dict(xsd_path):
    super_dict = {}
    soup = BeautifulSoup(open(xsd_path), "html.parser")
    for complex_type in soup.find_all('xs:complextype'):
        xsd_parsed = [x for x in ",".join(str(complex_type).split("\n"))
            .replace("", "")
            .replace("'", "")
            .replace("", "")
            .replace("", "")
            .replace(">", "").replace("sequence", "")
            .split(",") if x != ""]

        if len(xsd_parsed[0]) > len("complextype") + 1:
            matrix_list = [e.split(" ") for e in xsd_parsed[-len(xsd_parsed) + 1:]]

            level_1 = ["|".join(["".join([":".join(final.split("=")) for final in y if len(final.split("=")) == 2])
                                 for y in [x.split(",") for x in item]]) for item in matrix_list]
            level_1.insert(0, xsd_parsed[0])
            for x in level_1[-len(xsd_parsed) + 1:]:
                flattened_dict = {x.split(":")[0]:"-".join(x.split(":")[-len(x.split(":")) + 1:])
                       for x in (level_1[0] + x).replace("=", ":").split("|")}
                xPath = flattened_dict.get("complextype name")
                xmlName = flattened_dict.get("name")
                dataType = flattened_dict.get("type")

                if xmlName != None:
                    final_dict = {x.split(":")[0]:x.split(":")[1]
                                for x in str("xpath:"+str(xPath)+",xmlFieldName:"+str(xmlName)+",dataPath:"+str(dataType)).split(",")}
                    for k, v in final_dict.items():
                        super_dict.setdefault(k, []).append(v)

    return super_dict

def xsd_to_csv(xsd_path):
    pd.DataFrame(xsd_to_dict(xsd_path)).to_csv(xsd_path.replace(".xsd", ".csv"))
    return "done"

xsd_to_csv("CustomersOrders.xsd")

Eingabe: https://learn.microsoft.com/en-us/dotnet/csharp/programming-guide/concepts/linq/sample-xsd-file-customers-and-orders1

Ausgabe:

,xpath,xmlFieldName,dataPath
0,"""CustomerType""","""CompanyName""","""xs-string"""
1,"""CustomerType""","""ContactName""","""xs-string"""
2,"""CustomerType""","""ContactTitle""","""xs-string"""
3,"""CustomerType""","""Phone""","""xs-string"""
4,"""CustomerType""","""Fax""","""xs-string"""
5,"""CustomerType""","""FullAddress""","""AddressType"""
6,"""CustomerType""","""CustomerID""","""xs-token""

Beantwortet el 24 de Marsch, 2020 von Nicht registrierter Benutzer (0 Punkte )

Analysiere XML-Schema-Definition mit Python und konvertiere sie in CSV.

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Analysiere XML-Schema-Definition mit Python und konvertiere sie in CSV.

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: