XML-Schreibwerkzeuge für Python

Question

XML-Schreibwerkzeuge für Python

Gefragt el 11 de September, 2008: Wann wurde die Frage gestellt
38882 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich bin derzeit versuchen ElementTree und es sieht gut aus, es escapes HTML-Entitäten und so weiter und so fort. Verpasse ich etwas wirklich wundervolles, von dem ich noch nichts gehört habe?

Das ist ähnlich wie das, was ich gerade mache:

import xml.etree.ElementTree as ET
root = ET.Element('html')
head = ET.SubElement(root,'head')
script = ET.SubElement(head,'script')
script.set('type','text/javascript')
script.text = "var a = 'I love &aacute; letters'"
body = ET.SubElement(root,'body')
h1 = ET.SubElement(body,'h1')
h1.text = "And I like the fact that 3 > 1"
tree = ET.ElementTree(root)
tree.write('foo.xhtml')

# more foo.xhtml
<html><head><script type="text/javascript">var a = 'I love &amp;aacute;
letters'</script></head><body><h1>And I like the fact that 3 &gt; 1</h1>
</body></html>

Gefragt el 11 de September, 2008 von Vinko Vrsalovic

0 Stimmen

Einige der Web-Template-Sprachen (die natürlich HTML / XML erzeugen) können als Module geladen werden, ohne dass ein begleitendes Web-Framework benötigt wird. Wenn Sie etwas Ausgefallenes brauchen, würde ich vorschlagen, in diese Richtung zu gehen. Ich habe besonders gute Erfahrungen mit genshi gemacht.

Kommentiert el 1 de November, 2013 von Ian McLaird

Answer 1

3 Antworten

Answer 2

3voto

Vinko Vrsalovic Punkte 252104

Ich endete mit saxutils.escape(str), um gültige XML-Zeichenfolgen zu erzeugen und sie dann mit Elis Ansatz zu validieren, um sicher zu sein, dass ich keinen Tag übersehen habe

from xml.sax import saxutils
from xml.dom.minidom import parseString
from xml.parsers.expat import ExpatError

xml = '''<?xml version="1.0" encoding="%s"?>\n
<contents title="%s" crawl_date="%s" in_text_date="%s" 
url="%s">\n<main_post>%s</main_post>\n</contents>''' %
(self.encoding, saxutils.escape(title), saxutils.escape(time), 
saxutils.escape(date), saxutils.escape(url), saxutils.escape(contents))
try:
    minidoc = parseString(xml)
catch ExpatError:
    print "Invalid xml"

Beantwortet el 15 de September, 2008 von Vinko Vrsalovic (252104 Punkte )

0 Stimmen

Seien Sie sich bewusst, dass saxutils.escape das Falsche für die Kodierung von Werten für XML-Attribute ist; Sie wollen eigentlich quoteattr: docs.python.org/2/library/

Kommentiert el 17 de April, 2014 von richvdh

Answer 3

3voto

Nick Johnson Punkte 99799

Für jeden, der jetzt auf dieses Problem stößt, gibt es tatsächlich eine Möglichkeit, dies zu tun, die in der Standardbibliothek von Python in xml.sax.utils.XMLGenerator . Hier ist ein Beispiel dafür in Aktion:

>>> from xml.sax.saxutils import XMLGenerator
>>> import StringIO
>>> w = XMLGenerator(out, 'utf-8')
>>> w.startDocument()
>>> w.startElement("test", {'bar': 'baz'})
>>> w.characters("Foo")
>>> w.endElement("test")
>>> w.endDocument()
>>> print out.getvalue()
<?xml version="1.0" encoding="utf-8"?>
<test bar="baz">Foo</test>

Beantwortet el 1 de November, 2013 von Nick Johnson (99799 Punkte )

Answer 4

0voto

DaveP Punkte 1060

Versuchen Sie http://uche.ogbuji.net/tech/4suite/amara . Es ist recht vollständig und verfügt über einen einfachen Satz von Zugriffswerkzeugen. Normale Unicode-Unterstützung, etc.

#
#Output the XML entry
#
def genFileOLD(out,label,term,idval):
    filename=entryTime() + ".html"
    writer=MarkupWriter(out, indent=u"yes")
    writer.startDocument()
    #Test element and attribute writing
    ans=namespace=u'http://www.w3.org/2005/Atom'
    xns=namespace=u'http://www.w3.org/1999/xhtml'
    writer.startElement(u'entry',
       ans,
       extraNss={u'x':u'http://www.w3.org/1999/xhtml' ,
                 u'dc':u'http://purl.org/dc/elements/1.1'})
    #u'a':u'http://www.w3.org/2005/Atom',
    #writer.attribute(u'xml:lang',unicode("en-UK"))

    writer.simpleElement(u'title',ans,content=unicode(label))
    #writer.simpleElement(u'a:subtitle',ans,content=u' ')
    id=unicode("http://www.dpawson.co.uk/nodesets/"+afn.split(".")[0])
    writer.simpleElement(u'id',ans,content=id)
    writer.simpleElement(u'updated',ans,content=unicode(dtime()))
    writer.startElement(u'author',ans)
    writer.simpleElement(u'name',ans,content=u'Dave ')
    writer.simpleElement(u'uri',ans,
      content=u'http://www.dpawson.co.uk/nodesets/'+afn+".xml")
    writer.endElement(u'author')
    writer.startElement(u'category', ans)
    if (prompt):
        label=unicode(raw_input("Enter label "))
    writer.attribute(u'label',unicode(label))
    if (prompt):
        term = unicode(raw_input("Enter term to use "))
    writer.attribute(u'term', unicode(term))
    writer.endElement(u'category')
    writer.simpleElement(u'rights',ans,content=u'\u00A9 Dave 2005-2008')
    writer.startElement(u'link',ans)
    writer.attribute(u'href',
         unicode("http://www.dpawson.co.uk/nodesets/entries/"+afn+".html"))
    writer.attribute(u'rel',unicode("alternate"))
    writer.endElement(u'link')
    writer.startElement(u'published', ans)
    dt=dtime()
    dtu=unicode(dt)
    writer.text(dtu)
    writer.endElement(u'published')
    writer.simpleElement(u'summary',ans,content=unicode(label))
    writer.startElement(u'content',ans)
    writer.attribute(u'type',unicode("xhtml"))
    writer.startElement(u'div',xns)
    writer.simpleElement(u'h3',xns,content=unicode(label))
    writer.endElement(u'div')
    writer.endElement(u'content')
    writer.endElement(u'entry')

Beantwortet el 12 de September, 2008 von DaveP (1060 Punkte )

0 Stimmen

Geht es nur mir so, oder ist dies die einzige Namespace-gerechte Antwort?

Kommentiert el 28 de August, 2012 von djsadinoff

XML-Schreibwerkzeuge für Python

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

XML-Schreibwerkzeuge für Python

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: