13 Stimmen

Lesen einer HTML-Datei in einen DOM-Baum mit Java

Gibt es einen Parser/Bibliothek, die in der Lage ist, ein HTML-Dokument in einen DOM-Baum mit Java zu lesen? Ich würde gerne den Standard DOM/Xpath API, die Java bietet.

Die meisten Bibliotheken scheinen über eigene APIs zu verfügen, um diese Aufgabe zu lösen. Außerdem scheint die Umwandlung von HTML in XML-DOM von den meisten verfügbaren Parsern nicht unterstützt zu werden.

Irgendwelche Ideen oder Erfahrungen mit einem guten HTML-DOM-Parser?

-1voto

Pesto Punkte 23518

Der Xerces2-Parser des Apache sollte das tun, was Sie wollen.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X