Gibt es einen Parser/Bibliothek, die in der Lage ist, ein HTML-Dokument in einen DOM-Baum mit Java zu lesen? Ich würde gerne den Standard DOM/Xpath
API, die Java bietet.
Die meisten Bibliotheken scheinen über eigene APIs zu verfügen, um diese Aufgabe zu lösen. Außerdem scheint die Umwandlung von HTML in XML-DOM von den meisten verfügbaren Parsern nicht unterstützt zu werden.
Irgendwelche Ideen oder Erfahrungen mit einem guten HTML-DOM-Parser?