Ich arbeite mit einigen HTML-Dateien. Ich versuche herauszufinden, wie ich zuverlässig zu einigen Texten gelangen kann, die in den Dokumenten vorhanden sind. Ich weiß, dass der Abschnitt, den ich möchte, mit fett gedruckten Worten beginnt und mit anderen fett gedruckten Worten endet.
bolded_item = atree.cssselect('b')
myKeys = [item for item in bolded_items if item.text if 'KEY' in item.text]
Also ist myKeys eine Liste, deren Elemente Elemente von atree sind, speziell Elemente, die fett gedruckten Text haben und das Wort 'KEY' im Text enthalten.
Jetzt möchte ich alle Teile des Baums zwischen beliebigen 2 Elementen in myKeys identifizieren. Ich möchte in der Lage sein, sie auf verschiedene Weisen zu manipulieren. Ich habe mit getparent, getchildren, getnext und allen anderen Methoden herumgespielt, die wahrscheinlich aussahen, nachdem ich dir(myKeys[0]) ausgeführt habe, aber ich komme nicht weiter.
Alle Vorschläge sind willkommen