HTML-Quelle von WebElement in Selenium WebDriver mit Python abrufen

Question

HTML-Quelle von WebElement in Selenium WebDriver mit Python abrufen

Gefragt el 31 de August, 2011: Wann wurde die Frage gestellt
628298 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich verwende die Python-Bindungen zum Ausführen von Selenium WebDriver:

from selenium import webdriver
wd = webdriver.Firefox()

Ich weiß, dass ich ein Webelement wie folgt greifen kann:

elem = wd.find_element_by_css_selector('#my-id')

Und ich weiß, dass ich die volle Seitenquelle mit...

wd.page_source

Aber gibt es eine Möglichkeit, die "Elementquelle" zu erhalten?

elem.source   # <-- returns the HTML as a string

Die Selenium WebDriver-Dokumentation für Python ist im Grunde genommen nicht vorhanden, und ich sehe im Code nichts, was diese Funktionalität zu ermöglichen scheint.

Wie kann man am besten auf den HTML-Code eines Elements (und seiner Kinder) zugreifen?

Gefragt el 31 de August, 2011 von Chris W.

12 Stimmen

Sie könnten auch einfach alle wd.page_source mit beautifulsoup

Kommentiert el 1 de Marsch, 2013 von eLRuLL

0 Stimmen

Selen hat mehr Möglichkeiten als eine schöne Suppe.

Kommentiert el 19 de Kann, 2021 von Hamed Baziyad

Answer 1

5 Antworten

Answer 2

2voto

Rusty Punkte 3390

Die von mir bevorzugte Methode, um das gerenderte HTML zu erhalten, ist die folgende:

driver.get("http://www.google.com")
body_html = driver.find_element_by_xpath("/html/body")
print body_html.text

Die obige Methode entfernt jedoch alle Tags (ja, auch die verschachtelten Tags) und gibt nur den Textinhalt zurück. Wenn Sie auch die HTML-Auszeichnung erhalten möchten, verwenden Sie die folgende Methode.

print body_html.getAttribute("innerHTML")

Beantwortet el 4 de Februar, 2018 von Rusty (3390 Punkte )

Answer 3

2voto

Jitendra Pisal Punkte 91

Für mich funktioniert das reibungslos.

element.get_attribute('innerHTML')

Beantwortet el 22 de September, 2019 von Jitendra Pisal (91 Punkte )

Answer 4

0voto

wowandy Punkte 908

Unter PHP Selenium WebDriver können Sie die Quelle der Seite wie folgt erhalten:

$html = $driver->getPageSource();

Oder holen Sie sich den HTML-Code des Elements wie folgt:

// innerHTML if you need HTML of the element content
$html = $element->getDomProperty('outerHTML');

Beantwortet el 22 de Dezember, 2021 von wowandy (908 Punkte )

Answer 5

0voto

christian Punkte 162

In den aktuellen Versionen von php-web-treiber (1.12.0+) können Sie verwenden

$element->getDomProperty('innerHTML');

wie in dieser Ausgabe dargelegt: https://github.com/php-webdriver/php-webdriver/issues/929

Beantwortet el 25 de Oktober, 2021 von christian (162 Punkte )

Answer 6

0voto

user2849367 Punkte 58

Verwenden Sie execute_script get html

bs4(BeautifulSoup) kann auch schnell auf html-Tags zugreifen.

from bs4 import BeautifulSoup
html = adriver.execute_script("return document.documentElement.outerHTML")
bs4_onepage_object=BeautifulSoup(html,"html.parser")
bs4_div_object=bs4_onepage_object.find_all("atag",class_="attribute")

Beantwortet el 11 de September, 2021 von user2849367 (58 Punkte )

HTML-Quelle von WebElement in Selenium WebDriver mit Python abrufen

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

HTML-Quelle von WebElement in Selenium WebDriver mit Python abrufen

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: