Ich habe mehr als 5000 Webseiten und möchte die Titel aller dieser Seiten. In meinem Projekt verwende ich den BeautifulSoup html-Parser wie folgt.
soup = BeautifulSoup(open(url).read())
soup('title')[0].string
Aber es braucht viel Zeit. Nur für den Titel einer Webseite lese ich die gesamte Datei und baue den Parse-Baum auf (ich dachte, dies ist der Grund für die Verzögerung, korrigieren Sie mich, wenn ich falsch liege).
Gibt es in jedem anderen einfachen Weg, dies in Python zu tun.