Ich schreibe eine Anwendung, die den Titel einer HTML-Seite, einen Text unter dem Body-Tag und ein Bild ausgibt. Es ist so etwas wie der Share-Kram von Facebook. Ich kann einen regulären Ausdruck erhalten, der das tut. Vielen Dank für Ihre Hilfe.
Antworten
Zu viele Anzeigen?Sie sollten wahrscheinlich einen HTML-Parser anstelle eines regulären Ausdrucks verwenden. Siehe Einfaches HTML-DOM zum Beispiel.
Ein regulärer Ausdruck für Ihre Aufgabe ist sehr schwer zu pflegen und bricht bei jeder Änderung der betreffenden Seiten leicht zusammen, ganz zu schweigen davon, dass Sie HTML-Kommentare nicht berücksichtigen können.
Ich habe gerade diesen Ausdruck geprägt, der den Text innerhalb der Tags (den Knotenwert) abruft, ohne die eigentlichen Tags selbst.
(?<=\"\>)(.*?)(?=\<\/)
Sie können es hier in Aktion mit PHP sehen: http://codepad.viper-7.com/AUTcv3