Gibt es eine gute Möglichkeit, HTML aus einem Java-String zu entfernen? Eine einfache Regex wie
replaceAll("\\<.*?>", "")
wird funktionieren, aber einige Dinge wie &
wird nicht korrekt konvertiert und Nicht-HTML zwischen den beiden spitzen Klammern wird entfernt (d.h. die .*?
in der Regex wird verschwinden).