Ich habe eine Reihe von Word-Dokumenten, die ich mit einem von mir geschriebenen PHP-Tool veröffentlichen möchte. Ich kopiere die Word-Dokumente und füge sie in ein Textfeld ein und speichere sie dann mit dem PHP-Programm in MySQL. Das Problem, das sich mir stellt, sind die vielen nicht standardisierten Zeichen, die Word-Dokumente enthalten, wie geschweifte Anführungszeichen und Ellipsen ("..."). Was ich im Moment tue, ist manuell suchen und ersetzen diese Art von Dingen (und auch fremde Symbole wie e-acute) mit entweder einfachem Text oder HTML-Entitäten (é ; etc.) Gibt es eine Funktion in PHP kann ich aufrufen, dass die Ausgabe eines Word-Dokument nehmen und konvertieren alles, was Entitäten in Entitäten sein sollte, und andere Symbole, die nicht richtig in Firefox in Symbole, die anzeigen.
Gracias.