Ich hatte das Problem jetzt schon ein paar Mal, während ich an Projekten gearbeitet habe, und ich würde gerne wissen, ob es eine elegante Lösung gibt.
Problem Ich ziehe Tweets über XML von Twitter und lade sie in meine Datenbank hoch. Wenn ich sie jedoch auf dem Bildschirm ausgebe, erhalte ich diese Zeichen:
"moved to dusseldorf.â" ODER también
und wenn ich russische Zeichen habe, erhalte ich viele hässliche Kästchen an ihrer Stelle.
Was ich gerne hätte, ist, dass die korrekten nativen Akzente unter einer Kodierung angezeigt werden. Ich dachte, das sei mit UTF-8 möglich.
Was ich verwende
- PHP, MYSQL
Nachdem ich die XML-Datei eingelesen habe, bereinige ich die Daten wie folgt:
$data = trim($data);
$data = htmlentities($data);
$data = mysql_real_escape_string($data);
Meine Datenbank-Sortierung ist: utf8_general_ci
Die Zeichensatz der Webseite ist: charset=UTF-8
Ich glaube, es könnte etwas mit HTML-Entities zu tun haben, aber ich würde mich wirklich über eine Lösung freuen, die bei allen Projekten funktioniert.
Vielen Dank im Voraus.