4 Stimmen

Was ist die Codierung des mit IFilter abgerufenen Texts?

Ich habe mich gefragt, wie der Text durch die Verwendung von IFilter kodiert wird.

IFilter::GetText() ruft WCHAR* ab, aber was passiert, wenn die Datei mit ASCII kodiert ist? Was ist mit anderen Unicode-Kodierungen (wie z. B. UTF-8 oder UTF-16)?

Meines Erachtens kümmert sich entweder der IFilter darum, den extrahierten Text in eine einzige Kodierung zu konvertieren (falls dies der Fall ist - welche Kodierung ist das dann?), und wenn nicht, wie weiß ich, welche Kodierung es ist?

2voto

Remy Lebeau Punkte 498719

Der Ausgabetext ist UTF-16 (alles in Windows, was WCHAR verwendet, ist UTF-16). Es gibt keine Möglichkeit, die Codierung der Eingabedaten abzufragen, Du müsstest diese Daten selbst analysieren, wenn nötig.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X