Ignorieren Sie, welcher Zeichensatz Ihr Computer und Server verwendet, das ist egal. Wichtig ist der Zeichensatz der gegebenen HTTP-Anfrage/-Antwort. Wenn Sie eine Ressource anfordern und der Server den Zeichensatz "B" zurückgibt, wird Ihr Browser versuchen, die Antwort mit dem Zeichensatz "B" zu analysieren. Die meisten Browser sind in der Lage, viele verschiedene Zeichensätze zu analysieren, unabhängig von den aktuellen Spracheinstellungen des Computers. Wenn Ihr Browser den angegebenen Zeichensatz nicht kennt (was ein seltener Fall wäre, mein IE hat 34 Zeichensätze und mein Firefox hat 74), ist das speziell nicht definiert. Er könnte raten oder einen Fehler ausgeben, es liegt am Browser zu entscheiden.
Viele (oder vielleicht die meisten) Zeichensätze basieren teilweise auf ASCII
und ordnen daher die ersten 127 Zeichen auf die gleiche Weise zu. Selbst der doppelbyte ISO/IEC 2022
tut dies. Alle HTML-Tags basieren auf dem ASCII
-Satz, so dass der Browser in diesen Fällen möglicherweise die Codierung erraten könnte (manche nehmen vielleicht ISO-8859-1`EBCDIC` ordnen jedoch nicht zu `ASCII`. In einigen Versionen wird das `EBCDIC` `<`-Symbol auf das ASCII-`L`-Symbol abgebildet, so dass die HTML-Darstellung vollständig versagen würde und die Rohbytes (wahrscheinlich als ISO-8859-1 analysiert) stattdessen angezeigt würden.
``
Also, wenn Ihr Browser auf ein SHIFT_JIS
-Dokument trifft, aber nicht weiß, wie er die Bytes analysieren soll, wird er wahrscheinlich versuchen, es mit ISO-8859-1
zu analysieren. Da die ersten 127 Zeichen in SHIFT_JIS
größtenteils mit ISO-8859-1
übereinstimmen, sollte das gesamte HTML problemlos gerendert werden. Der Text wird jedoch wahrscheinlich ein "unbekanntes" Zeichen des Browsers verwenden, das manchmal ein Fragezeichen oder eine Art von Kästchenzeichen ist. Wenn dieses Dokument ein Formular enthält und Sie darin zu tippen beginnen, werden die Tasten auf Ihrer Tastatur dem entsprechen, was der Browser vermutet, nämlich wahrscheinlich wieder ISO-8859-1
. Wenn Sie auf Absenden klicken, werden diese Zeichen als der "geratene" Zeichensatz codiert und so an den Server gesendet.
``