Ich habe eine Unicode-Zeichenkette und weiß nicht, wie sie kodiert ist. Wenn diese Zeichenfolge von einem Perl-Programm gelesen wird, gibt es dann eine Standardkodierung, die Perl verwendet? Wenn ja, wie kann ich herausfinden, welche es ist?
Ich versuche, Nicht-ASCII-Zeichen aus der Eingabe loszuwerden. Ich fand dies auf einem Forum, das es tun wird:
my $line = encode('ascii', normalize('KD', $myutf), sub {$_[0] = ''});
Wie funktioniert das obige Verfahren, wenn keine Eingabekodierung angegeben ist? Sollte sie wie folgt angegeben werden?
my $line = encode('ascii', normalize('KD', decode($myutf, 'input-encoding'), sub {$_[0] = ''});