Utf-8-Code-Fehler tritt normalerweise auf, wenn der Bereich der numerischen Werte 0 bis 127 überschreitet.
der Grund für diese Ausnahme ist:
1) Wenn der Codepunkt < 128 ist, entspricht jedes Byte dem Wert des Codepunkts. 2)Wenn der Codepunkt 128 oder größer ist, kann die Unicode-Zeichenkette nicht in dieser Kodierung dargestellt werden. (Python löst in diesem Fall eine UnicodeEncodeError-Ausnahme aus.)
Um dieses Problem zu lösen, gibt es eine Reihe von Kodierungen, die am weitesten verbreitete ist "Latin-1, auch bekannt als ISO-8859-1".
Die ISO-8859-1-Unicode-Punkte 0-255 sind identisch mit den Latin-1-Werten, so dass bei der Konvertierung in diese Kodierung einfach die Codepunkte in Byte-Werte umgewandelt werden müssen; wenn ein Codepunkt größer als 255 auftritt, kann die Zeichenfolge nicht in Latin-1 kodiert werden.
Wenn diese Ausnahme beim Laden eines Datensatzes auftritt, versuchen Sie, dieses Format zu verwenden
df=pd.read_csv("top50.csv",encoding='ISO-8859-1')
Fügen Sie am Ende der Syntax ein Kodierungsverfahren hinzu, das dann das Laden des Datensatzes akzeptiert.