705 Stimmen

Python Pandas Fehler beim Tokenisieren von Daten

Ich versuche, pandas zu verwenden, um eine .csv-Datei zu manipulieren, aber ich erhalte diesen Fehler:

pandas.parser.CParserError: Fehler beim Tokenisieren der Daten. C Fehler: Erwartet 2 Felder in Zeile 3, aber 12 gesehen

Ich habe versucht, die pandas-Dokumentation zu lesen, aber nichts gefunden.

Mein Code ist einfach:

path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)

Wie kann ich das lösen? Sollte ich das csv-Modul oder eine andere Sprache verwenden?

Die Datei stammt von Morningstar

0voto

rahul ranjan Punkte 9

Sie können diesen Schritt ausführen, um das Problem zu vermeiden -

train = pd.read_csv('/home/Project/output.csv' , header=None)

einfach hinzufügen - header=None

Hoffe, das hilft!!

0voto

Victor Burnett Punkte 558

Ich hatte von einem Kollegen eine .csv erhalten und als ich versuchte, die csv mit pd.read_csv() zu lesen, erhielt ich einen ähnlichen Fehler. Offenbar versuchte es, die erste Zeile zu verwenden, um die Spalten für das DataFrame zu generieren, aber es gab viele Zeilen, die mehr Spalten enthielten, als die erste Zeile vermuten ließe. Ich habe das Problem schließlich behoben, indem ich die Datei einfach geöffnet und erneut als .csv gespeichert habe und pd.read_csv() erneut verwendet habe.

0voto

jvvw Punkte 506

Ich hatte einen ähnlichen Fehler und das Problem war, dass ich einige escaped quotes in meiner csv-Datei hatte und den escapechar-Parameter entsprechend setzen musste.

-1voto

THE2ndMOUSE Punkte 52

Versuche es: pandas.read_csv(path, sep = ',' ,header=None)

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X