Pandas read_csv: low_memory und dtype Optionen

Question

Pandas read_csv: low_memory und dtype Optionen

Gefragt el 16 de Juni, 2014: Wann wurde die Frage gestellt
737630 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

df = pd.read_csv('somefile.csv')

...gibt einen Fehler:

.../site-packages/pandas/io/parsers.py:1130: DtypeWarning: Spalten (4,5,7,16) haben gemischte Typen. Geben Sie die dtype-Option beim Import an oder setzen Sie low_memory=False.

Warum steht die dtype-Option in Verbindung mit low_memory, und warum könnte low_memory=False helfen?

Gefragt el 16 de Juni, 2014 von Josh

Answer 1

3 Antworten

Answer 2

2voto

Dr Nigel Punkte 29

Ich hatte ein ähnliches Problem mit einer ~400MB Datei. Das Setzen von low_memory=False hat den Trick für mich getan. Mach zuerst die einfachen Dinge, ich würde überprüfen, dass dein Datenrahmen nicht größer ist als dein Systemspeicher, starte neu, lösche den RAM bevor du fortfährst. Wenn du immer noch auf Fehler stößt, lohnt es sich sicherzustellen, dass deine .csv Datei in Ordnung ist, wirf einen schnellen Blick in Excel und stelle sicher, dass es keine offensichtliche Korruption gibt. Beschädigte Originaldaten können Verwüstung anrichten...

Beantwortet el 28 de Marsch, 2018 von Dr Nigel (29 Punkte )

Answer 3

2voto

Iain Hunter Punkte 3275

Unter Bezugnahme auf die Antwort von Jerald Achaibar können wir die gemischte Typpenwarnung erkennen und nur den langsameren Python-Engine verwenden, wenn die Warnung auftritt:

import warnings

# Erzwingen Sie, dass die gemischte Datentypwarnung zu einem Python-Fehler wird, damit wir sie abfangen und den Ladevorgang mit dem langsameren Python-Engine erneut versuchen können
warnings.simplefilter('error', pandas.errors.DtypeWarning)
try:
    df = pandas.read_csv(path, sep=sep, encoding=encoding)
except pandas.errors.DtypeWarning:
    df = pandas.read_csv(path, sep=sep, encoding=encoding, engine="python")

Beantwortet el 26 de August, 2022 von Iain Hunter (3275 Punkte )

Answer 4

1voto

Samuel Calado Punkte 11

Dies hat für mich funktioniert!

dashboard_df = pd.read_csv(p_file, sep=';', error_bad_lines=False, index_col=False, dtype='unicode')

Beantwortet el 17 de November, 2022 von Samuel Calado (11 Punkte )

Pandas read_csv: low_memory und dtype Optionen

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Pandas read_csv: low_memory und dtype Optionen

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: