Ich habe eine CSV-Datei, deren erste Zeile die Namen der Variablen und die restlichen Zeilen die Daten enthalten. Wie kann ich sie in Dateien aufteilen, die jeweils nur eine Variable in R enthalten? Wird diese Lösung stabil sein? Was ist z. B., wenn die Eingabedatei 100 GB groß ist?
Die Eingabedateien sehen wie folgt aus
var1,var2,var3
1,2,hello
2,5,yay
...
Ich möchte 3 (oder beliebig viele Variablen) Dateien var1.csv, var2.csv, var3.csv erstellen so dass die Dateien wie folgt aussehen Datei1
var1
1
2
...
Datei2
var2?
2
5
...
Datei3
var3
hello
yay
Ich habe eine Lösung in Python ( Wie kann man eine große CSV-Datei in einzelne Dateien aufteilen? ), aber ich frage mich, ob R dasselbe tun kann? Im Wesentlichen liest der Python-Code die csv-Datei Zeile für Zeile und schreibt dann die Zeilen einzeln aus. Kann R das Gleiche tun? Der Befehl read.csv liest die gesamte Datei auf einmal, und das kann den gesamten Prozess verlangsamen. Außerdem kann eine 100-Gramm-Datei nicht gelesen und verarbeitet werden, da R versucht, die gesamte Datei in den Speicher zu lesen. Ich kann keinen Befehl in R finden, mit dem man eine csv-Datei Zeile für Zeile lesen kann. Bitte helfen Sie mir. Danke!!!