EDIT: Der Link sollte jetzt funktionieren, entschuldigen Sie die Störung
Ich habe eine Textdatei, die wie folgt aussieht:
Name, Test 1, Test 2, Test 3, Test 4, Test 5
Bob, 86, 83, 86, 80, 23
Alice, 38, 90, 100, 53, 32
Jill, 49, 53, 63, 43, 23.
Ich schreibe ein Programm, das aus dieser Textdatei eine Pearsonsche Korrelationskoeffiziententabelle erstellt, die wie folgt aussieht, wobei der Eintrag (x,y) die Korrelation zwischen Person x und Person y darstellt:
Name,Bob,Alice,Jill
Bob, 1, 0.567088412588577, 0.899798494392584
Alice, 0.567088412588577, 1, 0.812425393004088
Jill, 0.899798494392584, 0.812425393004088, 1
Mein Programm funktioniert, aber der Datensatz, mit dem ich es füttere, hat 82 Spalten und, was noch wichtiger ist, 54000 Zeilen. Wenn ich mein Programm jetzt ausführe, ist es unglaublich langsam und ich erhalte eine Fehlermeldung wegen Speichermangels. Gibt es eine Möglichkeit, wie ich zunächst einmal die Möglichkeit eines Fehlers wegen Speichermangels beseitigen und das Programm vielleicht ein wenig effizienter machen kann? Der Code ist hier: Code .
Vielen Dank für Ihre Hilfe,
Jack
Edit: Für den Fall, dass jemand anderes versucht, Berechnungen in großem Maßstab durchzuführen, konvertieren Sie Ihre Daten in das hdf5-Format. So habe ich dieses Problem schließlich gelöst.