Ich versuche, eine einfache Textdatei zu verarbeiten. Es handelt sich im Wesentlichen um einen Index von Namen und zugehörigen Zahlenfeldern, die wie folgt formatiert sind:
Nowosielski, Matthäus, 484, 584, 777
Nowosielski, Matthäus, 1151
Nunes, Paulino, 116
Nussbaum, Mike, 1221, 444,
Nussbaum, Mike, 156
Diese möchte ich zu folgendem verarbeiten
Nowosielski, Matthäus, 484, 584, 777, 1151
Nunes, Paulino, 116
Nussbaum, Mike, 156, 444, 1221
Wie Sie sehen können, enden die Zeilen nicht einheitlich: einige sind wahrscheinlich Leerzeichen, einige Zeilenumbrüche und einige mit Kommas. Ich muss also Zeilen zusammenführen, die mit doppelten vollständigen Namen beginnen, wobei der redundante Namenseintrag beim Zusammenführen verworfen und die numerische Reihenfolge der numerischen Felder beibehalten wird.
Mein Bauchgefühl sagt mir, dass ich entweder schnell Perl oder awk lernen sollte, aber meine Kenntnisse sind für beides leer. Ich schaute in beide, und nach einigen suchen und Lesen nicht in der Lage gewesen, einen klaren oder sauberen Weg zu einer Lösung zu finden.
Meine Frage lautet daher: Was wäre das beste Werkzeug für diese Aufgabe, das ich effizient und gerade ausreichend erlernen könnte, um diese Aufgabe zu bewältigen? Gibt es angesichts des vorgeschlagenen Werkzeugs irgendwelche Vorschläge, wie ich das Problem angehen könnte?
Ich kann diese Datei natürlich auch von Hand bearbeiten, aber das ist nicht sehr interessant und scheint mir eine sehr dumme, ungeschickte Herangehensweise an das Problem zu sein. Ich nehme diese Aufgabe zum Anlass, etwas über Textverarbeitung zu lernen, da ich das Gefühl habe, dass es für dieses Problem wahrscheinlich ein gutes, vorhandenes Werkzeug gibt.
Haben Sie einen Tipp?