Ich habe eine Menge Java-Quellcodedateien. Ich muss ein Python-Skript schreiben, das die Quelldateien durchläuft und alle Zeichenfolgenliterale sowie ihren Speicherort identifiziert.
Das Problem ist, dass die Zeichenfolgen in verschiedenen Formen vorliegen könnten, wie zum Beispiel:
- Zeichenfolgenliteral - "Hallo Welt"
- Kombination von Literalen - "Hallo" + "Welt"
Ich habe ein paar Ideen gefunden, um dies zu erreichen:
- Gehe zeilenweise durch die Quelldateien und suche nach " und verwende dies, um den Speicherort einer Zeichenfolge zu identifizieren
- Verwende einen regulären Ausdruck
Haben Sie Kommentare zu den von mir vorgeschlagenen Methoden oder einer anderen Methode, an die ich nicht gedacht habe?
Falls Sie sich fragen, wir führen eine Internationalisierung in unserem Codebasis durch. Deshalb versuche ich, diesen Prozess zu automatisieren.