Ich habe "AUTOMATISCHE TEXTZUSAMMENFASSUNG (linguistischer Ansatz)" als mein Abschlussprojekt. Ich habe genügend Forschungsarbeiten gesammelt und bin sie durchgegangen. Dennoch bin ich mir nicht ganz im Klaren darüber, wie ich vorgehen soll. Grundsätzlich habe ich "AUTOMATIC TEXT SUMMARIZER (statistical based)" gefunden und fand, dass es im Vergleich zu meinem Projekt viel einfacher ist. Mein Projektleiter sagte mir, ich solle mich nicht für dieses (statistische) Programm entscheiden, sondern für das linguistische Programm.
Jeder, der schon einmal an einem solchen Projekt gearbeitet oder auch nur davon gehört hat, weiß, dass das Zusammenfassen eines Dokuments nichts anderes bedeutet, als jeden Satz zu bewerten (mit einem Ansatz, der bestimmte Algorithmen beinhaltet) und dann Sätze auszuwählen, deren Punktzahl über dem Schwellenwert liegt. Der schwierigste Teil dieses Projekts ist nun die Auswahl des geeigneten Algorithmus für die Bewertung und die spätere Implementierung.
Ich verfüge über mäßige Programmierkenntnisse und würde gerne in JAVA programmieren (weil ich dort viele APIs zur Verfügung habe, die weniger Overhead verursachen). Nun möchte ich wissen, wie ich bei meinem Projekt vorgehen und welche Algorithmen ich verwenden sollte. Und wie man sie implementiert.
0 Stimmen
Diese Frage ist nicht zu beantworten. Nach welchen Kriterien wollen Sie die Sätze bewerten?
0 Stimmen
Da dies bei Google auftaucht, möchte ich auf dieses Projekt verweisen, das verschiedene Algorithmen zur Textzusammenfassung implementiert github.com/miso-belica/sumy