2 Stimmen

Gewöhnliche Wörter entfernen, aber auf Nachfrage einen verständlichen Inhalt zurückgeben?

Ich habe mich gefragt, ob man einen eingereichten Text wie den folgenden irgendwie (vielleicht mit einem Algorithmus) zusammenfassen kann (indem man die allgemeinen Wörter entfernt)

Die Farben Scharlach und Blau zieren seit mehr als hundert Jahren das Trikot des Vereins. und der Verein ist weithin als "Blaugrana" bekannt, in Anlehnung an in Anlehnung an die Namen dieser Farben in der katalanischen Sprache.

sondern auf Nachfrage die gespeicherten Daten zu nutzen und einen verständlichen Inhalt zurückzugeben. Vielleicht nicht dasselbe, aber etwas, das Sie leicht verstehen.

Wird dabei künstliche Intelligenz zum Einsatz kommen? Welche Methoden gibt es heute, die dies ermöglichen?

Update (um die Dinge zu klären): Ich möchte wissen, wie ein Computer Schlüsselwörter verbinden kann, um einen verständlichen Inhalt zu liefern. Zum Beispiel "Scarlet, blue, club, shirt" zurückgegeben werden wie "Scarlet and blue are the club shirt"

0voto

amit kumar Punkte 19732

Das Schlüsselwort ist "Text Summarization".

Update : Aufgrund Ihres Updates habe ich meine Antwort erweitert. Sie können Ihre Dokumente in einer Textsuchmaschine wie Lucene/Elasticsearch speichern und Ihre Schlüsselwörter abfragen (z. B. "Scharlachrot, Blau, Club, Hemd"), um die passenden Dokumente zu finden. Das ist nicht gerade der "umgekehrte Weg", aber Sie können auf den zurückgegebenen Ergebnissen der Abfrage zusätzliche bereichsspezifische Analysen aufbauen.

0voto

Dani Punkte 28963

Es sieht so aus, als bräuchten Sie eine Komprimierung und keine intelligente Wortentfernung und Wiederherstellung. Versuchen Sie dies:

function compress($text)
{
    return base64_encode(gzencode($text));
}
function decompress($text)
{
    return gzdecode(base64_decode($text));
}

0voto

ffriend Punkte 26062

Es gibt 2 verschiedene Aufgaben:

  1. Auszug wichtige Informationen.
  2. Erzeugen Sie sinnvoller Inhalt.

Um beides zu erreichen, müssen Sie eine sinnvolle Textdarstellung zwischen (1) und (2) verwenden. Die beste Option, die ich mir vorstellen kann, ist die Verwendung von Ontologien. Zuerst extrahiert man Fakten aus freiem Text und legt sie in einer Ontologie ab, dann generiert man Text aus dieser Ontologie. Etwa so este . Auf jeden Fall müssen Sie Folgendes extrahieren Fakten pas Schlüsselwörter .

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X