11 Stimmen

NLP-Programmierungstools mit PHP?

Seit es große Webanwendungen gibt, ist die Suche nach Daten (und zwar blitzschnell und präzise) eines der wichtigsten Probleme bei Webanwendungen. Eine Zeit lang habe ich mit Lucene.NET die eine C#-Portierung des Lucene-Projekt .

Ich arbeite auch mit PHP unter Verwendung von Lucene-API von Zend Framework Das bringt mich zu meiner Frage. Meistens müssen wir für eine gute Indizierung einige NLP-Tools verwenden wie Tokenisierung , Lemmatisierung und viele mehr, ist die Frage:

Kennen Sie ein gutes NLP-Programmier-Framework/-Toolset mit PHP?

PS: Ich bin mir der Zend-API für Lucene sehr bewusst, aber um Daten richtig zu indizieren, reicht es nicht aus, sie in Lucene zu speichern und sich darauf zu verlassen, man muss einige zusätzliche Aufgaben durchführen, wie die oben genannten.

7voto

Paige Cook Punkte 22179

Ich würde vorschlagen, dass Sie sich Folgendes ansehen Solr die eine Best-Practice-Implementierung von Lucene ist. Solr verwendet eine REST-basierte API, die auch eine sehr gute PHP-Kunde . Damit können Sie die Leistung von Lucene nutzen, ohne die Low-Level-Programmierung durchführen zu müssen, um die gewünschte NLP-Leistung zu erhalten. Außerdem sollten Sie die Stammversion von Solr verwenden, da die NLP-Entwicklung derzeit sehr aktiv ist und jeden Tag neue Funktionen hinzugefügt werden.

4voto

Xodarap Punkte 11311

Zend hat eine vollständige Portierung von Lucene nach PHP. Siehe Docs aquí .

0voto

Osvaldo Mercado Punkte 960

Scheint, als ob Sie nach dem gleichen Zeug suchen, das ich vor ein paar Monaten gegoogelt habe :D... Ich betreibe ein php/zend basiertes Projekt mit Solr (via php-solr-client lib), und bis jetzt habe ich nichts in php für fortgeschrittenes NLP gefunden. Für grundlegende Dinge, wie jeder erwähnt, kann man mit Solr auskommen (Stemming, Tag Clouds / Phrase Tag Clouds, Tokenizing, etc), und es gibt ein paar grundlegende, aber nützliche Textverarbeitung php Bibliotheken da draußen (nichts Ausgefallenes wirklich, besser auf Solr selbst verlassen) ... aber wenn Sie für mehr algorithmische / semantische / Sentiment NLP-Analyse suchen, schlage ich vor, Sie bewegen sich ein wenig von PHP und bekommen in Java, da es mehr Bibliotheken, die Ihnen in diesem Bereich (wie OpenNLP) helfen können. Falls Sie nach fortgeschrittenem Material suchen, sollten Sie sich Mahout ansehen:

http://www.lucidimagination.com/blog/2010/03/16/integrating-apache-mahout-with-apache-lucene-and-solr-part-i-of-3/

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X