Ich habe die 'Nutch-Suchmaschine' zum Durchsuchen von Websites eingerichtet. Jetzt muss ich eine PHP-API schreiben, um mit der Nutch-Suchmaschine zu kommunizieren. Ich muss 2 Dinge tun:
-
mit Hilfe eines PHP-Skripts muss ich Nutch mitteilen, welche URLs gecrawlt werden sollen (dafür habe ich einige Hinweise von http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Fall07/sheetal/?Deliverable2.html
-
Mit einem PHP-Skript muss ich die Crawl-Ergebnisse aus der Nutch-Crawl-DB abrufen. Ich scheine keine Hilfe dazu zu finden (oder ich bin vielleicht zu dumm, um die Antwort zu sehen, wenn sie schon da ist :()
Wenn jemand eine PHP-API zum Lesen von Nutch-Crawl-Ergebnissen verwendet hat, bitte ich um Hinweise.
Ich warte verzweifelt auf Hilfe.