Werfen Sie zunächst einen Blick auf diese Anleitung .
Mit solr benötigen Sie eine xml (oder csv ) Dokument, das an Solr übertragen wird (dieser Prozess wird als Aktualisierung bezeichnet; die Indizierung ist der Prozess, bei dem Felder für die Suche verfügbar gemacht werden). Das Format von xml ist z.B.:
<add>
<doc>
<field name="id">9885A004</field>
<field name="name">Canon PowerShot SD500</field>
<field name="category">camera</field>
<field name="features">3x optical zoom</field>
<field name="features">aluminum case</field>
<field name="weight">6.4</field>
<field name="price">329.95</field>
</doc>
</add>
Siehe aquí für weitere Einzelheiten.
Aber in Ihrem Fall könnten Sie einen Crawler verwenden (geeignet, wenn verschiedene oder externe Quellen), um verschiedene Dokumentenformate zu erkennen. Versuchen Sie zu verstehen, ob Niederländisch könnte hier helfen.
Schauen Sie sich z.B. an diese Präsentation für eine Erklärung zu Solr, Lucene und Nutch.