Ich verwende Solr und das Solr:Cell Plugin, um Rich-Text-Dokumente und Metadaten zu indizieren und zu durchsuchen.
DEFINITION: solr_document = tuple(rich_text_document, metadata1, metadata2)
Ich möchte einige solr_documents neu indizieren, wenn sich die Metadaten ändern, aber nur die Teile im solr_document, die sich geändert haben, nicht die gesamte solr_documnt, weil das Parsen und Extrahieren von Text aus Rich-Text-Dokumenten rechenintensiv und sinnlos ist, da das Rich-Text-Dokument nicht geändert wurde.
Unterstützt Solr partielle Aktualisierungen des Dokumentenindex?
Ergänzend dazu:
Ich verwende Solr über Sonnenfleck in einer Rails-Anwendung. Einer der Hauptentwickler von Sunspot sagt aquí das:
Solr unterstützt nicht das Konzept der Teilaktualisierungen - unter der Haube besteht die Aktualisierung eines Dokuments eigentlich die Aktualisierung eines Dokuments darin, es aus dem Index zu entfernen und dann wieder hinzuzufügen. So, Sunspot muss also jedes Mal, wenn sich etwas ändert, das gesamte Dokument neu aufbauen. Das ist eine unglückliche Einschränkung aus Sicht der Leistung, aber es ist ziemlich grundlegend für die Art und Weise, wie Solr und Lucene funktionieren.
Gibt es irgendetwas, das man tun kann, vielleicht erlaubt Solr:Cell etwas?