Ich arbeite an einem Wissensdatenbank-Projekt mit SQL Server 2008 Volltextsuchmaschine. Das Projekt besteht aus Artikeln und Dateien, wobei jeder Artikel mehrere Dateien hat und der gesamte Inhalt in diesen Artikeln reines Html .
Im Moment habe ich erfolgreich Volltextkatalog und Index auf SQL Server 2008 erstellt und meine Datenbank ist mit Version 10 kompatibel.
Hier sind meine Fragen:
1) Ist es möglich, html-Tags zu ignorieren, genauer gesagt Texte, die "<...>" enthalten, während der Suche in diesen Artikeln, denn wenn ich nach div, table usw. suchen möchte, sollte kein Ergebnis zurückgegeben werden?
2) Artikel werden jederzeit aktualisiert, daher muss der Volltextindex aktualisiert werden, wenn ein neuer Datensatz eingefügt wird. Ist es ausreichend, bei der Erstellung des Volltextkatalogs nur "TRACK CHANGES AUTOMATIC" einzustellen?
3) Wir können im Folgenden die FILESTREAM-Funktion verwenden. Hat SQL Server 2008 eine gute Leistung bei Dateien, die einen Volltextindex verwenden? Welche spezifischen Dokumenttypen kann SQL Server 2008 gut indizieren?
Mit freundlichen Grüßen
0 Stimmen
Hallo Freund, ich denke, die beste Lösung ist, html mit regex "<(.|)" zu ersetzen. \n )*?>" mit einer sql clr Baugruppe überprüfen Sie diesen Link justgeeks.blogspot.com/2008/08/