Ich baue eine Datenbank zur Speicherung meiner eBook-Sammlung.
In den meisten Fällen ist die ISBN im Text des Buches selbst enthalten.
Wie kann ich auf diese Inhalte zugreifen?
Gibt es einen Quellcode oder DLLs für diese Aufgabe?
Antworten
Zu viele Anzeigen?Ich habe es für die eBook Library App gemacht. Zuerst müssen Sie den Text aus einer chm- oder pdf-Datei extrahieren. Es gibt eine Menge von Dienstprogrammen \libraries um es zu tun. Hier ist ein Artikel auf CodeProject, wie man Inhalte aus CHM-Dateien extrahiert. Für PDF-Dateien habe ich pdftotext Nutzen. Wenn Sie reinen Text vom eBook erhalten, parsen Sie ihn mit regulärer Ausdruck um den ISBN10/13-Code zu finden.
Darin Dimitrov
Punkte
990883
Extrahieren des Textes aus CHM y PDF Dateien ist der erste Schritt. Als nächstes können Sie die ISBN-Nummer mit einem regulärer Ausdruck .