Kann mir jemand sagen, was ist ein gutes Framework oder API, die mehrere Text-Erkennung auf ein Bild ermöglicht. Idealerweise möchte ich die Texte Standorte (Koordinaten) auf dem Bild. Ich habe für eine Weile suchen, aber ohne Erfolg.
感謝
Kann mir jemand sagen, was ist ein gutes Framework oder API, die mehrere Text-Erkennung auf ein Bild ermöglicht. Idealerweise möchte ich die Texte Standorte (Koordinaten) auf dem Bild. Ich habe für eine Weile suchen, aber ohne Erfolg.
感謝
Das scheint ein bisschen schwierig zu sein, es sei denn, man kann das Problem ein wenig vereinfachen. Ist der Text nun handschriftlich oder gedruckt? Und ist er nach vorne gerichtet (parallel zur Bildebene). Am einfachsten wäre es, eine OCR- oder Zeichenerkennungsanwendung zu verwenden (mit perspektivischer Verzerrung, wenn der Text nicht parallel zur Bildebene liegt) und einen Score zu erstellen, der mit Schwellenwerten versehen werden kann. Bei vielen Zeichen würde sich die Genauigkeit erhöhen. Aber es könnte ziemlich rechenintensiv sein, es sei denn, man hat eine ungefähre "Skalierung" der Zeichen, weil man nach Skalierung, Position und perspektivischer Verzerrung sucht, was ein riesiger Suchraum sein kann.
CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.