Ich habe festgestellt, dass Tesseract OCR für ein Open-Source-Projekt ziemlich solide ist. Ich habe herausgefunden, dass es sogar einfache Captchas lesen und decodieren kann, wie zum Beispiel bei Megaupload. Ich denke, mit ein wenig Feinabstimmung könnte dies ziemlich gut funktionieren.
Der einzige Nachteil ist, dass es nur unkomprimierte TIFF-Bilder akzeptiert, was lästig sein kann.
BEARBEITEN: Philip Daubmeier hat bereits eine .NET-Integration gefunden, aber unten steht der Code zum Konvertieren eines Bitmaps in unkomprimiertes TIFF.
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
Dies speichert in einer Datei, aber die Bitmap.Save Methode kann auch in einen Stream schreiben.