Grafikformat (unkomprimiert) für OCR
-
Hallo,
ich würde gerne mit Hilfe von Programmen systematisch Bilder vergleichen und das Ganze evtl. dann bis zu OCR ausbauen. Hauptsächlich um selbst dabei zu lernen.
Die meistgenutzten Grafikformate sind komprimiert, daher stelle ich mir OCR und ähnliches damit erstmal recht schwierig vor. Kann mir jemand sagen, wie OCR Software dabei vorgeht? Werden die Formate zunächst umgewandelt, oder finden wirklich Vergleiche an komprimierten Bildern statt?
In der englischen Wikipedia habe ich gelesen, dass zB TIFF gerne für OCR genutzt wird. Ich nehme an, das hängt damit zusammen, das TIFF unkomprimiert genutzt werden kann (korrigiert mich, wenn nicht). Habe mir dazu mal die Dokumentation von TIFF angesehen und es scheint mir, wenn man einige Features wie Komprimierung außen vor lässt, einigermaßen überschaubar.
Ist TIFF für solche Zwecke geeignet, oder welches Format würdet ihr nutzen?
-
willst du zwei dateien binaer vergleichen oder pixel von bildern? ich glaube wenn du dir das beantwortest, beantwortest du dir die frage
"Werden die Formate zunächst umgewandelt, oder finden wirklich Vergleiche an komprimierten Bildern statt?"
-
default user schrieb:
Hallo,
Die meistgenutzten Grafikformate sind komprimiert, daher stelle ich mir OCR und ähnliches damit erstmal recht schwierig vor. Kann mir jemand sagen, wie OCR Software dabei vorgeht? Werden die Formate zunächst umgewandelt, oder finden wirklich Vergleiche an komprimierten Bildern statt?Die Bilddateien werden eingelesen und "geparsed", wobei ein unkomprimiertes "Bild" im Speicher entsteht. (=eine "Bitmap", etwas wo die Pixel einfach als zweidimensionales Array von Bytes/Words/Dwords/... vorliegen)
Dieses "Bild" wird dann vermutlich noch durch einige Filter gejagt, und dann erst bekommt es der eigentliche OCR-Mechanismus gefüttert.
OCR auf komprimierten Bilddaten zu machen wäre IMO total Banane. Jemand mit Hand zu absoluten Aussagen könnte auch sagen: es geht einfach nicht.
In der englischen Wikipedia habe ich gelesen, dass zB TIFF gerne für OCR genutzt wird.
Wenn dem so ist, dann bloss weil es sich - warum auch immer - eingebürgert hat.
Ich nehme an, das hängt damit zusammen, das TIFF unkomprimiert genutzt werden kann (korrigiert mich, wenn nicht).
Fühle dich hiermit korrigiert
Habe mir dazu mal die Dokumentation von TIFF angesehen und es scheint mir, wenn man einige Features wie Komprimierung außen vor lässt, einigermaßen überschaubar.
Ist TIFF für solche Zwecke geeignet, oder welches Format würdet ihr nutzen?
Ich würde eine Library ala FreeImage verwenden, bzw. unter Windows auch einfach GDI+, mit der man verschiedenste Dateiformate lesen kann.
-
hustbaer schrieb:
In der englischen Wikipedia habe ich gelesen, dass zB TIFF gerne für OCR genutzt wird.
Wenn dem so ist, dann bloss weil es sich - warum auch immer - eingebürgert hat.
OCR will man ja meistens auf monochrom gescannten Text anwenden.
TIFF verwendet (unter anderem) CCITT was genau diese Art von Daten effektiv komprimieren kann und zB fuer Fax eingesetzt wird.
Darum sind die meisten OCR-Loesung in der Lage, (neben anderen Formaten) TIFF zu verarbeiten.