Frage zu Text-Recognition in Image



  • Hallo Leute,

    war mir nicht sicher in welches Forum ich das schreiben soll. Grafikprogrammierung schien mir dann passend.

    Versuche gerade aus dem Bild einer Anzeigetafel den Text (eigentlich nur die Zahlen) per Computer Vision Algorithmen zu erkennen.
    Ich benutzte OpenCV für die meisten Sachen.

    Ein paar Ideen hätte ich schon, möchte aber mal durch die runde Fragen welche Ansätze ihr da probieren würdet.
    Vielleicht könnte mir jemand ein paar verschiedene Ideen/Ansätze nennen, die ich dann weiter verfolgen könnte.

    Damit man sich vorstellen kann was ich meine, habe ich ein Bild angehängt. (das Netz ist dabei schon auch störend)

    http://s1.directupload.net/file/d/3260/rwgifcz5_png.htm

    lg und danke im voraus für ein paar Tipps
    Darian

    P.S.: Ich würde das ganze mit Template-Matching Techniken probieren, bin mir da aber noch nicht so ganz sicher.



  • Kannst du irgendwelche Invarianten garantieren?
    Position/Distanz? Beleuchtung? Kannst du die Kamera derart platzieren, dass das Netz nicht im Weg ist?

    Bei OCR nimmt man ganz gerne Neuronale Netze aufgrund ihrer Robustheit. Wenn es dir aber wirklich nur um die Zahlen geht, würde ich es zunächst mit stochastischen Maßzahlen in Kombination mit Kanten-/Merkmalsverfahren versuchen.

    Wenn du den Anwendungszweck etwas näher beschreibst, könnte man sich da was überlegen.


  • Mod

    such dir pro element der zahlen einen pixel raus, pruef ob der schwartz oder rot ist, dazu pro zahl eine tabelle mit pattern, also welche pixel an/aus welche zahl sind und fertig bist du.



  • Einzelne Pixel? Halte ich aufgrund von Kamerarauschen und eventuell leichten Positionsdifferenzen für ungenau.

    Möglicher Ansatz mit OpenCV:
    - Mit Kamera 3-5 Bilder hintereinander aufnehmen und davon einen geglätteten Durchschnitt bilden (Rauschunterdrückung)

    - Rotkanal extrahieren (Graustufen musst du explizit subtrahieren, da in jedem Kanal enthalten!)

    - Schwellwert bilden

    - Liniensegmente analysieren



  • LOLAlter schrieb:

    Einzelne Pixel? Halte ich aufgrund von Kamerarauschen und eventuell leichten Positionsdifferenzen für ungenau.

    Welches Rauschen, welche Positionsdifferenzen? Zuviel Vorstellungskraft?

    Möglicher Ansatz mit OpenCV:
    - Mit Kamera 3-5 Bilder hintereinander aufnehmen und davon einen geglätteten Durchschnitt bilden (Rauschunterdrückung)

    - Rotkanal extrahieren (Graustufen musst du explizit subtrahieren, da in jedem Kanal enthalten!)

    - Schwellwert bilden

    - Liniensegmente analysieren

    Overengineered 👎



  • LOLDigga schrieb:

    LOLAlter schrieb:

    Einzelne Pixel? Halte ich aufgrund von Kamerarauschen und eventuell leichten Positionsdifferenzen für ungenau.

    Welches Rauschen, welche Positionsdifferenzen? Zuviel Vorstellungskraft?

    Das Netz kann im Weg sein und den einen Pixel überdecken.
    Pro Segment N Pixel und dann Mehrheitsentscheid sollte robuster sein.

    Außerdem ist noch garnicht geklärt, ob die Kamera fest installiert ist. Daran habe ich irgendwie Zweifel, wer lässt schon eine Kamera in der Halle wenn gerade kein Spiel ist? Und dann sind ganz andere Verfahren als simples Pixelzählen gefragt.



  • asdyxcqwe schrieb:

    LOLDigga schrieb:

    LOLAlter schrieb:

    Einzelne Pixel? Halte ich aufgrund von Kamerarauschen und eventuell leichten Positionsdifferenzen für ungenau.

    Welches Rauschen, welche Positionsdifferenzen? Zuviel Vorstellungskraft?

    Das Netz kann im Weg sein und den einen Pixel überdecken.
    Pro Segment N Pixel und dann Mehrheitsentscheid sollte robuster sein.

    Robuster bei deinem Imaginären Fall?

    asdyxcqwe schrieb:

    Außerdem ist noch garnicht geklärt, ob ...

    Genau! Wir wissen NICHTS. Was soll der Unsinn irgendwelche Optimierungen vorzuschlagen die Probleme lösen, die man sich gerade im Kopf ersponnen hat.

    asdyxcqwe schrieb:

    ... wer lässt schon eine Kamera in der Halle wenn gerade kein Spiel ist?..

    Wer zum T... filmt eine Spieltafel um dann darauf Zahlen erkennen zu lassen, hallo?

    Und dann sind ganz andere Verfahren als simples Pixelzählen gefragt.

    Und wenn der Strom ausfällt muss du vermutlich einen Schimpansen abrichten der das auch dann noch gut hinbekommt. 🙄


Log in to reply