Bildverarbeitung: Invariante Merkmale/Features bei Perspektivischer Projektion



  • Thema Bildverarbeitung. Schon wieder. 😉

    Gegeben sind Blobs (schwarze Objekte vor weißen Hintergrund) nach einer Reihe von Filtern und Bildverarbeitungsalgorithmen.
    Für diese Blobs werden Merkmale berechnet. Position, Fläche, Umfang, Schwerpunkt, Momente, etc.

    Außerdem die Hu-Momente (http://www.informatik.uni-osnabrueck.de/sstiene/masterthesis/node52.html). Die haben den Vorteil invariant unter Rotation, Translation und Skalierung zu sein. ( 👍 😮 )
    Damit ergeben sich schon viele nützliche "Features" für den Klassifikator. Zum Beispiel können damit sehr gut Texte erkannt werden. Unabhängig von der Drehung oder Entfernung. Hauptsache die Ausrichtung der Kamera verläuft in Richtung der Normalen gegenüber der mit Text bedruckten Oberfläche (Buchseite).

    Ich frage mich aber wie man Merkmale für perspektivisch verzerrte Objekte berechnen könnte. Also wenn das Eingabebild des Objekts nicht frontal dazu sondern unter einem größeren Winkel aufgenommen wurde. Das Buch von der schräge aufnehmen.

    Vermutlich existiert kein Moment oder Merkmal das Invariant gegenüber Drehungen in die perspektivische Tiefe ist.

    Das Bild vor der Merkmalextraktion zu entzerren (gegenrotieren) scheint möglich, aber nur wenn die Drehwinkel bekannt sind.

    Aber wie könnte man allgemein vorgehen? Bei unbekannten Drehwinkeln?

    Anderes Beispiel: Nummernschilder von Autos. Aus Bildern eines Autos, die frontal aufgenommen wurden, lässt sich das Nummernschild wahrscheinlich relativ zuverlässig extrahieren. Wenn die Kamera aber links oder rechts von der Fahrbahn oder sogar auf einer Brücke steht, stelle ich mir eine robuste (d.h. nicht an diesen Sonderfall angepasste) Extraktion schwer vor. (Nur ein Beispiel, daran arbeite ich nicht)

    Gruß,
    das mü



  • Hi, ein Ansatz wäre einen Algorithmus auf Bildsequenzen zu trainieren, mit dem Ziel gegen die im Sequenzmaterial vorhandenen Transformationen invariante Features zu erzeugen. Die Slow-Feature-Analysis macht sowas zum Beispiel.

    Autokennzeichen sind wiederum einfach, weil es nur eine geringe Anzahl möglicher Zeichen gibt, die wiederum auf Erkennbarkeit optimiert sind.



  • otze schrieb:

    Die Slow-Feature-Analysis macht sowas zum Beispiel.

    Kannst Du das ein wenig erläutern?



  • otze schrieb:

    Autokennzeichen sind wiederum einfach, weil es nur eine geringe Anzahl möglicher Zeichen gibt, die wiederum auf Erkennbarkeit optimiert sind.

    Ja sie sind einfach. Aber nur bei idealen Fotos ohne perspektivische Verzerrung.


Anmelden zum Antworten