MNIST-Datensatz CSV - wie berechnet sich der Farbwert?



  • Hallo,
    weiß hier jemand wie sich der Farbwert für jedes Pixel im MNIST-Datensatz im CSV-Format berechnet?
    Weil ich bräuchte die Vorgehensweise um meine Daten genauso zu gestalten.
    Eigentlich müssten es für jedes Pixel ja drei Werte (RGB) oder vier Werte (RGBA) sein... wie kommt man dann auf einen?
    Vielen Dank für Eure Hilfe.
    Gruß



  • C++Developer2000 schrieb:

    Eigentlich müssten es für jedes Pixel ja drei Werte (RGB) oder vier Werte (RGBA) sein... wie kommt man dann auf einen?

    Grayscale?



  • Swordfish schrieb:

    Grayscale?

    Herzlichen Dank, daran habe ich gar nicht gedacht.
    Weißt du zufällig auch, ob der Hintergrund dieser MNIST-Datensatz Bilder transparent ist?
    Ich habe nämlich Bilder vorliegen und mein Ziel ist es sie in das gleiche Format zu konvertieren wie die Bilder des MNIST-Datensatzes im CSV-Format.
    Bislang habe ich den Hintergrund transparent gemacht und auf 28 x 28 Pixel skaliert (so groß sind auch die Bilder des MNIST-Datensatzes).
    Irgendwelche Tipps und Hinweise was man beachten muss?

    Danke.
    Gruß



  • C++Developer2000 schrieb:

    Weißt du zufällig auch, ob der Hintergrund dieser MNIST-Datensatz Bilder transparent ist?

    http://yann.lecun.com/exdb/mnist/ schrieb:

    Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).



  • Danke für deine Antwort.
    Ich hab versucht Bilder im Stile des MNIST-Datensatzes zu erstellen.
    Dafür, erzeuge ich in gimp einen 900×600 Pixel großen weißen Himtergrund und zeichne mit einem Bleistift in Gimp die Ziffer und speicher das Bild als Jpg.
    Das jpg les ich dann ein und skalier das Bild auf 28×28 Pixel und konvertier es sicherheitshalber noch in Graustufen.
    Das Bild speichere ich dann Pixelfarbwert für Pixelfarbwert in einer CSV-Datei.

    Jetzt ist mir aufgefallen, dass in meiner CSV-Datei ca. 90% aller Farbwerte weiß (255) sind.
    In der originalen MNIST-Datei ist der Anteil wesentlich geringer.
    Mache ich etwas falsch oder was kann ich noch ändern?
    Danke für jede Hilfe.
    VG



  • Hat sich erledigt.
    Liegt am Aufbau der MNIST Datenbank... dort sind weiße Ziffern auf schwarzem Grund enthalten.
    Dementsprechend muss man immer 255-Farbwert rechnen, bevor man seine Bilder weiterverarbeitet