Fragen zu Windows Bitmap einlesen #2

Belli

So hab ich das nicht gemeint.
Wenn ich eine bmp-Datei auf einem Big-Endian - System habe, und die auf ein Little-Endian - System kopiere, dann könnte ich mir vorstellen, dass die Programme auf dem Little-Endian - System einige Dinge falsch interpretieren.

Wenn ich die Datei nur auf Systemen mit gleicher Endianess (zB nur auf Windows, nur auf Linux, usw.) verwende, brauche ich mich nicht darum zu kümmern, was sie für eine Endianess hat.

Das ist doch nur interessant, wenn ich damit rechnen muss, dass sie von einem anderen System kommt, als das, auf welchem mein Programm läuft.

Und da stelle ich mir halt die Frage, ob Bilddarstellungsprogramme dann nicht vor genau den gleichen Problemen stehen ...

Edit:
Schließlich kann ich einem Integerwert nicht ansehen, ob er Bigendian oder Littleendian codiert ist ...

Quatsch.

Das Format definiert, ob die Daten LE oder BE gespeichert werden! Wenn die Formatdefinition mit der der Maschine, die das Bild liest, übereinstimmt, muss nichts getan werden. Stimmt das nicht überein, muss konvertiert werden.

BMP ist immer LE kodiert. Das heißt, wenn dein Programm nur auf LE-Maschinen läuft, musst du dir keine Gedanken um Endianess machen.

Techel

Beim Bitmap-Format ist laut Specs alles Kleinenderisch.

hustbaer

Wurde ja schon geschrieben, aber trotzdem nochmal...

Belli schrieb:

Edit:
Schließlich kann ich einem Integerwert nicht ansehen, ob er Bigendian oder Littleendian codiert ist ...

Dem Integer nicht, nein. Du hast aber nen Kontext, und zwar weisst du dass der Integer aus nem .BMP File kommt. Und .BMP ist eben immer 2s complement little endian. Egal auf welcher Hardware. Wenn die Hardware was anderes verwendet, dann muss sie beim Lesen bzw. Schreiben von BMP Files eben "umrechnen".

Damit eben genau das nicht passiert was du schreibst, nämlich dass man ein BMP File von System X auf System Y nicht aufmachen kann wenn X und Y sich nicht über 1s/2s complement bzw. Endianness einig sind. Was ja total kacke wäre. Weswegen es nicht so ist.

Belli

Na umso besser.
Dann würde ich mich der Einfachheit halber (zumindest im ersten Wurf) um die Endianess nicht kümmern - ich unterstelle einfach mal, dass das Programm für einen x86(kompatiblen) geschrieben wird.

SeppJ

Belli schrieb:

Na umso besser.
Dann würde ich mich der Einfachheit halber (zumindest im ersten Wurf) um die Endianess nicht kümmern - ich unterstelle einfach mal, dass das Programm für einen x86(kompatiblen) geschrieben wird.

Sooooo exotisch ist BigEndian nun auch wieder nicht. Eigentlich fast so ziemlich alles, was einen nennenswerten Marktanteil außer dem x86 hat.

hustbaer

ARM kann beides.
Und da x86 halt so stark ist, fahren Android und Windows den ARM auch mit little endian. (iOS vermutlich auch, hab's nicht nachrecherchiert.)

Aber ja, es gibt sie noch die grossen Endianer

zeropage

Danke für die ganzen Beiträge

Muss der Threadersteller erst wieder alle durcharbeiten.

zeropage

Puh, also wieder ne große Pause ...

Danke nochmals für die Beiträge und den Beispielcode von hustbaer (den ich einfach ganz frech kopiert habe ;)). Da im Artikel steht

BMP verwendet die Little-Endian-Konvention.

dachte ich mir, darum muss ich mich nicht kümmern.

Jetzt habe ich aber das "Problem", das es gar keine negativen Werte gibt, auch bei dem Bild, wo ich vorher von ausgegangen bin. Vielleicht habe ich aber beim Schreiben des Code auch gepfuscht? Vielleicht habe ich auch was falsch verstanden?

Oder kann mir jemand ein Beispiel für einen Beispielvector in der Form des bmp_data -vector mit negativen Werten geben, um dies zu überprüfen?

struct Head //Kopf
{
    static const auto Size = 4;
    std::array <std::pair <std::string, int>, Size> bType
    {
        {
            { "bfType", 1 }, //uint16_t
            { "bfSize", 2 }, //uint32_t
            { "bfReserved", 2 }, //uint32_t
            { "bfOffbits", 2 } //uint32_t
        }
    };
    std::vector <int> data;

} head;

struct Info //Eigenschaften
{
    static const auto Size = 11;
    std::array <std::pair <std::string, int>, Size> bType
    {
        {
            { "biSize", 2 }, //uint32_t
            { "biWidth", 3 }, //int32_t
            { "biHeight", 3 }, //int32_t
            { "biPlanes", 1 }, //uint16_t
            { "biBitCount", 1 }, //uint16_t
            { "biCompression", 2 }, //uint32_t
            { "biSizeImage", 2 }, //uint32_t
            { "biXPelsPerMeter", 3 }, //int32_t
            { "biYPelsPerMeter", 3 }, //int32_t
            { "biClrUsed", 2 }, //uint32_t
            { "biClrImportant", 2 } //uint32_t
        }
    };
    std::vector <int> data;

} info;

/*
struct ColTable //Farbtabelle
{
    bool is_ = true; //existiert Farbtabelle
    std::vector <std::tuple <uint8_t, uint8_t, uint8_t, uint8_t>> tblEntry;

} colTable;
*/

void read_bmpData (std::string file_, std::vector <unsigned char> &bmp_data)
{
    std::string file_name = file_ + ".bmp";
    char s_char;
    std::ifstream file (file_name.c_str(), std::ios::binary);
    if (!file)
    {
        std::string err_str = "!Fehler bei " + file_name;
        //throw err_str;
        std::cout << err_str; //wird noch behandelt      
    }
    while (file.get(s_char)) bmp_data.push_back(s_char);
    std::cout << "_File: " << file_name << '\n' << '\n';
}

uint16_t make_uint16 (std::vector <unsigned char> bmp_data, std::size_t pos)
{
    uint16_t u_val = bmp_data.at(pos + 0)
                    + (static_cast <uint16_t> (bmp_data.at(pos + 1)) << 8);

    return u_val;
}

uint32_t make_uint32 (std::vector <unsigned char> bmp_data, std::size_t pos)
{
    uint32_t u_val = bmp_data.at(pos + 0)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 1)) << 8)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 2)) << 16)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 3)) << 24);

    return u_val;
}

int32_t make_int32 (std::vector <unsigned char> bmp_data, std::size_t pos)
{
    uint32_t u_val = bmp_data.at(pos + 0)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 1)) << 8)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 2)) << 16)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 3)) << 24);

    int32_t s_val;
    if ((u_val >> 31) & 1)
    {
        s_val = - static_cast <int32_t> (~u_val) - 1;
    }
    else
    {
        s_val = u_val;
    }

    return s_val;
}

int main()
{

    //std::string file_ = "test_me";
    std::string file_ = "WOLKEN";
    //std::string file_ = "046";
    //std::string file_ = "Cubis";

    std::vector <unsigned char> bmp_data;
    read_bmpData (file_, bmp_data);

    std::size_t offset = 0;
    uint16_t data_u16;
    uint32_t data_u32;
    int32_t data_32;

    for (auto i=0; i<head.Size; i++)
    {
        switch (head.bType.at(i).second)
        {
        case 1:
            data_u16 = make_uint16 (bmp_data, offset);
            head.data.push_back(data_u16);
            offset += 2;
            break;
        case 2:
            data_u32 = make_uint32 (bmp_data, offset);
            head.data.push_back(data_u32);
            offset += 4;
            break;
        case 3:
            data_32 = make_int32 (bmp_data, offset);
            head.data.push_back(data_32);
            offset += 4;
            break;
        }
    }

    for (auto i=0; i<info.Size; i++)
    {
        switch (info.bType.at(i).second)
        {
        case 1:
            data_u16 = make_uint16 (bmp_data, offset);
            info.data.push_back(data_u16);
            offset += 2;
            break;
        case 2:
            data_u32 = make_uint32 (bmp_data, offset);
            info.data.push_back(data_u32);
            offset += 4;
            break;
        case 3:
            data_32 = make_int32 (bmp_data, offset);
            info.data.push_back(data_32);
            offset += 4;
            break;
        }
    }

    for (std::size_t i=0; i<head.Size; i++)
        std::cout << head.bType.at(i).first << ":  " << head.data.at(i) << '\n';
    std::cout << '\n';
    for (std::size_t i=0; i<info.Size; i++)
        std::cout << info.bType.at(i).first << ":  " << info.data.at(i) << '\n';

}

edit: einige Korrekturen im Code

hustbaer

lemon03 schrieb:

...

    int32_t s_val;
    if ((u_val >> 31) & 1)
    {
        s_val = -u_val;           // <--------------------
    }
    else
    {
        s_val = u_val;
    }
...

Hast du in die markierte Zeile mal nen Breakpoint gemacht?
Und: Wieso hast du den Code in genau dieser Zeile geändert? Das hat schon nen Grund dass ich das so geschrieben habe wie ich es eben geschrieben habe.

zeropage

Einen Breakpoint nicht (ich kann leider noch nicht in CodeBlocks den Debugger benutzen, weil ich mich noch nicht ganz mit ERROR: You need to specify a debugger program in the debuggers's settings. auseinander gesetzt habe), aber ich habe eine cout-Ausgabe dort eingeführt, ob diese Wahl überhaupt getroffen wurde. Sie wurde nie aufgerufen.

Die Zeilen habe ich geändert, weil ich davon ausgegangen bin, das die dortige Abfrage if ((u_val >> 31) & 1) nur zur Entscheidung negativ oder positiv dient. Die weitere Verarbeitung wäre dann nur für eventuell andere Systeme. Dachte ich jedenfalls.

Ich werd das mal korrigieren.

EDIT: Aber auch umgeschrieben, scheint es keine negativen Werte zu geben

uint32_t u_val = bmp_data.at(pos + 0)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 1)) << 8)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 2)) << 16)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 3)) << 24);

    int32_t s_val;
    if ((u_val >> 31) & 1)
    {
        s_val = - static_cast <int32_t> (~u_val) - 1;
    }
    else
    {
        s_val = u_val;
    }

    return s_val;

Aber vielleicht ist das ja korrekt? Ich bräuchte zum Testen ein Beispiel, wo ganz bestimmt negative Werte enthalten sind?

zeropage

EDIT: Korrektur ist im oberen Beitrag.

hustbaer

OK wenn das cout nie anschlägt dann wird es wohl keine negativen Werte gegeben haben in deinen Bitmaps.

lemon03 schrieb:

Aber vielleicht ist das ja korrekt? Ich bräuchte zum Testen ein Beispiel, wo ganz bestimmt negative Werte enthalten sind?

Ja korrekt ist es schon. Es gibt halt top-down und bottom-up BMPs. Standard ist bottom-up und bei denen ist die Höhe positiv.
D.h. du musst dir irgendwoher top-down BMPs zum Testen besorgen.

zeropage

Jo danke dann

Und gute Idee, mal schauen ob man nach top-down BMPs goglen kannn, bzw was findet.

zeropage

Super, hatte mehrere top-down Beispiele gefunden und bei allen wurde der korrekte Wert negativ angezeigt. Danke nochmals.

hustbaer

Na super

Nochwas...
Ich würde folgende Änderungen vorschlagen:

int32_t make_int32 (std::vector <unsigned char> bmp_data, std::size_t pos)
{
    uint32_t u_val = bmp_data.at(pos + 0)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 1)) << 8)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 2)) << 16)
                    + (static_cast <uint32_t> (bmp_data.at(pos + 3)) << 24);

    int32_t s_val;
    if ((u_val >> 31) & 1)
    {
        s_val = - static_cast <int32_t> (~u_val) - 1;
    }
    else
    {
        s_val = u_val;
    }

    return s_val;
}

// =>

int32_t better_make_int32 (std::vector <unsigned char> const& /* 1 */ bmp_data, std::size_t pos)
{
    uint32_t const /* 2 */ u_val = /* 3 */ make_uint32(bmp_data, pos);

    if ((u_val >> 31) & 1)
    {
        return - static_cast <int32_t> (~u_val) - 1; /* 4 */
    }
    else
    {
        return u_val;                                /* 4 */
    }
}

1: Du solltest nicht den ganzen std::vector kopieren. Das ist sogar im günstigsten Fall (wenig Daten) schon viel langsamer als nötig (dynamische Speicheranforderung!). Und wenn mal viel Daten drinnen wird's richtig langsam.

2: Lokale Variablen const machen wenn man sie (einfach, ohne grosse Umwege) const machen kann. Damit man gleich sieht dass der Wert der Variable sich nach der Initialisierung nie mehr ändert.

3: Code-Duplizierung vermeiden.

4: Mutable-State vermeiden, uninitialisierte Variablen vermeiden.
Uninitialisierte Variablen vermeiden allerdings nur, wenn man ihnen gleich bei der Initialisierung einen sinnvollen Wert geben kann. Wenn wirklich nur die Wahl besteht zwischen "uninitialisiert" oder "mit Dummy-Wert initialisiert", dann eher uninitialisiert. Meist kann man aber gleich mit dem passenden Wert initialisieren.

Einige dieser Dinge (z.B. (1)) betreffen auch andere Funktionen, dort natürlich ebenso nachziehen.

Und wie bei allen Richtlinien gibt es natürlich Ausnahmen. Viel Aufwand zu betreiben um eine dieser Regeln zu befolgen ist nicht immer sinnvoll.

----

Und ich würde vorschlagen die Leerzeichen vor öffnenden Klammern und nach schliessenden Klammern weg zu lassen. Ausnahme: zwischen Keywords und runde Klammer kommt ein Leerzeichen
Also z.B.

int x = MeineFunktion(param); // nach MeineFunktion nicht
for (int i = 0; i < x; i++)   // nach for schon
{
    if (static_cast<int32_t>(i * i) < x)  // nach if auch, nach static_cast aber nicht

usw.

Das, also wo bei Klammern Leerzeichen gesetzt werden, ist nämlich eine der wenigen Regeln wo sich die meisten Programmierer einig sind. Zumindest ist das mein Eindruck anhand des Codes den ich so sehe.

EDIT: Copy/Paste/Edit Fehler korrigiert.

hustbaer

Und wenn wir schon dabei sind, gleich nochmal weiter:

int32_t int32_from_uint32(uint32_t u_val)
{
    if ((u_val >> 31) & 1)
        return -static_cast<int32_t>(~u_val) - 1;
    else
        return u_val;
}

int32_t make_int32(std::vector <unsigned char> const& bmp_data, std::size_t pos)
{
    return int32_from_uint32(make_uint32(bmp_data, pos));
}

EDIT: Copy/Paste/Edit Fehler korrigiert.

Gleichheitszeichen zwischen return und der Variablen finde ich wiederum merkwürdig - mein Compiler auch...

zeropage

war bestimmt nur ein Tippfehler ...

Ok, danke für die Hinweise. Wenn ich richtig verstanden habe, müssten die drei Funktionen dann so aussehen?:

uint16_t make_uint16(std::vector <unsigned char> const &bmp_data, std::size_t pos)
{
    uint16_t const u_val = bmp_data.at(pos + 0)
                    + (static_cast<uint16_t>(bmp_data.at(pos + 1)) << 8);

    return u_val;
}

uint32_t make_uint32(std::vector <unsigned char> const &bmp_data, std::size_t pos)
{
    uint32_t const u_val = bmp_data.at(pos + 0)
                    + (static_cast<uint32_t>(bmp_data.at(pos + 1)) << 8)
                    + (static_cast<uint32_t>(bmp_data.at(pos + 2)) << 16)
                    + (static_cast<uint32_t>(bmp_data.at(pos + 3)) << 24);

    return u_val;
}

int32_t make_int32(std::vector <unsigned char> const &bmp_data, std::size_t pos)
{
    uint32_t const u_val = make_uint32 (bmp_data, pos);

    if ((u_val >> 31) & 1)
    {
        return -static_cast<int32_t>(~u_val) - 1;
    }
    else
    {
        return u_val;
    }
}

Nur das doppelt ausschreiben in Deinem letzten Beitrag habe ich nicht ganz verstanden?

---

Ich hoffe, das wird jetzt nicht zuviel, aber ich hätte noch ein anderes Anliegen. Und zwar bin ich mit meiner switch-Lösung nicht ganz zufrieden. Ich würde lieber einen Funktionszeiger nehmen, bekomme das aber nicht hin.

Vorgestellt habe ich mir, das hier der second-Wert das Argument für den Zeiger sein soll. Welcher Typ das sein muss, ist mir unklar.

struct Head //Kopf
{
    static const auto Size = 4;
    std::array <std::pair <std::string, int>, Size> bType
    {
        {
            { "bfType", 1 }, //uint16_t
            { "bfSize", 2 }, //uint32_t
            { "bfReserved", 2 },
            { "bfOffbits", 2 }
        }
    };
    std::array <int, Size> data;

} head;

//int (*make_data)(std::vector <unsigned char>, std::size_t);

Unklar ist mir auch, wie eine Funktion mit diesem Argument dann aufgerufen wird. Ich hatte bisher nur einmal mit Funktionszeigern zu tun, mir fehlt die Übung und ich kann den ersten Einsatz nicht für diesen Fall nachvollziehen.

hustbaer

wob schrieb:

Gleichheitszeichen zwischen return und der Variablen finde ich wiederum merkwürdig - mein Compiler auch...

Danke, hab's korrigiert.