Auslesen einer Datei bei Kompressionsverfahren. (Funktionsweise bzw. Logik)



  • Ich mich ein wenig mit der Datenkompression beschäftigt, allerdings bleibt mir eine Frage dennoch offen.

    Zuerst einmal stell ich mal folgendes fest und bitte korrigiert mich wenn ich falsch liege:

    - Komprimierte Dateien können ohne Dekompression nicht verwendet werden, da die Datei von dem jeweiligen Kompressionsverfahren kryptisch wurde.

    Wobei ich nicht sicher bin ob es genau etwas ausmacht ob es sich um eine Audio oder Textdatei handelt.

    Nehme ich eine .exe Datei öffne diese im Editor und kopiere sämtlichen Inhalt, füge ihn in ein weiteres Fenster ein und speichere ab, funktioniert dise nicht mehr.

    Meine Frage daher. Wie lesen Kompressionsprogramme die Daten überhaupt aus und schreiben sie neu damit sie funktionieren?

    LG

    Foggi



  • Eine Exe-Datei ist keine Textdatei, deshalb kommen da auch Binärkombinationen vor, die der Texteditor nicht als Buchstabe erkennen kann, diese "Buchstaben" gehen dann bei der Anzeige in einem Texteditor verloren (werden z.B. als Kästchen/fragezeichen angezeigt).
    Die Kompressionsprogramme arbeiten direkt auf Binärebene, und versuchen nicht erst, die Datei als ein Text zu interpretieren.



  • Foggi schrieb:

    Nehme ich eine .exe Datei öffne diese im Editor und kopiere sämtlichen Inhalt, füge ihn in ein weiteres Fenster ein und speichere ab, funktioniert dise nicht mehr.

    dann ist der editor aber kaputt oder von microsoft.



  • volkard schrieb:

    Foggi schrieb:

    Nehme ich eine .exe Datei öffne diese im Editor und kopiere sämtlichen Inhalt, füge ihn in ein weiteres Fenster ein und speichere ab, funktioniert dise nicht mehr.

    dann ist der editor aber kaputt oder von microsoft.

    Ach, und Editoren von Microsoft dürfen nicht kaputt sein, oder was? 🙄 😡



  • besche schrieb:

    Ach, und Editoren von Microsoft dürfen nicht kaputt sein, oder was? 🙄 😡

    klar.
    aber das sachgemäße verwerfen unbekannter zeichenfolgen, das von einigen billigen und quelloffenen editoren unterlassen wird, ist von microsoft gelieferter kostenloser mehrwert und kein fehler.



  • besche schrieb:

    Ach, und Editoren von Microsoft dürfen nicht kaputt sein, oder was?

    was heisst hier dürfen? sie sind kaputt.
    🙂



  • Foggi schrieb:

    - Komprimierte Dateien können ohne Dekompression nicht verwendet werden, da die Datei von dem jeweiligen Kompressionsverfahren kryptisch wurde.

    Kommt darauf an, was für Dateien es sind, wie sie komprimiert wurden und was du unter verwenden verstehst. Denn sowas http://www3.interscience.wiley.com/journal/110485315/abstract?CRETRY=1&SRETRY=0 geht sehr wohl.



  • Heinzelotto schrieb:

    Eine Exe-Datei ist keine Textdatei, deshalb kommen da auch Binärkombinationen vor, die der Texteditor nicht als Buchstabe erkennen kann, diese "Buchstaben" gehen dann bei der Anzeige in einem Texteditor verloren (werden z.B. als Kästchen/fragezeichen angezeigt).
    Die Kompressionsprogramme arbeiten direkt auf Binärebene, und versuchen nicht erst, die Datei als ein Text zu interpretieren.

    Das würde also bedeuten, dass bei der Kompression nur 1 en und 0 en gelesen und komprimiert werden.

    Ist eine im Hex-Editor geöffnete Datei beispielsweise die Umrechnung des Binärcodes?

    Danke für die bisherigen Infos und hoffentlich auch Kommenden.



  • Kompression funktioniert beispielsweise so:

    wenn eine Bitfolge, etwa 00101, besonders oft vorkommt, dann wird sie bei der Kompression durch eine kürzere ersetzt, etwa 01, und in einer Tabelle vermerkt, daß bei der Dekompression jedes 01 zu 00101aufgebläht werden muß.

    Im Beispiel würde die Datei 00101100101 zu 01101 komprimiert. Grob vereinfacht. In der Praxis muß man natürlich noch etliche Dinge beachten, schließlich soll sich die komprimierte Datei eindeutig wieder in die Originaldatei "auspacken" lassen usw. Dieses Thema heißt "Codierungstheorie".

    Eine ganz andere Sache sind komprimierte Bild- und Tondateien. Diese Kompressionsverfahren sind oftmals nicht verlustfrei, d.h. die Daten werden reduziert (z.B. unhörbare Tonfrequenzen ausgefiltert oder graphische Details in Bildern verwischt), und können nicht unbedingt in der selben Qualität wiederhergestellt werden (z.B. weil die ausgefilterten Ton- oder Bildfrequenzen jetzt fehlen).



  • volkard schrieb:

    Foggi schrieb:

    Nehme ich eine .exe Datei öffne diese im Editor und kopiere sämtlichen Inhalt, füge ihn in ein weiteres Fenster ein und speichere ab, funktioniert dise nicht mehr.

    dann ist der editor aber kaputt oder von microsoft.

    wieso kapudd? bei einer exe ist die wahrscheinlichkeit recht hoch, das zeichen einen integerwert > 255 haben, dann haut der editor nen unicode-bom an den anfang.



  • also en wert zwischen -32768 - 32767(bzw. 0 - ca 65000) naja daran hatt ich noch net gedacht.


Anmelden zum Antworten