ASCII-Code in lesbaren Text konvertieren?
-
Hallo Zusammen,
ich habe hier eine Fahrplan-CDROM, die auf Fahrplan-Daten zugreift. Diese Daten liegen in verschiedenen Verzeichnissen.
Wenn ich eine dieser Dateien öffne, wird ASCII Code angezeigt. Ein Beispiel:
0000 0000: 80 00 04 00 00 00 E9 42 61 4B CB A8 00 00 66 0B hn und Vogtlandb
0000 0010: 61 68 6E 20 47 6D 62 48 00 44 50 4E 00 41 52 52 ahn GmbH DPN ARR
...Ich möchte diese Daten lesen. Meine Frage ist nun, gibt es eine Möglichkeit, diesen Code in lesbaren Text zu konvertieren?
Grüße,
Ingo
-
wenn du das dateiformat rausfindest, kannst du das machen.
-
Wie finde ich denn das Dateiformat raus?
-
reverse engineering, googlen, hersteller fragen usw.
-
Öffne doch in einen Texteditor, oder sind da nicht lesbare Zeichen enthalten?
-
Sehe ich das richtig, dass du eine Textdatei mit einem Hex-Editor geöffnet hast? Öffne sie einfach mit einem Texteditor!
-
Ich habe ein Viewer genutzt, wo ich zwischen HEX und TEXT umschalten kann. Wenn ich HEX einstelle, sehe ich was oben beispielhaft gezeigt wurde. Wenn ich auf TEXT umstelle, sehe ich unstrukturierten, unlesebaren Inhalt, bestehend aus Zeichen aller Art. Manche Zeilen sind leer, in manchen Zeilen steht nur ein Zeichen, in machen hunderte... Insgesamt nicht lesbar...
HM?
-
Folgende Ansätze zur Erkennung des Dateiformats:
- Die Dateiendung gibt traditionell einen Hinweis auf das Format
- Das Unix-Tool 'file' kann allerlei Dateiformate erkennenSofern du das Dateiformat nicht kennst, musst du den Text von Hand extrahieren (Oder ein sehr auswändiges Programm mit einer Worterkennung benutzen). Lade die Datei in einen Texteditor mit Zeilenumbruch und such die Stellen mit den gewünschten Texten.
Falls es sich bei den Formatierungszeichen die den Rest der Datei ausmachen ausschließlich um Zeichen handelt, die keine Buchstaben darstellen, dann kann man sich auch ganz fix einen einfachen Filter schreiben (oder du kannst jemanden hier im Forum danach fragen, ist ein Einzeiler), der dir nur die Buchstaben aus der Datei ausgibt.
-
So wie's aussieht, gibt es auch auch viele nicht-darstellbare Zeichen da. Die kannst du natürlich nicht darstellen (die heißen nicht umsonst non-printable characters). Ohne das Dateiformat zu kennen, wirst du das nie hinkriegen (außer du machst reverse engineering wie andere schon gesagt haben).