bestes Archiv-Format ?
-
den source-code des Entpackers im Klartext mit auf das Medium zu bringen, ist eine gute Idee.
Vorausgesetzt, ich habe dann auch einen Compiler, der heutige sources anstandslos compiliert. Wenn ich da in die Vergangenheit blicke (K&R vs Ansi usw.), bin ich mir da aber nicht ganz sicher.
Einen passenden compiler mitzugeben, um den Entpacker zu bauen, bringt leider auch nicht viel mehr Zukunftssicherheit, denn als executable entsteht das Problem der Binärkompatibilität, als source wiederum entsteht die Frage nach einem Compiler, der den Compiler compiliert.
Schwierig.
-
In 10 Jahren müssen sowieso alle Datenträger mit Quelltexten drauf vernichtet werden, weil sie irgendwelche Softwarepatente verletzen. Also was solls.
-
Ich würde mir weniger um den Komprimieralgorithmus sorgen machen, als um das Format der eigentlichen Daten und über den Datenträger. Bis man sich sorgen machen muss, ob noch jemand bz2 kennt, werden die wenigsten Medien noch auslesbar sein.
-
u_ser-l schrieb:
den source-code des Entpackers im Klartext mit auf das Medium zu bringen, ist eine gute Idee.
Vorausgesetzt, ich habe dann auch einen Compiler, der heutige sources anstandslos compiliert. Wenn ich da in die Vergangenheit blicke (K&R vs Ansi usw.), bin ich mir da aber nicht ganz sicher.
Einen passenden compiler mitzugeben, um den Entpacker zu bauen, bringt leider auch nicht viel mehr Zukunftssicherheit, denn als executable entsteht das Problem der Binärkompatibilität, als source wiederum entsteht die Frage nach einem Compiler, der den Compiler compiliert.
Schwierig.
du machst dir ja schon um alles sorgen
also, dann besorg dir ein externes cd laufwerk, nen Eee PC oder sonst was handliches, lad ein minimales linux mit gzip, unrar und anderen spässen drauf und lager das teil mit den cds zusammen. entpacken kannst dus dann auf jedenfall
ob du die daten noch lesen kannst? ..hm vielleicht solltest du die ascii tabelle noch mit packen
-
noch n gnu fan schrieb:
u_ser-l schrieb:
den source-code des Entpackers im Klartext mit auf das Medium zu bringen, ist eine gute Idee.
Vorausgesetzt, ich habe dann auch einen Compiler, der heutige sources anstandslos compiliert. Wenn ich da in die Vergangenheit blicke (K&R vs Ansi usw.), bin ich mir da aber nicht ganz sicher.
Einen passenden compiler mitzugeben, um den Entpacker zu bauen, bringt leider auch nicht viel mehr Zukunftssicherheit, denn als executable entsteht das Problem der Binärkompatibilität, als source wiederum entsteht die Frage nach einem Compiler, der den Compiler compiliert.
Schwierig.
du machst dir ja schon um alles sorgen
also, dann besorg dir ein externes cd laufwerk, nen Eee PC oder sonst was handliches, lad ein minimales linux mit gzip, unrar und anderen spässen drauf und lager das teil mit den cds zusammen. entpacken kannst dus dann auf jedenfall
ob du die daten noch lesen kannst? ..hm vielleicht solltest du die ascii tabelle noch mit packenWenn die Steckdosen sich ändern werden? Braucht man noch ein Kraftwerk
-
rüdiger schrieb:
Ich würde mir weniger um den Komprimieralgorithmus sorgen machen, als um das Format der eigentlichen Daten und über den Datenträger.
hab' ich schon - ich archiviere ausschließlich in "no-nonsense" Formaten, die mir ausreichend zukunftssicher scheinen: 7-bit-ascii, utf-8, jpg, dvi, ...
Daß iso 9660 Formate mit den diversen Erweiterungen für lange Filenamen usw. von CD-Rs in 10 Jahren noch lesbar sind, setze ich mal voraus - wenn es ausstirbt, muß man wohl rechtzeitig umkopieren.
-
aber noch etwas:
ein gutes Argument pro Kompression ist ja, daß man damit nur eine einzige Datei auf die CD-R speichern muß und damit diverse Erweiterungen des iso 9660 Formats nicht beansprucht.
Speichert man unkomprimiert tiefe Verzeichnisbäume mit langen Dateinamen, in denen am Ende noch Sonderzeichen auftauchen, auf CD-Rs, ist man ja in gewisser Weise davon abhängig, daß ein CD-Leser in x Jahren die diversen Erweiterungen von iso 9660 für Dateinamen und Schachtelungstiefe auch noch kennt,und ob man sich *darauf* mehr verlassen kann als auf .gz ?
-
u-ser_l schrieb:
Daß iso 9660 Formate mit den diversen Erweiterungen für lange Filenamen usw. von CD-Rs in 10 Jahren noch lesbar sind, setze ich mal voraus -
Möp.
"Unlike pressed original CDs, burned CDs have a relatively short life span of between two to five years, depending on the quality of the CD,"
http://www.pcworld.com/article/124312/do_burned_cds_have_a_short_life_span.html
-
wie schon weiter oben erwähnt, habe ich neulich einen Stapel CD-Rs umkopiert. Diese Datenträger waren teils bis zu 8 Jahre alt, 2001 mit 2x beschrieben, und ließen sich auf Anhieb fehlerfrei lesen - einige no-name Rohlinge von der Supermarktkasse waren auch darunter.
-
u_ser-l schrieb:
aber noch etwas:
ein gutes Argument pro Kompression ist ja, daß man damit nur eine einzige Datei auf die CD-R speichern muß und damit diverse Erweiterungen des iso 9660 Formats nicht beansprucht.
Speichert man unkomprimiert tiefe Verzeichnisbäume mit langen Dateinamen, in denen am Ende noch Sonderzeichen auftauchen, auf CD-Rs, ist man ja in gewisser Weise davon abhängig, daß ein CD-Leser in x Jahren die diversen Erweiterungen von iso 9660 für Dateinamen und Schachtelungstiefe auch noch kennt,und ob man sich *darauf* mehr verlassen kann als auf .gz ?
Da reicht aber auch einfach ein .tar Archiv, dass alles zu einer Datei zusammenfasst und nicht komprimiert. Kompression und sichere Archivierung sind total gegenläufige Konzepte. Sichere Archive brauchen möglicht viel Redundanz. Die Unlesbarkeit digitaler Medien in ein paar Jahren ist noch ein anderer Aspekt, das heißt, man sollte, wenn man nicht dauernd migrieren möchte, ein menschenlesbares Format wählen.
Ernsthafte Langzeitarchive sind deshalb in Menschensprache (sehr redundant) auf haltbaren Medien. Früher Stein, später Papier, heute Mikrofilm. Wenn da mal ein Teil beschädigt wird, kann man ziemlich gut erraten, was da fehlt. Bei komprimierten Sachen ist das prinzipiell unmöglich, man verliert wahrscheinlich sogar noch Daten in den unbeschädigten Teilen, weil nur das ganze Archiv entpackt werden kann.
Menschensprachen wurden sogar wiederhergestellt, wenn die Sprache schon ausgestorben war. Versuch das mal mit einem Computerbinärformat, dessen Spezifikation nicht mehr bekannt ist.
-
ja guuuut - soll ich jetzt ein Industriegebiet anmieten und jede Woche 1-3 G Papierausdrucke einlagern ?
ich brauche die Kompression, da ich damit bis zu 75% Platz spare.
Und CD-Rs scheinen mir vergleichsweise sicher, wenn man sie richtig lagert.
Ich kenne im Moment nichts Besseres für die Archivierung als CD-R.
-
u-ser_l schrieb:
Ich kenne im Moment nichts Besseres für die Archivierung als CD-R.
Versuch mal DVD-RAM. Und nimm das andere was ich geschrieben habe, nicht zu erst, ich wollte dir nur zeigen, wo deine Überlegungen zur Kompression enden, wenn man es übertreibt. Wenn die Daten aber wirklich wichtig sind, würde ich mir nochmal überlegen, ob 4x soviele Datenträger zu kaufen nicht billiger ist als ein Verlust der Daten.
-
auf DVDs habe ich noch nicht archiviert - ich lese immer die sehr detaillierten und aufschlußreichen Tests (pi-sum-Fehlerraten usw.) von DVD-Brenner- und -Rohling-Kombinationen in der c't ... vor allem nach Lagerung in der Klimakammer
Bei CD-R weiß ich, was ich habe, die DVD-Technik werde ich vermutlich ganz überspringen. Ist mir zu unentspannt.
-
DVD-RAM ist ein spezielles DVD Format für Langzeitarchivierung. Die Lebensdauer der Datenträger wird auf über 30 Jahre geschätzt. Außerdem sind standardmäßig nochmal zusätzliche Redundanzen auf der Scheibe, so dass Fehler korrigiert werden können.
-
danke für die Info. DVD-RAM ist mir aber nicht verbreitet genug, um darauf zu vertrauen, daß ich in so-und-so-viel-Jahren noch problemlos ein Lesegerät dafür kaufen kann.
-
u_ser-l schrieb:
danke für die Info. DVD-RAM ist mir aber nicht verbreitet genug, um darauf zu vertrauen, daß ich in so-und-so-viel-Jahren noch problemlos ein Lesegerät dafür kaufen kann.
Und bei anderen Medien vertraust Du darauf?
Kannst Du heute noch ein 5,25" Floppylaufwerk kaufen und an Deinen aktuellen Rechner anschließen?
-
Außerdem ist mir die x-fach höhere Datendichte (Bits pro Fläche) im Vgl. zur CD-R nicht ganz geheuer.
-
was hindert dich daran ein dvd-laufwerk mit einzumotten?
-
die Schnittstelle. Die Mechanik. Der Stromstecker. Verharzende Öle. Die Luftfeuchtigkeit. Staub. Temperaturschwankungen über Jahre hinweg.
Hardware-Teile zu archivieren halte ich nicht für sinnvoll, solange man nicht einen kompletten PC samt Bildschirm und Tastatur mit einmottet. Das kommt für mich aber aus Platz- und Sinngründen nicht in Frage.
-
Das Problem kann dir auch bei einem CD-LW passieren. Die haben die die gleichen Schnittstellen. Also warum sollte eine CD-R ggü. einer DVD-RAM im Vorteil sein, wenn doch beide das gleiche Probleme haben können. Oder steht irgendwo, das es CD-LW unendlich lange geben muß?