Komprimierung von einzelnen Datensätzen bzw. fester Komprimierungs-Algorithmus
-
Ich habe eine relative große Liste von Datensätzen in einer Datei.
Eine Teil der Daten besteht aus Namen (ca. 10-40 Zeichen lang).
Die Daten wären in UTF8 gespeichert, umfassen aber zu 98% Ascii Zeichen. Umlaute und Sonderzeichen kommen so gut wie nicht vor.Ich würde un gerne die Datensätze so komprimieren, dass ich über einen Index jeden Datensatz anfahren kann und lesen.
Mit ZLIB geht das, sofern man brav Z_FULL_FLUSH benutzt. Nur wie effektiv ist das? Hat damit jemand Erfahrungen?
Oder kennt jemand einen Link auf einen Komprimierungs Algorithmus (Huffmann o.ä.) bei dem der Code-Baum statisch ist.
Angenommen werden kann das die Zeichenverteilung im Mittel der für Westeuropäische Sprachen entspricht.