Vor-/Nachnamen "komprimieren"

Christoph schrieb:

Nicht jeder deutsche Staatsbürger hat einen deutschen Namen.

Mit unvorhersehbar meine ich: Es ist üblich, dass Programme entweder ausschließlich ASCII-Zeichen akzeptieren oder eben alle Unicode-Zeichen [1]. Aber irgendeine Zeichen-Menge dazwischen ist bei heutigen Programmen ziemlich unüblich, deswegen: unvorhersehbar.

Die Namen sind für eine Namen-DB komprimiert, die von einem Zufallsnamen-Genarator verwendet werden sollte.
Da dort keine Namen hinzugefügt werden ist das kein Problem.

volkard

hab einen anderen vorschlag, die namen zu komprimieren:
du nimmst einfach eine sortierte liste aller deutschen vornamen und der index in die liste ist der gepackte name.
http://de.wikipedia.org/wiki/Kategorie:Männlicher_Vorname
da müßten eigentlich 20 bit reichen. ist das nicht super gepackt?

Michael E.

Eine moderne Kompressionsbibliothek kriegt die Daten zuverlässig, schnell und deutlich besser (de-)komprimiert als du. Außerdem ist es bei weitem nicht so zeitaufwendig

Wo find ich so eine Kompressionsbibliothek?

theta

http://www.zlib.net/

hustbaer

für namen eignet sich wohl am besten ein trie

http://en.wikipedia.org/wiki/Trie

Nanyuki

tomgk schrieb:

Wo find ich so eine Kompressionsbibliothek?

Hier: http://www.7-zip.org/sdk.html

So langsam frage ich mich ob das Komprimieren Sinn macht, bei der Arbeit...

knivil

Ich glaube du hast den Knackpunkt erfasst ... Um wieviel Byte handelt es sich denn insgesammt?

volkard

knivil schrieb:

Ich glaube du hast den Knackpunkt erfasst

Vor-/Nachnamen &quot;komprimieren&quot;

Vor-/Nachnamen "komprimieren"