Vor-/Nachnamen "komprimieren"
-
Christoph schrieb:
Nicht jeder deutsche Staatsbürger hat einen deutschen Namen.
Mit unvorhersehbar meine ich: Es ist üblich, dass Programme entweder ausschließlich ASCII-Zeichen akzeptieren oder eben alle Unicode-Zeichen [1]. Aber irgendeine Zeichen-Menge dazwischen ist bei heutigen Programmen ziemlich unüblich, deswegen: unvorhersehbar.
Die Namen sind für eine Namen-DB komprimiert, die von einem Zufallsnamen-Genarator verwendet werden sollte.
Da dort keine Namen hinzugefügt werden ist das kein Problem.
-
hab einen anderen vorschlag, die namen zu komprimieren:
du nimmst einfach eine sortierte liste aller deutschen vornamen und der index in die liste ist der gepackte name.
http://de.wikipedia.org/wiki/Kategorie:Männlicher_Vorname
da müßten eigentlich 20 bit reichen. ist das nicht super gepackt?
-
Eine moderne Kompressionsbibliothek kriegt die Daten zuverlässig, schnell und deutlich besser (de-)komprimiert als du. Außerdem ist es bei weitem nicht so zeitaufwendig
-
Wo find ich so eine Kompressionsbibliothek?
-
-
für namen eignet sich wohl am besten ein trie
-
-
So langsam frage ich mich ob das Komprimieren Sinn macht, bei der Arbeit...
-
Ich glaube du hast den Knackpunkt erfasst ... Um wieviel Byte handelt es sich denn insgesammt?
-
knivil schrieb:
Ich glaube du hast den Knackpunkt erfasst