Wieviel einer Wave-Datei für hash günstig
-
hi,
ehm, der Titel ist vielleicht etwas untreffend aber im Grunde gehts darum:Ich möchte Daten zu Liedern anhand ihres (MD5-)Hashes speichern, sprich lege ich ne Datei an und schreib da jetzt z.B. rein "098f6bcd4621d373cade4e832627b4f6: Rammstein; Benzin; schnell" oder so.
Jetzt ist nur die Frage: von welchem Teil der Wave-Datei soll ich den Hash bilden? Da jede Datei ca 50 MB groß ist, fällt es für mich aus, von der gesamten Datei den Hash zu nehmen, es würde einfach zu lange dauern.
Ich dachte daran, die ersten 512 KB zu nehmen, was meint ihr?
-
das sind generell mal keine hashes von liedern, sondern hashes von deinen wave-dateien. die größe des fensters dürfte relativ egal sein. nimm einfach ein paar kb aus der mitte der datei, das passt dann schon. vermeide nur, stille zu hashen.
-
Naja... ich würde die ganzen Files hashen. Wenn du das nicht willst nimm irgendein Stück aus der Datei raus, oder vielleicht 2-3 Stücke. 512KB ist fast schon Overkill, 2 oder 3x 4KB sollten leicht reichen.
-
Meint ihr, der Hash ist immer gleich? Wenn am Anfang vom einen Lied bei einer Aufnahme 100ms mehr Stille sind als bei einer anderen, dann sind die Hashs doch nie gleich. Oder was soll das ganze bringen?
-
es geht nicht um mehr oder weniger stille, sondern nicht "nur stille" zu hashen.
-
ja, war aber nicht mein einwand
-
die ganze datei würde ich nehmen. sonst haben am ende downloadabbrecher oder größenerhaltende kopierfehler den gleichen wert wie die fehlerfreien dateien.
willste nur einen kleinen teil hashen, dann haste den zweck von MD5 umschifft und kannst ruhig CRC32+Dateigröße nehmen. zum beispiel aus den sektoren 1, 2, 4, 8, 16...
-
geht das??? schrieb:
Meint ihr, der Hash ist immer gleich? Wenn am Anfang vom einen Lied bei einer Aufnahme 100ms mehr Stille sind als bei einer anderen, dann sind die Hashs doch nie gleich. Oder was soll das ganze bringen?
Wenn du verschiedene Aufnahmen des selben Lieds hast, haben die ganz klar auch verschiedene Hash-Werte (da braucht es noch nichtmal schwankene Pausenlängen, da reicht idR schon eine mikroskopische Tonhöhenänderung aus).
-
@geht das??? & CStoll:
Klar sind verschiedene Versionen eines Songs unterschiedlich, manchmal sogar wenn man mit dem gleichen Laufwerk den gleichen Song von der gleichen CD 2x einliest.
Wenn man aber 2x das gleiche *File* hasht bekommt man 2x den gleichen Wert raus.
-
Also dient das dazu, eine Datei zu verifizieren? Dass sie wirklich die ist, die sie vorgibt zu sein?
-
ok, ich hab mich für CRC32 entschieden und mittlerweile gehts sogar^^
danke