Bemerkbarer Qualitätsverlust bei Audio und Video nach Komprimierung?

audacia

volkard schrieb:

Packt man zum Beispiel zu mp3 mit 128k oder weniger, dann scheppert das bei manchen Stücken schon hörbar bis grausam. Ohne Not, wie ich finde. Man kann den Leuten aber nicht begreiflich machen, daß man zwar gerne packen kann, aber dabei keinesfalls knausern darf und auch keineswegs knausern muß, es ist doch auch bei extrem freizügigen Einstellungen noch viel kleiner als ungepackt. Mit 160k habe ich noch kein Scheppern oder Wummern gehört, glaube ich. Also würde ich defensiv 192 nehmen.

Kann ich so bestätigen. Bei einem modernen Encoder und Bitraten oberhalb von 192kBit/s wirst du Schwierigkeiten haben, irgendwelche Unterschiede zu finden, gleich welcher Codec.

Das heißt natürlich nicht, daß es keine Unterschiede gäbe. Die gängigen Audiocodecs gehen im Prinzip alle so vor: das Signal wird grob in fixe Zeitintervalle ("Frames") unterteilt, die fouriertransformiert und dann im Frequenzraum psychoakustisch "bearbeitet" werden - praktisch eine Short-Time Fourier Transformation, STFT. (Tatsächlich arbeiten die meisten Encoder mit einer modifizierten diskreten Cosinustransformation, MDCT, die auf einfache Art die Stetigkeit des Signals gewährleistet, im Prinzip aber genauso vorgeht.)

Das psychoakustische Modell, das dem Codec zugrundeliegt, sagt etwas darüber aus, wie gut der Mensch bei welchen Frequenzen differenzieren kann, und berücksichtigt Dinge wie den Verdeckungseffekt (grob gesagt: lautes Signal bei Frequenz f macht halb so lautes Signal bei Frequenz 2/3**f* unwahrnehmbar). Es erlaubt dem Encoder also, gewisse Frequenzanteile mit geringerer Genauigkeit zu speichern oder ganz wegzulassen. Das spart schonmal eine Menge Daten. Dann besteht bei Audiodaten natürlich per se eine gewisse Redundanz (was man u.a. daran sieht, daß verlustfreie Encoder wie FLAC in der Regel Kompressionsraten von 50% oder besser erreichen), so daß das Restsignal auch gerne noch durch einen Huffman-Codierer geschickt wird. Der Decoder setzt die Frequenzanteile mittels inverser STFT (bzw. iMDCT) wieder zusammen.

Das Problem ist nun, daß die Fourier-Transformation keine Zeitlokalität besitzt. Das Audiosignal ist eine Funktion Zeit->Amplitude, die Repräsentation im Fourier-Raum allerdings ist eine Frequenz->Amplitude-Zuordnung. Die FT sagt dir, welche Frequenzen im Signal vorkommen, aber nicht wann. Da die Frequenzanteile sich natürlich mit der Zeit ändern, muß man eben zuerst diese Zerstückelung in Frames vornehmen. Damit handelt man sich aber verschiedene Probleme ein. Einerseits hast du innerhalb dieser Frames natürlich keine Zeitlokalität. Andererseits fällt die Wahl der Framegröße pauschal für alle enthaltenen Frequenzen eine Entscheidung über die Auflösung: je kürzer das Intervall, desto geringer ist die Frequenzauflösung, und desto größer die Nebenwirkungen der psychoakustischen Anpassungen.

Das herkömmliche, omnipräsente Audiosignal (die CD speichert es per PCM ab, der Media-Player zeigt es an etc.) ist die einfachstmögliche Beschreibung von Schall: es beschreibt die Bewegung des Lautsprecherkonus und damit praktisch den Verlauf der Luftoszillation. Angenommen also, du hast ein sehr kurzes, präzises Signal, z.B. irgendein Percussion-Instrument. Im Audiosignal siehst du beim Einsetzen des Signals einen steilflankigen Ausschlag. Je nach Raum (-> Echo) mag das Signal etwas weitläufiger abklingen, aber der Anstieg eines kurzen Signals ist immer steilflankig. Steilflankige Signale enthalten fast alle Frequenzen (was du auch daran merkst, daß du den meisten Percussion-Instrumenten keine Tonhöhe zuordnen kannst). Nunn stelle dir vor, du schickst das Signal in einen Encoder, der es einem Frame zuteilt, fouriertransformiert und dann per Psychoakustik gewisse Frequenzen herausnimmt. Das beeinträchtigt natürlich die Steilflankigkeit, und es kann zu einem Effekt namens "Pre-Echo" kommen, also eine Art Echo, die aber schon vor dem Einsetzen des Signals erklingt und den Hörer dadurch irritiert, daß es die Kausalität verletzt.

Dieses Problem ist natürlich derart allgegenwärtig, daß die gängigen Encoder eine variable Framebreite unterstützen - oft nur zwei, den "long mode" und den "short mode" - und für kurze, laute Signale den "short mode", für eher gleichbleibende Signale den "long mode" verwenden. Aber der Auswahlmechanismus läßt sich natürlich austricksen. Dieser Moduswechsel ist etwa schwierig, wenn du Signale beider Qualitäten überlagerst. So wirst du mit etwas Recherche auf ganze Sammlungen von Samples aus Musikstücken stoßen, die dafür bekannt sind, daß die Auswahlmechanismen mancher Encoder an ihnen scheitern; darin können dann bei konzentriertem Hören deutliche Artefakte hörbar sein.

Natürlich schmälert das im Allgemeinen den Musikgenuß nicht, da man nicht an einzelnen Artefakten in einer halbsekündigen Passage, sondern am Gesamtklangbild interessiert ist. Auch gute Encoder generieren Artefakte, aber sie geraten dabei nicht ins Stolpern, so daß man bei normalem Hören schlicht nichts davon merkt.

Das systematische Problem der STFT ließe sich übrigens umgehen, wenn man andere Transformationen verwendet, die sowohl Zeit- als auch Frequenzlokalität besitzen, wie z.B. die Wavelet-Transformation. In der Theorie ermöglicht das eine frequenzspezifische Anpassung der Auflösung und vermeidet damit das Dilemma von oben. In der Praxis büßt man vermutlich zu viel Frequenzauflösung ein, als daß das psychoakustische Modell noch präzise genug anwendbar wäre. Ich kenne jedenfalls keinen Audiocodec, der auf Wavelet-Transformationen basiert. (Für Bilddaten, die nach ähnlichen Prinzipien komprimiert werden, gibt es so etwas, z.B. JPEG 2000.) Allerdings muß man sagen, daß viele Audiocodecs schon auf ähnliche Weise (mit Filterbänken) das Frequenzband grob in mehrere Bereiche zerteilen, die dann individuell quantisiert werden können. MP3 geht hier etwas weit und unterteilt das Signal gleich in 32 Subbänder; soweit ich weiß, ist das auch der Grund, warum MP3 nicht zu den effizientesten Kompressionsverfahren zählt und etwa unterhalb von 128 kBit/s eher unbrauchbare Ergebnisse erzielt.

Persönlich verwende ich meist 292 kBit/s. Preisfrage: welchen Codec verwende ich?

Edit: ä -> ö

volkard

audacia schrieb:

Persänlich verwende ich meist 292 kBit/s. Preisfrage: welchen Codec verwende ich?

Aäh, google schlägt ATRAC vor? Nie davon gehört.
Ich dachte, man sei mit Vorbis zur Zeit gut bedient.

audacia

volkard schrieb:

Aäh, google schlägt ATRAC vor?

Treffer Der Grund dafür besteht in meiner MD-Sammlung, ist damit eher historischer Art und hindert Vorbis natürlich nicht daran, heute eine bessere Alternative zu sein.

nachtfeuer

SeppJ schrieb:

Das reicht noch nicht einmal für Hänschen Klein in c-Dur. Ich glaube, dir beliebt zu scherzen!

Lol...
Man kann sich natürlich fragen, was einige Leute in mein erstes Posting hineininterpolieren, und was der Hintergrund dieser Interpolation sein mag.
Niedrige Interpretationsbitrate?

Letztlich:
Ich hätte auch schreiben können, 12 Bit, 50 kHz, bezweifle aber dass einige Leute diesen Unterschied (im Blindtest, und je nach Material) überhaupt hören können, geschweige denn, sich eine Vorstellung davon machen.

Das 12bit theoretisch schon sehr gut sein müssen, kann man sich anhand eines Laustärkereglers verdeutlichen:
Bei 2 Bit hat man nicht viel Auswahl, nur z.B. aus, leise, mittel, laut oder leise, leiser, laut, lauter. Bei 12 Bit hat man 4096 Stufen - in der heutigen Digitalmedienwelt werden aber bei Reglern schon 128 oder weniger Stufen als "stufenlos" eingestuft.

volkard

nachtfeuer schrieb:

Letztlich:
Ich hätte auch schreiben können, 12 Bit, 50 kHz,

Das wären dann 15% Einsparung und ich hätte Deiner Argumentation auch nicht folgen können, weshalb das große Stück jetzt nicht auf den Datenträger paßt. Und es gibt so viele einfache Verfahren, die normalerweise viel mehr rausholen.

[/quote]Das 12bit theoretisch schon sehr gut sein müssen, kann man sich anhand eines Laustärkereglers verdeutlichen:
Bei 2 Bit hat man nicht viel Auswahl, nur z.B. aus, leise, mittel, laut oder leise, leiser, laut, lauter. Bei 12 Bit hat man 4096 Stufen - in der heutigen Digitalmedienwelt werden aber bei Reglern schon 128 oder weniger Stufen als "stufenlos" eingestuft.[/quote]
Auf dem 64-er hatten wir Musik mit 1 Bit gesampled und man konnte sogar manchmal das Stück erraten.

wir haben mit 0 bit gesampelt, um man konnte es wiedererkennen: das berühmte 4'33" von J. Cage

volkard

!rr!rr_. schrieb:

wir haben mit 0 bit gesampelt, um man konnte es wiedererkennen: das berühmte 4'33" von J. Cage

Nicht schlecht!

Wer es nicht kennt: http://www.youtube.com/watch?v=hUJagb7hL0E

Und hier eine Überarbeitung für's Klavier: http://www.youtube.com/watch?v=gN2zcLBr_VM&feature=related

nachtfeuer

volkard schrieb:

Das wären dann 15% Einsparung und ich hätte Deiner Argumentation auch nicht folgen können, weshalb das große Stück jetzt nicht auf den Datenträger paßt. Und es gibt so viele einfache Verfahren, die normalerweise viel mehr rausholen.

Vorstellungshilfe:
bei 1 MB etwa 2 Sekunden mehr möglich, also ein nettes Tastaturdrumset mehr, bei 4GB passt in etwa ein unkomprimiertes Album mehr drauf.
Meine Arbeitskomprimierrate (Mp3,Lame) für den Hausgebrauch machts genau umgekehrt, Speicherbedarf nur noch 15% ...also in etwa 6 bis 7 Alben mehr bei 4GB + verbesserter Rauschabstand gegenüber 12 Bit.
Leider hatten die Livemucker/Instrumentbetriebssysteme früher (in den 90ern) keine oder kaum solche tolle Komprimiertechnik zur Verfügung (schade eigentlich), so dass in manchen Sessions Wartezeit auf DiskettenSoundkitloading... mit zur Performance gehörte.
Man konnte dem entgegengehen, indem man den Speicher ausbaute (0,5 MB Schritte bis 2-12 MB in etwa, und pro Schritt nicht billig), damit das ganze Livesoundset im Arbeitsspeicher für den Auftritt ausreicht.
Stellen wir uns einen Arbeitsspeicher von 2MB und ...naja, sagen wir mal pessimistisch 4 Samplesets für 5 oder mehr Songs...
-> auf 15% schrumpf: in etwa 30 Samplesets für 30 bis 35 Songs, das wäre Livekomfort total gewesen.

volkard

nachtfeuer schrieb:

volkard schrieb:

Das wären dann 15% Einsparung und ich hätte Deiner Argumentation auch nicht folgen können, weshalb das große Stück jetzt nicht auf den Datenträger paßt. Und es gibt so viele einfache Verfahren, die normalerweise viel mehr rausholen.

Vorstellungshilfe:
bei 1 MB etwa 2 Sekunden mehr möglich, also ein nettes Tastaturdrumset mehr, bei 4GB passt in etwa ein unkomprimiertes Album mehr drauf.
Meine Arbeitskomprimierrate (Mp3,Lame) für den Hausgebrauch machts genau umgekehrt, Speicherbedarf nur noch 15% ...also in etwa 6 bis 7 Alben mehr bei 4GB + verbesserter Rauschabstand gegenüber 12 Bit.
Leider hatten die Livemucker/Instrumentbetriebssysteme früher (in den 90ern) keine oder kaum solche tolle Komprimiertechnik zur Verfügung (schade eigentlich), so dass in manchen Sessions Wartezeit auf DiskettenSoundkitloading... mit zur Performance gehörte.
Man konnte dem entgegengehen, indem man den Speicher ausbaute (0,5 MB Schritte bis 2-12 MB in etwa, und pro Schritt nicht billig), damit das ganze Livesoundset im Arbeitsspeicher für den Auftritt ausreicht.
Stellen wir uns einen Arbeitsspeicher von 2MB und ...naja, sagen wir mal pessimistisch 4 Samplesets für 5 oder mehr Songs...
-> auf 15% schrumpf: in etwa 30 Samplesets für 30 bis 35 Songs, das wäre Livekomfort total gewesen.

15%.

XDVD

Minimee schrieb:

Es gibt halt immer Freaks die behaupten sie würden den Unterschied hören. Das sind dann die Leute die auch 1000€ für ein 3m langes Lautsprecherkabel ausgeben.

Falsch, Unterschiede hört man schon mit viel günstigeren Anlagen. Auf meiner Anlage (~1000€) sind ganz klar Unterschiede zwischen gut komprimierter Musik (320 AAC) und CDs/Vinyl zu hören. Gerade bei Feinheiten wie den Becken, der Räumlichkeit/Bühnenbildung der Musik oder den Details in einer Stimme liegen Welten dazwischen.

XDVD schrieb:

Minimee schrieb:

Es gibt halt immer Freaks die behaupten sie würden den Unterschied hören. Das sind dann die Leute die auch 1000€ für ein 3m langes Lautsprecherkabel ausgeben.

Falsch, Unterschiede hört man schon mit viel günstigeren Anlagen. Auf meiner Anlage (~1000€) sind ganz klar Unterschiede zwischen gut komprimierter Musik (320 AAC) und CDs/Vinyl zu hören. Gerade bei Feinheiten wie den Becken, der Räumlichkeit/Bühnenbildung der Musik oder den Details in einer Stimme liegen Welten dazwischen.

Durchaus. Allerdings muss man sagen, dass komprimierte Musik in manchen Fällen einen ganz eigenen, besonderen Charakter zum Musikstück hinzufügt. AAC hat eher einen dunklen, halligen nachgeschmack, während ogg stellenweise crisper ist und trotzdem Volumen addiert. Das ist wie mit vinylplatten, die für manche leute einfach besser klingen als FLAC.

audacia

XDVD schrieb:

Gerade bei Feinheiten [...] liegen Welten dazwischen.

Gerade bei Feinheiten liegen natürlich schon per Definition keine Welten dazwischen. Quantensprünge, meinetwegen

SeppJ

Darf ich eine Wette da drauf abschließen, dass du auch einen Unterschied zwischen 2x CD hörst, wenn man dir bei einem Mal sagt, dass es 320 kb mp3 wäre?

XDVD schrieb:

Falsch, Unterschiede hört man schon mit viel günstigeren Anlagen. Auf meiner Anlage (~1000€) sind ganz klar Unterschiede zwischen gut komprimierter Musik (320 AAC) und CDs/Vinyl zu hören.

Vinyl == Schallplatte, oder gibts jetzt schon digital Vinyl? Da hörst du sicher Unterschiede, aber der Vergleich ist ziemlich lächerlich.

XDVD

HouuH schrieb:

XDVD schrieb:

Falsch, Unterschiede hört man schon mit viel günstigeren Anlagen. Auf meiner Anlage (~1000€) sind ganz klar Unterschiede zwischen gut komprimierter Musik (320 AAC) und CDs/Vinyl zu hören.

Vinyl == Schallplatte, oder gibts jetzt schon digital Vinyl? Da hörst du sicher Unterschiede, aber der Vergleich ist ziemlich lächerlich.

Ja, ich weiß, theoretisch sollte digitale Musik haushoch überlegen sein. Trotzdem sind meine Schallplatten oft deutlich räumlicher, damit habe ich den Sänger exakt in der Mitte zwischen den Boxen stehen. Außerdem sind Instrumente auch in der Tiefe ortbar (Streicher bilden deutlich hörbar/ortbar einen Teppich hinter dem Sänger).

Ich will mich aber gar nicht darauf versteifen, dass es am Medium liegt. Ich könnte mir folgende Gründe vorstellen:
- mein Plattenspieler ist deutlich besser als mein CD-Player (hat ein Ortofon OMP 30-System dran, das klingt schon wirklich gut)
- die Platten sind weniger kaputtgemischt (Stichwort: "Loudness War")

Subjektiv sind Platten bis jetzt mein Lieblingsmedium.
Ich werde mir aber demnächst irgendwann ein Cambridge DacMagic kaufen, von dem ich mir die bessere Ortbarkeit und Plastizität auch von meinen FLACs erhoffe.

XDVD

SeppJ schrieb:

Darf ich eine Wette da drauf abschließen, dass du auch einen Unterschied zwischen 2x CD hörst, wenn man dir bei einem Mal sagt, dass es 320 kb mp3 wäre?

Kommt völlig auf die Aufnahme an. Wenn die Aufnahme nichts taugt, bzw. den Detailreichtum einer CD von vorne herein nicht benötigt, wird man da auch keinen Unterschied hören. Bei guten Jazz oder Klassik-Aufnahmen würde ich die Wette sofort annehmen.

XDVD schrieb:

[
Ja, ich weiß, theoretisch sollte digitale Musik haushoch überlegen sein. Trotzdem sind meine Schallplatten oft deutlich räumlicher

schon der Rauschpegel, der entsteht, wenn die Tonabnehmernadel durch die Leerrille am Rand der Schallplatte pflügt, kann eine Illusion erhöhter Räumlichkeit erzeugen. Diese Täuschung kann man umgehen, indem man beim Klangvergleich stufenlos überblendet.

XDVD

!rr!rr_. schrieb:

XDVD schrieb:

[
Ja, ich weiß, theoretisch sollte digitale Musik haushoch überlegen sein. Trotzdem sind meine Schallplatten oft deutlich räumlicher

schon der Rauschpegel, der entsteht, wenn die Tonabnehmernadel durch die Leerrille am Rand der Schallplatte pflügt, kann eine Illusion erhöhter Räumlichkeit erzeugen. Diese Täuschung kann man umgehen, indem man beim Klangvergleich stufenlos überblendet.

Dafür fehlt mir das Mischpult
Ist mir aber eigentlich auch egal ob's nun eine Illusion ist oder nicht, solange ich (und andere) das so bestätigen können. Das fällt mir nicht nur beim Vergleichen auf, sondern auch beim ganz normalen Musik hören.

Aber wie gesagt, bald kommt ein g'scheiter D/A-Wandler ins Haus, von dem ich mir erhoffe, dass ich dann mit digitaler Musik genauso viel Spaß habe. Komfortabel sind Platten nämlich nicht...

Michael E.

Dann sag doch gleich, dass es nicht an der Kompression liegt.

XDVD

Michael E. schrieb:

Dann sag doch gleich, dass es nicht an der Kompression liegt.

Das mit dem externen D/A-Wandler bezog sich auf Platte vs. Digital. Mit Kompression hatte die Aussage nichts zu tun, das Gerät wird auf jeden Fall mit verlustfrei komprimierten CD-Rips gefüttert werden. Sorry für's Abrutschen vom eigentlichen Thema.

Wie oben geschrieben: Mit zunehmender Kompression nehmen Räumlichkeit und Detailreichtum immens ab. Für wirklichen HiFi-Genuss sind komprimierte Dateien meiner Erfahrung nach nicht zu gebrauchen (auch hier wieder: Setzt Aufnahmen voraus, die den Detailreichtum überhaupt ausreizen).