Workshop-Grundlagen: Audiokompression und Kompromisse

Autor

Beitrag

Hyperlink
Inventar

#1 erstellt: 11. Dez 2005, 02:10

Ich versuche mal unter Beachtung von Aspekten, die meinen Vermutungen folgend für ein Hifi-Forum relevant sein könnten, hier eine überarbeitete Version (Adaption) eines meiner Artikel zu platzieren.

Ich überlasse es dem Diskussionsverlauf, ob ich die Überarbeitung, Kürzungen und Erweiterungen fortführe und an diesem Vorhaben weiterarbeite. Da ich mir sehr viel Mühe beim Erarbeiten dieses Textes gegeben habe, bitte ich um möglichst konstruktive Kommentare und Verbesserungsvorschläge. Die Moderation würde ich bitten Trollversuche und Störungen durch Personen, die nicht an der Diskussion selbst intressiert sind, als solche zu kennzeichnen (oder wie in anderen Foren bereits allgemein üblich) oder zu löschen, um Übersichtlichkeit zu gewährleisten. Ich werde auf Trolling nicht eingehen, Fragen per PM beantworte ich nicht, diese können als eigene Themen formuliert und mit Sicherheit auch durch Dritte beantwortet werden. Ich bitte die Moderation auch darum diesen Beitrag bis auf Widerruf hier im Forum "PC&Hifi" zu belassen.

Als Grundlage für die Überarbeitung dient mein Grundlagenartikel

AudioHQ -> Audiokompression und planbare Kompromisse, der vormals auf die Zielgruppe von Anfängern im Bereich "Rippen und Encodieren am PC" und nicht auf die "Hifi-Klientel" zugeschnitten war. Mein Artikel war Grundlage meines

Einstiegs bei AudioHQ und wird seit 2003 kontinuierlich vom AudioHQ-Team gepflegt. Ich folge bei der Präsentation hier dem bereits bewährten "roten Faden" der bereits beim "Original" zu mehr als 20.000 Views und zahlreichen Verlinkungen geführt hat. Das Copyright liegt natürlich bei mir (also namentlich Jochen Siegner). Quellen, Literatur und Anhang sind schon jetzt unter obiger Adresse recherchierbar.

Diese Beitragsserie, die vielleicht irgendwann mal ins "Hifi-Wissen" verschoben werden kann, ist eine direkte Reaktion auf mehrere Bitten per PM Fachwissen von AudioHQ um die Audiokompression hierher zu transferieren. Ich folge hiermit natürlich auch dem Hinweis eines Moderators, das nicht jeder unsere Arbeiten zu den Grundlagen der Audiokompression und unsere Webressource kennen kann, die eine Autoren-Community für Beitrage zur Audiokompression und die zugehörige Diskussionsplattform für die Autoren anbietet.

Werbeeffekte für unsere Arbeit sind selbstverständlich nicht das Ziel meiner Adaption, aber wohl unvermeidlich, Hinweise darauf sind deshalb unnötig. Falls eine solche Artikelserie nicht erwünscht ist, wäre dies der geeignete Zeitpunkt dies unter Nennung von nachvollziehbaren Gründen zu äußern, bevor ich Arbeitsleistung investiere.

Motivierende und leistungssteigernde Kommentare sind natürlich gerngesehen.

Viel Spass beim Lesen.

0. Einleitung

Inzwischen blicken wir auf einige Jahre der Diskussion über die Themen

Audiokompression, Hifi-PC und (Audio)CD-Kopierverfahren zurück. Je nach Sichtweise hat sich sehr viel oder auch sehr wenig getan. Begriffe wie

MP3,

Rippen und

Encoder haben sich mittlerweile etabliert und gehören selbst in Haushalten, die kaum Unterhaltungsmedien konsumieren, zum alltäglichen Sprachgebrauch.

Einerseits bewegt sich ein großer Teil der Nutzer auf einem hohen Wissensniveau, nutzt neueste Technik (Software/Hardware), investiert viel Zeit und Geld und hat dementsprechend einen großen Fachinformationsbedarf. Andererseits lassen sich viele Einsteiger von der Industrie für gutes Geld ungenügende Werkzeuge und teilweise inkompatible Hardware verkaufen, ohne ihre Qualitätsansprüche oder das bevorzugte Nutzungsverhalten zu überdenken. Daher gibt es also auch hier genügend Informationsbedarf, der über die zu oberflächlichen Inhalte der Artikel in der Presse (jedweder Colour) hinausgeht. Gerade die schon benannten Einsteiger, aber auch "Berufs-Updater", Intressierte oder nur teilweise "Formatwechselwillige" brauchen zusätzliche Orientierung.

Hinzu kommt, daß das Thema

"Komprimieren" von vielen Mißverständnissen, Halbwahrheiten und

Werbelügen durchsetzt ist. Firmen und Nutzer verwenden sehr oft existierende Fachbegriffe frei nach ihrem

eigenen Verständnis und entsprechend verkommen die Bedeutungen zu Worthülsen und "Buzzwords". Dies ist der Begriff für Dinge, bei deren Namensnennung bei vielen Menschen unkontrolliert eine Meinungsäußerung erfolgt, ähnlich wie man in einer TV-Quizsendung den "Buzzer" drückt, um die Aufmerksamkeit auf sich zu ziehen. Das alleinige Drücken des "Buzzers" ist aber leider kein Garant dafür, daß der richtige Zusammenhang und die Antwort auf Fragestellungen gefunden wird.

Für Beurteilungen und Vergleiche genügt aber evtl. vorhandenes Halbwissen nicht. Gerade der letztgenannte Punkt führt oftmals dazu, daß man immer wieder endlose Diskussionen um eigentlich simple Phänomene der Audiokompression innerhalb von Newsgroups, Foren und anderen Medien beobachten kann. Aber auch "Fachbeiträge" und Tests aus der Presse für unterschiedlichste Zielgruppen enthalten mitunter merkwürdige Vergleiche/Empfehlungen und sollten daher dringend ergänzt und aktualisiert werden.

Mit zunehmender Kommerzialisierung der Audiokompression wird dieses "Babylon-Phänomen" gewiß nicht abnehmen. Manche Mythen haben sich leider schon etabliert. Als Beispiele seien nur die "doppelte Spielzeit"-Diskussion oder die Wissenlücken rund um den minderwertigen Xing-, Blade- und iTunes-Klang genannt. Entsprechende Auseinandersetzungen treten immer dann auf, wenn sich zB die Beteiligten lernresistent verhalten und persönliche Eindrücke und subjektive Vorlieben unzulässig verallgemeinern. Das gilt sowohl für

selbsternannte Profis, wie auch für so genannte

"Fachjournalisten". Auch hier im Forum gibt es genügend talentierte "Berichterstatter" die sich den Vor- und Nachteilen der Audiokompression unter dem Synonym oder besser "Buzzword" (Schlagwort) widmen, aber nur nutzlose subjektive Eindrücke wiedergeben, die aber außer ihnen niemand nachvollziehen kann weil niemand die Methoden nachvollziehen kann, wie diese Berichterstatter zu ihren "Erkenntnissen" gekommen sind. Solche "Ergebnisse" sind aaber letztlich unbefriedigend für alle (Test-) Teilnehmer und Leser, außer, der Diskussionsverlauf gestaltet sich so, wie in diesem

Gegenbeispiel. Wo liegen nun die Verständigungsschwierigkeiten, Missverständnisse und Problemfelder, die Anwender daran hindern, vorhandenes Teilwissen in einem größeren Rahmen einordnen zu können?

Zuerst einmal möchte ich mit einer Definition des Begriffes

"Archivqualität" beginnen. Danach sollen die verlustfreien (lossless) Formate näher beleuchtet werden. Hinweise auf philosophische Gehalte und hermeneutische Deutungsversuche sowie Logikpuzzles im Zusammenahng mit gewählten Begriff sind übrigens unnötig, weil dieser Begriff nursolange als prktikabler Kompromiss dienen soll, bis ein besserer Begriff gefunden wurde. Zum Schluß möchte ich die populären verlustbehafteten (lossy) Codecs, wie etwa MP3 oder Ogg-Vorbis, besprechen. Daran anschließend widme ich mich unter Verzicht auf Qualität den Methoden die Audiokompression so umzuformen, daß man damit bestimmte Zwecke verfolgen kann, als Beispiel sei das "platzsparende Encodieren für Portables" genannt.

Es sei darauf hingewiesen, daß die in diesem Artikel genannten und auch auf AudioHQ

empfohlenen, meist quelloffenen, Non-Profit-Programme (OpenSource/Freeware) und dazugehörigen Tutorials es ermöglichen, meine Aussagen zu überprüfen. Außerdem können sie dazu dienen, Audiodateien für Archivierungszwecke (zB CD-Backup) zu erstellen. Spezialfragen bitte ich genügend er AudioHQ und Google zu recherchieren, bevor neue Threads hier im Forum gestartet werden. Im Regelfall dürfte die hörbare Qualität weit über der liegen, die mit kommerzieller Software erreichbar ist. In diesem Zusammenhang ist der generelle Verzicht meinerseits erwähnenswert, Software zu nennen und zu empfehlen, die Spionagefunktionen, Werbetrojaner und Bezahldienste verwendet. Die AudioHQ-verantwortlichen stellen sich damit gegen den allgemein offensichtlichen Trend, über nicht vordergründig erkennbare Funktionen die Nutzungsgewohnheiten und Vorlieben von Anwendern zu beobachten und Kopiersperren zu etablieren. Kompromisse im Hinblick auf die Klangqualität werden aufgezeigt und können meiner Meinung nach durch geschickte Planung vermieden oder gar vollständig umgangen werden. Die Schwerpunkte werden absichtlich auf die computerbasierte Archivierung und die Wiedergabe über eine Hifi-Anlage gelegt, weil die Fähigkeiten zur Verwaltung und hochwertigen Wiedergabe bei DVD-Playern, Portables und im Hifi-Bereich

meist minderwertig oder schlichtweg gar nicht vorhanden sind. Eine Diskussion um Kopiersperren und zugehörige Lösungsvorschläge findet naturlich aus gutem Grund nicht statt, weil sie eventuell juristisch relevant dem novellierten UhG zuwiederlaufen könnten. Soweit es geht möchzte ich Juristen die ihr Geld mit Abmanhungen verdienen keinerlei Spielräume geben, meine Aussagen misszuverstehen.

Es geht im folgenden einzig darum, Privat- bzw. Sicherungskopien für eigene Zwecke zu erstellen, ein Archiv zu planen und in die Praxis umzusetzen.

Im Verlauf dieses Leitartikels werden die Gründe herausgearbeitet, warum nicht nur die Wahl eines bestimmten Audioformates allein, sondern auch die Art der Erstellung wie auch die der Aufbereitung wichtiger für die Gesamtqualität sind. Die von mir aufgeführten Vorschläge sollten bereits in die Planungsphase einfließen und, entsprechend gewichtet, den persönlichen Wünschen und Bedürfnissen angepasst werden. In allererster Linie geht es im folgenden darum, die Formatwahl zu klären. Fragen zur Planung eines Archivs, zur

Softwarequalität,

Langzeitarchivierung oder zur

Datensicherheit werden eventuell in weiteren Adaptionen (Anpassungen) auf die Bedürfnisse dieses Forum folgen.

Das Ziel der Audiokompression könnte folgendermaßen umrissen werden:

Nicht kopiergesperrte Audio-CDs oder Teile daraus per Software wohlgemerkt für den Eigenbedarf so zu kopieren, daß sie verlustfrei (oder definiert verlustarm) transformiert, transportiert, vermischt und archiviert werden können.

Es geht im Folgenden zum einen darum, die Inhalte vom Ursprungsmedium zu trennen und auf unterschiedlichsten Datenträgern abspielbar zu machen, und zum anderen, sie bei vertretbarem Aufwand mit Hilfe von verschiedenen Medien zu übertragen bzw. weiterzuverarbeiten. Das geschieht unter Berücksichtigung der jeweiligen Eigenschaften der Ursprungsmedien, der selbsterstellten Medien, der Übertragungswege und der großen Vielfalt vorhandener Hardware- oder Computersysteme. (Erfolgt dies mit einer möglichst geringen Nominalbitrate, so nennt man das eine "effektive Transmission", also Übertragung der Inhalte.)

Das Archiv soll mit verschiedenen Hard- und Software-"Abspielern" wiedergegeben werden können, formatunabhängig funktionieren und erweiterbar sein. Die Wiedergabe soll PC-basiert erfolgen. Eine geringe Zugriffszeit und ein Maximum an Such-Komfort sollen diese auszeichnen. Außerdem soll die Präsentation der Inhalte auf einem möglichst hohen Niveau stattfinden, damit der Nachteil der unvermeidlichen Virtualität der Sammlung ausgeglichen wird. Aspekte der Datensicherheit und Schutz vor Datenverlust sollen ebenfalls berücksichtigt werden.

[Beitrag von Duncan_Idaho am 11. Dez 2005, 16:39 bearbeitet]

Duncan_Idaho
Inventar

#2 erstellt: 11. Dez 2005, 16:42

Kleiner Hinweis des Mods: Artikel stammen immer von Hyperlink, ich bereite sie für diesen Workshop nur auf!

1.0 Archiv- vs. CD-Qualität

Es gibt inzwischen eine große Anzahl von Anwendungen im Bereich der Audiokompression und der Digitalen Audio Extraction (DAE). Sie werden unter den Begriffen Multimedia bzw., übergeordnet, Unterhaltung/Entertainment zusammengefaßt. Das praktische Wissen um die Zusammenhänge bei der Nutzung dieser Anwendungen dürfte in Zukunft weiterhin an Bedeutung gewinnen, da die nachwachsenden Musikliebhaber-Generationen einen ans Internet angeschlossenen PC als erstes Hifi-Gerät kennenlernen. Der Sachverhalt der wachsenden Begeisterung für mobile Wiedergabegeräte, P2P-Börsen zum Austausch Urheberrechtsfreier Tuaschobjekte und das Aufzeichnen von Webradiostreams, welches ähnlich wie das vormalige Mitschneiden von UKW-Radiosendungen auf Musikkassette (MC) funktioniert, sollte diese These stützen.

Die Audio-CD gibt es inzwischen bereits seit etwas mehr als 20 Jahren. Sie ist derzeit der kompatibelste Standard, mit dem sich hochwertig Musikmaterial verbreiten läßt. Sie besteht aus einem Kunststoff-Datenträger, auf dem sich spiralförmig eine PCM-codierte Datenspur mir der Länge mehrerer Länge von innen nach außen windet. Diese Spur besteht aus aufeinanderfolgenden Datenblöcken, die das eigentliche Nutzsignal enthalten. Der Datenträger besitzt, damit das Abspielgerät jeden einzelnen Titel finden kann, ein Inhaltsverzeichnis (Table of Content TOC), sowie ein Lead-In und Lead-Out, welche die Außengrenzen der CD anzeigen. Die TOC spielt beim Rippen und bei der Erstellung von Cuesheets eine wichtige Rolle, weshalb sie uns in den entsprechenden Tutorials bzw. im weiteren Verlauf wieder begegnen wird. (Weitere Informationen zu diesem Thema können

einem Beitrag von "Spunky" entnommen werden.)
Als Rippen (herausreißen, trennen) bezeichnet man in erster Linie das digitale Auslesen von Audio-Datenträgern (DAE=Digital Audio Extraction) zum Zweck der Archivierung. Die meist sofort nachfolgende

Codierung in ein entsprechendes Audioformat mittels eines

Encoders wird oftmals im gleichen Atemzug mit diesem Begriff in Zusammenhang gebracht.

An dieser Stelle wird es interessant, bei Recherchen in Sachen Archivierung von Audiodatenträgern und den zur Verfügung stehenden Qualitätsstufen stößt man immer wieder auf den seitens der Industrie verwendeten Begriff der "CD-Qualität". Er wurde in der Vergangenheit (ca. 1997) vom

Fraunhofer-Institut in Bezug auf das MP3-Format in Umlauf gebracht, meint aber erst einmal nur, daß sich das Ergebnis

"genauso gut" wie eine CD anhört. Es wurde damals aber leider vor allem Wert auf das Marketing mit einer 10fachen Kompressionsratio gelegt, um mit der selbstdefinierten "CD-Qualität" gegen den Konkurrenten Real Media bestehen zu können. Die benannte Kompressionsratio entspricht einer Nominalbitrate von 128 kbps und niedriger.

Hochwertiger Klang oder gar

Transparenz waren damals zweitrangig, außerdem wurde der bekanntermaßen maßstabsetzende Klang der CD durch diese plakative Reklame natürlich zweckentfremdet. So verwundert es auch kaum, daß im Rahmen der Microsoft-Reklame später mit WMA diese schwammige Definition "CD-Qualität" sogar schon bei 64 kbps erreichbar war. (Näheres zum historischen Werdegang kann man

hier nachlesen.)

Wer mehr Qualität als die bei 128 oder 64 kbps gebotene erreichen möchte, muß sich also nach einer höheren Qualitätsstufe umsehen. Über kurz oder lang dürfte er durch den von AudioHQ ins Spiel gebrachten Begriff der Archivqualität stolpern. Inzwischen bewegt sich der allgemeine Trend bei den Audiophilen übrigens in Richtung verlustfrei arbeitender Formate (Ratio 1:2), welche die höchstmögliche Klangqualität sichern. Entsprechende Anwendungen aus der Free-, Open Source-, wie auch der kommerziellen Software-Szene und zunehmende Festplattenkapazitäten machen es möglich.

Will man "echte" CD-Qualität, um eine hochwertige Wiedergabe von Sicherungskopien im Vergleich zum Original-Datenträger zu erreichen, so bedarf es keiner Audiokompression. Die CDDA ist seit Anfang der 80er Jahre durch den Red-Book

Standard von Phillips/Sony definiert. Man kann die CDDA einfach per "Image mit

Cuesheet" im "

Secure Mode" mit EAC oder mit den

Plextools rippen. Die so gewonnenen Abbilder einer CDDA können danach sofort wieder

per EAC oder per Plextools als CD-R gebrannt werden. (Siehe auch

hier.)
"Images mit Cuesheet" sind im übrigen mit Foobar2000 und Winamp jederzeit direkt abspielbar.

Hier haben wir auch den Hauptunterschied zu den ebenfalls verbreiteten Images der Klon- und Brennprogramme, deren Abbilder der CD nicht direkt abspielbar sind. Vorraussetzung für die bitgenaue Reproduktion sind eine

Offsetkorrektur des Leselaufwerks und des Brenners. Dieses Verfahren ist vor allem dann ideal, wenn bei kompletten Alben der Schwerpunkt auf der nachfolgenden Erstellung von CD-R gelegt wird.

Angemerkt sei, daß Klonprogramme über keinen

Secure Mode verfügen, weshalb die entstehende Qualität vollständig von den Fähigkeiten des eingesetzten Lese-Laufwerks abhängt.

Wenn man Einzel-Dateien extrahieren möchte, ist eine andere Vorgehensweise nötig. Sie können z.B.

per EAC gerippt werden, was wohl die Mehrzahl der qualitätsbewussten Ripper tun dürfte. WAV-Dateien und das dazugehörige Cuesheet ergeben eine perfekte 1:1 Kopie der CDDA. (Cuesheets sind einfache Text-Dateien, die Brennanweisungen und entsprechende Kommentierungen im formatierten Klartext enthalten). Es lassen sich auch später noch verlustbehaftete Kopien in unterschiedlichen Formaten und Qualitäten erstellen. Sie dienen, wie eine Original-CD auch, als Quelle für das Encodieren und Brennen auf CD-R. Eigene Arrangements, Nachbearbeitungen und Mixes sind ebenfalls möglich und gängige

Praxis. A.W.n. sind diese Gesichtspunkte auch die Hauptmotivation für die Anschaffung eines CD-Brenners.)

Die vorliegenden Dateien sind noch unkomprimiert und verhältnismäßig groß. Es handelt sich um Dateien im WAV-Format (PCM), die eine konstante Bitrate von 1411 kbps bei 16 Bit/44.100 Hz/Stereo besitzen. Eine Minute Musik entspricht in etwa 10 MB, bzw. ein Album ca. 500-700 MB.

[Beitrag von Duncan_Idaho am 11. Dez 2005, 16:44 bearbeitet]

Duncan_Idaho
Inventar

#3 erstellt: 11. Dez 2005, 16:48

Ich überlasse es an dieser Stelle dem Leser dem Niveau der vermittelten Inhalte zu folgen und notwendige Kritik zu üben. Ich bitte aber darum zu beachten, daß alle Beiträge bewusst über gut platzierte fingierte Fehler verfügen, damit der Anschein gewahrt bleibt, daß es sich beim Autor um einen Menschen handelt, der innerhalb seiner Fähigkeiten und des notwendigen Wissens agiert.

Hinweise zur Verbesserung dieser Illusion sind natürlich willkommen. Für das Protokol sei vermerkt, daß es ab diesem Beitrag intressant wird und durchaus fesselnde Inhalte un Erkenntnisse den Leser überaschen könnten. Personen mit ungenügendem Vorwissen ist dieser Text vorzuenthalten, Geheimhaltung somit das Primat der zugegebenermaßen "späten Stunde". Ab hier nähern wir uns durchaus praxisrelevaten Erkenntnissen und Methoden an.

2. Kompromisslos - Lossless Formate

Wenn ausreichend Festplattenplatz vorhanden ist, kann man die verlustfrei (lossless) arbeitenden Encoder nutzen, um Audiosignale um einen gehörigen Prozentsatz reduziert neuzuverpacken. Für das

Taggen der Dateien stehen hier im übrigen auch ausgereifte Funktionen zur Verfügung. Taggen meint, daß die Audiodateien mit ausführlichen "Begeleittexten" versehen werden. Verlusfreie Audiokompression bietet sich insbesondere dann an, wenn die Audiodateien nochmals mit

Editoren,

Softwaremixern oder

Effekten möglichst verlustarm oder gar verlustfrei nachbearbeitet werden sollen. Nach entsprechendem Rippen und entsprechender Wandlung kommen weitere digitale Medien wie etwa DVD/DVD-A, Audio-DVD, Mixes oder Bearbeitungen aus dem Editor/

MIDI/

Sequenzer dafür ebenfalls in Frage. Man sollte diese Kompressionsform immer dann nutzen, wenn man den langen Rattenschwanz an Problemen vermeiden möchte, der mit der verlustbehafteten Variante (mp3. ogg, aac) auf den Nutzer zukommt.

Folgende Beispiele mögen das etwas verdeutlichen: Zum einen denke ich da an die Problematik der lästigen und zeitraubenden Encodierung mit zum Teil unterschiedlich verfügbaren Parametern bei verschiedenen

Encoderversionen, zum anderen an das Problem der Auswahl eines geeigneten Tagging-Standards.

Die von AudioHQ vorgestellten Lossless Formate arbeiten mit Pack-Algorithmen, die speziell für Audiodaten optimiert wurden. Sie verringern per

Prediction die effektiv benötigte Datenmenge auf ca. 50-60% der Originalgröße. Ein durchschnittliches Musikalbum mit 50 min. lässt sich von ca. 500 MB auf einen Platzverbrauch von ca. 230-350 MB verkleinern. Als Anhaltswert ergeben sich 3 Lossless-Alben pro GB. Die neueren Lossless-Encoder unterscheiden sich in ihrer Performanz kaum, weshalb vor allem Gesichtspunkte wie Bedienung, Tagging und andere Kriterien bei einer entsprechenden Bewertung herangezogen werden müssen, um überhaupt Unterscheidungemn zu treffen. Alle neueren Lossless-Encoder sind außerdem schneller als z.B. der LAME- oder Vorbis-Encoder. Lossless besitzt den Vorteil der Zeitersparnis beim Erstellen umfangreicher Sammlungen. Übrigens ist es auch möglich, innerhalb eines Lossless-Archivs jedes Album nachträglich durch eine Lossy-Kopie zu ersetzen, um Speicherplatz freigeben zu können. Eine bitidentische Reproduktion steht darüber hinaus auch zur Verfügung. Daher kann man dann auch ohne Probleme nachträglich von einem Lossless-Format zum anderen verlustfrei wechseln, man ist also nicht festgelegt welchen Encoder und welches Dateiformat man aktuell verwendet.

Populär sind folgende Formate

APE/MAC: Monkey's Audio

FLAC: Free Lossless Audio Codec

Apple Lossless

Real Audio Lossless

Windows Media Audio Lossless

Wem diese Platzersparnis noch nicht reichen sollte, der kann mit den verlustbehafteten Formaten (Lossy) noch einen Schritt weitergehen. Mehr darüber im nächsten Teil der Serie.

Duncan_Idaho
Inventar

#4 erstellt: 11. Dez 2005, 17:15

3. Kompromisse - verlustbehaftete Formate oberhalb der Transparenzgrenze

Bei verlustbehafteter Codierung werden zusätzlich zu den in

Teil 2 genannten Packmethoden Erkenntnisse der

Psychoakustik benutzt, um einen reduzierten Platzverbrauch über eine möglichst niedrige

Nominalbitrate herzustellen. Sie nutzt hierfür die Ergebnisse mehrjähriger Forschung und unzähliger Hörtests, um mit Hilfe

psychoakustischer Modelle das Signal von Inhalten zu befreien, die, vom Hörsinn des Menschen nicht wahrgenommen werden können. Ziel aller verlustbehafteten Komprimierer ist letztendlich die effektive Transmission. Effektiv im Sinne möglichst kleiner Bitraten bei einem Maximum an möglicher Übertragungsqualität. Die Klangqualität wird hierbei in mehreren Stufen

anhand der Anzahl der auftretenden Kompressionsartefakte von "Imperceptible" bis "Very Annoying", also von "unhörbar" bis "extrem störend", eingestuft . Auf eine bitidentische "Wiederherstellung der Originaldateien" muß allerdings bei Lossy verzichtet werden. Hier kommt als Maßstab für die Qualität die Eigenschaft der

Transparenz ins Spiel. Transparenz ist die Umschreibung für eine Klangqualität, bei der der Hörsinn keine Unterschiede zum Original wahrnehmen kann. Einmal herausgerechnete Daten und Inhalte können natürlich nicht wiederhergestellt werden. Durch den Encodierungsprozess hinzugekommene Artefakte können ebenfalls nicht wieder entfernt werden. Beim Decodieren werden die Lossy-Dateien lediglich aus dem entsprechenden Format ins brennerkompatible WAV-Format umgeschrieben, der hörbare Inhalt bleibt aber identisch mit Inhalt der Lossy-Datei.

Erklärtes Ziel der letzten Jahre fast aller Entwickler von verlustbehafteten Formaten ist es, generell Transparenz zu erreichen. Ausnahmen sind nur die "Light-Formate", die ich später noch erkären werde. Darüber hinaus gehen alle Optimierungen in Richtung einer möglichst niedrigen Nominalbitrate. Transparent codierende Encoder erreichen ungefähr eine Verringerung des Datenaufkommens auf eine Ratio von 1:7. Das entspricht nominal 200 kbps VBR oder ca. 71-75 MB für ein 50 min. Album, entsprechend 12 Alben pro GB. Selbstverständlich empfehlen sich die optimierten Einstellungen der jeweiligen Codec-Entwickler und die fortschrittlicheren

variablen Bitraten (VBR). Dies ist sehr komfortabel, weil es dem Encoder überlassen bleibt, unter Verwendung der Entwickler

-Presets die optimale Bitverteilung passend zum Eingangssignal zu finden, was im Ergebnis die höchstmögliche Qualität ergibt. Durch dieses Vorgehen vermeidet man Problemsamples, störende Artefakte, Preechos und Verzerrungen. Insbesondere der Musepack-Codec wird für sein psychoakustisches Modell oft von Fachleuten als Referenz bezeichnet und von mir als Lossy-Archivformat empfohlen. Die einzelnen Lossy Formate werden

hier ausführlich erklärt, weshalb ich an dieser Stelle auf Vor- und Nachteile einzelner Formate nicht näher eingehen möchte.

Populär sind die folgenden Lossy Formate.

MPC:

Musepack

Ogg:

Ogg-Vorbis

MP3:

MPEG 1 Layer 3

Firmenformate:

AAC:

Advanced Audio Codec

M4A: Ahead Nero AAC

WMA Pro:

Windows Media Audio mit variablen Bitraten

Archivqualität ist gewährleistet, solange bewußt transparent von einer Original-CD gerippt und encodiert wird. Diese Audiodateien sollten nicht als Quelle für das Erstellen weiterer verlustbehafteter Kopien mittels

Transcodieren/Reencodieren dienen, da

Generationseffekte auftreten können.

Wenn sich dies nicht vermeiden läßt eignen sich diese Kopien allenfalls für portable Player. Generationseffekte sind vergleichbar mit der zunehmenden hörbaren Verschlechterung einer Musikkassettenkopie, wenn man sie von einer Kopie anstatt dem CD-Original erstellt, analog zu den sichtbaren Verschlechterungen beim mehrfachem Fotokopieren.

Einschränkungen in der Funktionalität erlebt der Nutzer derzeit nur beim verbreiteten MP3, welches

Gapless Playback ausschließlich innerhalb von Foobar2000 in Kombination mit LAME-encodierten Dateien unterstützt. Benutzt man andere Software, so wird beim Titelwechsel ein technisch bedingter störender Aussetzer produziert. Dieser Mangel wird hörbar bei Live-CDs, Mixes oder Klassikaufnahmen und kann beim Abspielen mit anderen Software- oder

Hardwareplayern nur durch Manipulationen wie Crossfading (Überblendung) oder Buffering (Pufferung) kaschiert werden. Beim Brennen auf CD-R tritt er übrigens auch wieder zu Tage, auch wenn man im Brennprogramm die Pausen-Einstellung auf 0 gesetzt hat. Nachfolgend im Originalton das Statement eines Herstellers zu seiner "Lösung" dieses Problems, welche er auch noch schlichtweg frech als Feature verkauft:

Homogene Übergänge: iTunes überblendet die Musik, um homogene Übergänge zwischen den einzelnen Songs zu erreichen, und passt die Lautstärke der Songs für eine konsistente Wiedergabe an.

Der in iTunes integrierte Überblender ersetzt keineswegs funktionierendes Gapless Playback, denn die von den Musikern bei Konzeptalben eingefügten Übergänge werden durch Crossfading vollständig entstellt. Als populäre Beispiele mögen diverse Pink Floyd-Alben dienen. iTunes AAC und WMA haben ebenfalls wie das angesprochene MP3-Format dieses Problem. Nur Ogg-Vorbis und Musepack ermöglichen derzeit ein durchgehendes Gapless Playback. Die entsprechenden Mängel werden m.E. in den Postings von

Frank Klemm recht gut zusammengefasst. Generell sind alle populären Formate zueinander inkompatibel. Dies bedeutet, daß ein MP3-Hardwaredecoder keine Vorbis-Dateien abspielen kann und umgekehrt. Ein Musepack-Encoder kann demnach also auch keine MP3-Dateien erstellen.

Wenn man die öffentlich zugänglichen Diskussionen um die Formate verfolgt, kann man feststellen, daß der Entwicklungshöhepunkt von MP3 mit den Encodern des

LAME-Projektes (bei gleichzeitiger millionenfacher Nutzung eines ausgereiften und kostenlos erhältlichen Produktes) längst überschritten ist. Der seitens der Industrie gehypte Nachfolger Mp4/AAC/MPEG4 hinkt mit erheblichen Rückständen und Defiziten den bereits etablierten Mitbewerbern hinterher und bringt kaum Vorteile. AAC wird erst in einigen Jahren das zweifelsohne vorhandene Potential ausschöpfen. Das

Musepack-Format ist seit Jahren technologisch führend, weil es konsequent auf VBR, also qualitätsorientiertes Bitratenmanagement setzt und durch unzählige Hörtests genügend erforscht wurde. Das Ogg-Vorbis Format empfiehlt sich ebenfalls als Allrounder für die Zukunft und bietet bereits Hardware-Unterstützung. Für beide existiert sogar Unterstützung innerhalb des Rockbox-Projektes welches Open Source Firmware für portable Player anbietet.

Nimmt man zusätzlich zur Transparenz die Vermeidung deutlich hörbarer Pausen bei Titelübergängen und

flexibles Tagging als Beurteilungskriterien für eine "Archiv-Qualität" in die Liste der Qualitätskriterien auf, so bleiben derzeit nur noch Ogg-Vorbis, LAME-mp3, Musepack und Nero AAC übrig. Da aktuell fast nur PCs die genannten Merkmale überhaupt nutzen können, empfehlen ich die rechnerbasierte Archivierung.

Will man mit Lossy Formaten Archive aufbauen, so genügt es schon, folgende Minimal-Presets zu beachten:

Musepack = quality 5
LAME = --alt-preset standard oder -V 2
Ogg-Vorbis = Q6

(Siehe auch

hier.)

Presets oberhalb dieser Grenzen führen nicht zwingend zu hörbaren Verbesserungen und sind meist der Kategorie Platzverschwendung zuzurechnen. Möglicherweise könnte man die Hirntot- und Extreme-Presets sogar abschaffen. Sie stiften Verwirrung und führen die eigentliche Daseinsberechtigung von Lossy (nämlich effektive Transmission und Platzersparnis) ad absurdum. Sie werden unreflektiert von Nutzern verwendet, die glauben, "mehr bringt mehr", ohne sich wirklich der Gründe für genau diese

Presetwahl bewußt zu sein.

Der Grund:
Wenn ein Format mit einer bestimmten Art von Musik oder Samples Probleme hat, dürften sich i.d.R. dementsprechende Fehler meist auch bei der Nutzung höherer Encoder-Presets bemerkbar machen. Es genügt nicht, einfach nominal + 40 bis 80 kbps per höherer Preset-Einstellungen zur Verfügung zu stellen. In solchen Fällen sollte man eher überlegen, ob nicht einfach die Wahl eines anderen Lossy-Codecs die bessere Alternative darstellen könnte, weil dort vielleicht keine oder wenigstens weniger Probleme als beim ursprünglich favorisierten Codec auftreten. Entsprechend den Ergebnissen der mir aktuell bekannten Hör- und Vergleichstests habe ich jeweils die Minimalqualitäten im Artikel angegeben, die meist identisch zu den empfohlenen Standard-Presets der Entwickler sind und zu Archivqualität führen. Sie geben den aktuellen Stand Dezember 2005 wieder.

Für Ergebnisse unterhalb der Transparenzgrenze mittels anderer und exakterer Einstellungen des jeweiligen Encoders gibt es allerdings durchaus Gründe, um z.B. den Anforderungen einer von der Industrie

aufgezwungenen Kompatibilität mit Billig-Hardware (CBR-Presets) oder einer bestimmten Dateigröße (ABR-Presets) für portable Player (unter hörbaren Verlusten) entsprechen zu können.

Duncan_Idaho
Inventar

#5 erstellt: 12. Dez 2005, 00:23

4 Kompromisse - Lossy Formate unterhalb der Transparenzgrenze

Unterhalb der mit Blindhörtests feststellbaren Transparenzgrenze verschwimmt die Gegenüberstellung verschiedener Formate in Subjektivität und persönlichen Vorlieben. Jeder kann sich sein Wunschformat aussuchen. Vor- und Nachteile lassen sich argumentativ so hinbiegen, wie man es denn möchte. Irgendwie überzeugend ist jede Argumentationskette, wobei hier vor allem der Sympathiefaktor ein recht wichtiges Entscheidungskriterium zu sein scheint. Lizenz- und patentrechtliche Aspekte mögen ebenfalls eine Rolle spielen. (Letztgenannte sind übrigens auch nicht ganz unwichtig, wenn Entwickler ihre Software quelloffen (

Open-Source) oder als

Freeware einer

Wissensallmende zur Verfügung stellen möchten.)

Wenn man in öffentlich zugängliche Diskussionen diese subjektiven Sympathiefaktoren herausfiltert, dann gibt es kein Kriterium, mittels dessen man Formate unterhalb der Transparenz differenzieren kann.

Die resultierenden Dateigrößen unterscheiden sich nur minimal.

Die Funktionalität aller Formate ist nahezu identisch.

Klanglich liegen fast alle Formate sehr nahe beieinander, so man vergleichbare Qualitätsstufen (Bitraten) verwendet.

Generell bietet MP3 die größte Hardwaredecoder-Kompatibilität und wird derzeit breit von Hardwareherstellern unterstützt. Diese Unterstützung ist zwar zu oft minderwertig implementiert und beschränkt sich auf reines Wiedergeben, aber wenigstens ist sie vorhanden. Aktuell gibt es noch keine wirklich zufriedenstellende HIFI-Lösungen (Hardware), die Gapless Playback,

flexibles Tagging und durchgehende VBR-Kompatibilität garantieren.

Hardware-Unterstützung für Ogg-Vorbis ist ebenfalls erhältlich und von durchgängig hoher Qualität, aber nicht im Billig-Segment vertreten, da es sich um Produkte handelt, welche ohnehin nur von qualitätsbewußten Käufern erworben werden.

Generell bietet Musepack die höchste Gesamtqualität bei computerbasierter Wiedergabe. Erst recht, wenn man

flexibles Tagging und Gapless Playback als Qualitätsmerkmal hinzunimmt.

Zukünftig wird sich das Thema "Hardwareunterstützung" komplett erledigen, weil die Miniatur-PCs, Tablet-PCs, PIM und Handhelds die mobile Wiedergabe übernehmen werden. Dies wird möglich, weil bei dieser Gerätekategorie die Leistungsfähigkeit sehr schnell in den 500 Mhz-Bereich ausgeweitet wurde.

Link. Insgesamt drängen pcbasierte Lösungen in den Hifibereich.

Mitunter behaupten einige nimmermüde Journalisten und Firmen, daß "gleicher Klang bei halber Dateigröße" oder "doppelte Spielzeit bei gleichem Klang" oder

ähnliches möglich seien. Werbeversprechen dieser Art zeugen von ungenügender Kenntnis kaum veränderbarer Zusammenhänge oder einem gehörigen Maß an Ignoranz zugunsten unseriösen Marketings, weshalb man Mengenangaben für die Aufnahmekapazität von portablen mp3-Geräten auch grundsätzlich mißtrauen sollte. "Doppelte Spielzeit" ist physikalisch unmöglich und beruht auf einem Missverständnis der verlustbehafteten Audiokompression und dem unzulässigen Umkehrschluß, daß bei sinkenden Bitraten unbegrenzt hörbar die hohe Qualität beibehalten werden könnte. Das Marketing funktioniert sogar, weil sich die Konsumenten keine umfangreichen Test-Serien geben, um diese Behauptungen zu überprüfen. Defacto führen aber gleiche Bitraten unabhängig vom verwendeten Format zu ähnlichen Dateigrößen. Entsprechend kann aber nur durch Reduzierung der Bitrate (zB -25 %) ein nennenswerter Einfluß auf die resultierende Dateigröße genommen werden, zumal die ohnehin schon beachtlichen Leistungen der gängigen Formate sich sehr ähneln. Ein Formatwechsel unter dieser Prämisse bleibt deshalb ergebnislos, wenn er nur einer kleineren Dateigröße dienen soll. Als Resultat könnten dann zwar statt 10 Titeln 11-12 Titel auf dem selben Raum gespeichert werden, allerdings mit dem erhöhten Risiko hörbarer Kompressionsartefakte.

Die aktuell erhältlichen Formate sind aber bereits allesamt so optimiert, daß kaum Spielräume verbleiben, um die Bitraten abzusenken. Mit steigender Bitrate wird die Mehrzahl der Formate mit Ausnahme der Problemsamples bei gewöhnlicher Musik zwischen nominal 160 und 200 kbps transparent. Bei sinkender Bitrate steigt das Risiko, unterhalb von 200 kbps die meist für die Archivierung erwünschte Transparenz zu verlieren. Unterhalb 160 kbps nehmen Artefakte, Pre-Echos und Verzerrungen bei den uns bekannten Formaten

expotentiell zu und sind schon allein aufgrund ihrer Anzahl hörbar, sodaß man kaum noch von Musikgenuss bei der Wiedergabe auf einer gewöhnlichen HIFI-Anlage sprechen kann. Eine Ausnahme stellt Musepack dar, welches selbst bei Q4 noch eine hohe Performanz bietet. Erstaunlicherweise gewinnt es Hörtests bei gewöhnlicher Musik selbst im extrem kritischen Bereich zwischen 128-160 kb/s und deklassiert die Mitbewerber. Diese Fähigkeit sollte allerdings im Einzelfall mit dem gewünschten Album überprüft werden. Eine solche Einzelfall-Prüfung kann man sich aber auch sparen und unter Verwendung des nächsthöheren Q5 (-standard) Presets Transparenz erreichen.

Bei transparent encodierten Dateien unterschiedlicher Formate ist keine nachvollziehbare Unterscheidung möglich. Es ist demnach egal, ob ein Anwender ein Album in Lame MP3, Ogg-Vorbis oder Musepack erstellt. Deshalb genügt auch das Lame-MP3 Format den meisten Anforderungen an Archivqualität. Außerdem besteht für den Nutzer keinerlei Update-Zwang, solange nicht in den nächsten Jahren sämtliche mp3-fähigen Geräte gegen aac-fähige ausgetauscht werden. Letztlich bleibt aber bei Lossy immer eine Restunsicherheit, ob die hörbare Qualität der Audiodateien wirklich identisch mit der des Quelldatenträgers ist.

Glücklicherweise werden kleine Dateigrößen nur für Anwendungen benötigt, bei denen es nicht auf eine Transparenz ankommt oder bei denen aufgrund der Wiedergabebedingungen bereits bei nominal 128 oder 96 kb/s selbige erzielt wird, wie etwa bei MP3abspielenden Handys, USB-Sticks und Ghettoblastern. Entsprechend kann hier der Konsument z.B. ein 128 VBR oder 96 VBR Preset verwenden, wenn eine möglichst große Abspieldauer gewünscht wird. Für diese Geräteklasse genügt die von der Industrie definierte "CD-Qualität" also völlig, für HiFi hingegen ist sie indiskutabel.

Unterhalb nominal 128 kbps/stereo gibt es noch die "Light-Formate" AACplus, MP3Pro und Vorbis (Q0/Q1). Sie stellen optimierte Sonderfälle dar und sind für den Einsatz auf Handys, WebRadios, MP3-Portables wie auch das Netzwerk-Streaming entwickelt worden. Wer diese Formate für das Archivieren verwendet, befindet sich weitab von unserem Thema. Er wird feststellen, daß ihnen die erforderliche Güte fehlt, wenn man sie auf einer HIFI-Anlage wiedergibt. Auf Computerboxen ist vielleicht noch kein Unterschied hörbar, aber bereits mit Mittelklasse-Kopfhörern sollten Unterschiede wahrnehmbar sein. (Wenn nicht, wäre dringend ein Termin beim HNO-Arzt angesagt. Es könnte da eine hohe Toleranz gegenüber hörbaren Artefakten eingesetzt haben, was nicht ungewöhnlich wäre. "

Selektives Hören" kann nämlich auch kulturelle Hintergründe haben und wird oftmals durch

Konditionierung und (Auto-)Suggestion bei untrainierten Hörern beeinflußt.) Der größte Faktor der Hörtests beeinflusst ist aber die Erwartungshaltung und der Sympathiefaktor. Steht man komprimierten Formaten schon negativ gegenüber, so wird man natürlich auch beim "simplen Vergleichshören" ohne ABX negative Testergebnisse erzielen und Unterschiede hören, wo keine sind.

Überprüfen wir nun aber die aus der Produkt-Reklame einiger kommerzieller Formate stammenden Zitate und halbieren rechnerisch die Bitrate unterhalb einer festgestellten Transparenz bei einem Musikstück, um eine Halbierung der Dateigröße zu erhalten: Das wären dann Audiodateien mit einer Nominalbitrate von 70-80 kb/s VBR, die eigentlich allenfalls als Futter für den PC-Papierkorb taugen. Ohne eine meist patentpflichtige Hardwareunterstützung (MP3pro, AACplus, Atrac3plus) oder Tricks, wie etwa den

SBR-Modus, funktioniert hier nichts, um einen erträglichen Klang trotz konstant hörbarer Verzerrungen zu erreichen. Eine Ausnahme bei Bitraten dieser Größenordnung stellt Ogg-Vorbis dar, welches durch Optimierungen relativ erträglich bleibt und anhörbare Dateien erstellt, ohne die Finessen nachträglicher Hardwareunterstützung oder Tricks bei der Wiedergabe zu nutzen. Dennoch bieten die lizenz- und patentpflichtigen SBR-Formate einen hörbaren technischen Vorteil, sobald die Bitrate gleich oder kleiner als 64 kbps ist.

Eine Halbierung der Dateigrößen oder eine Verdopplung der Spieldauer ist somit schlichtweg unmöglich; jedenfalls nicht ohne hörbare gravierende Qualitätsverluste. Jedwede Erstellung von Audiodateien unterhalb der Transparenzgrenze basiert ausschließlich auf der Kompromissbereitschaft des Hörers und den Rahmenbedingungen der Wiedergabe. Auch durch Formatwechsel sind keinerlei Platzgewinne ohne hörbaren Qualitätsverlust möglich.

Duncan_Idaho
Inventar

#6 erstellt: 15. Dez 2005, 21:34

5. Zusammenfassung

Hier noch einmal die wesentlichen Inhalte des Artikels.

Archivqualität ist mit bitidentischen 1:1 Secure-Mode-Kopien zum rippen können EAC (mit AccurateRip), dBpowerAmp (mit AccurateRip) und die Plextools benutzt werden. AccurateRip gibt zusätzliche Sicherheit durch den Vergleich der Ausleseergebnisse mit anderen Benutzern. Lossless-Komprimierung und Lossy oberhalb der Transparenzgrenze bieten qualitätsorientiertes Encodieren und eine gengend hohe Qualität um ein Archiv anzulegen. Als Kriterien für die Formatwahl spielen die Unterstützung durch Hardware-Decoder, der Wunsch nach Gapless Playback oder die Software-Unterstützung durch das jeweilige Betriebssystem eine wichtige Rolle. Die Herstellung einer CD-R aus einem Archiv ist problemlos möglich. Sie besitzt dann ebenfalls Transparenz. Losslessencodierte Dateien können außerdem als Quelle für die weitere Bearbeitung benutzt werden.

Klon- oder Burst-Mode-Brennprogramme (iTunes, Windows Media Player etc) können keine bitidentischen Kopien garantieren, sondern lesen oberflächlich den ISO-Layer einer CDDA aus und sind nicht in der Lage, den originalgetreuen Inhalt zu extrahieren. Sie geben dem Nutzer auch keine Rückmeldung bei Fehlern. Die Erstellung von Burst-Mode-Images hat nichts mit dem Feld der Audiokompression und hochwertiger digitaler Audio Extraction zu tun, denn sie dienen der "quick and dirty"-Reproduktion für mobile Zwecke (z.B. für ein Autoradio) oder zum Klonen kopiergesperrter Werke.

Lossy Kopien unterhalb der Transparenzgrenze und Klon-Kopien von CDDA und CD-R erfüllen Qualitätskriterien nicht, weshalb es sich hier um Verbrauchsmaterial handelt. Nutzer aus der Fun-Fraktion und Kopierbörsennutzer werden eventuell zufriedengestellt, weil sie auf wenig Platzverbrauch und größtmögliche Kompatibilität zum Freundeskreis und zu preiswerter mp3-Hardware Wert legen. Dieses Material ist als Quelle für eine Weiterverarbeitung in Form von Reencodierung oder Transcodierung ungeeignet, weil die zusätzlichen Transcodierverluste zu den bereits hörbaren Kompressionsartefakten und Extraktions-Fehlern hinzukommen und sich summieren. Verbrauchskopien für portable Abspielgeräte, Auto-HiFi und (Billig-)Hardwaredecoder können damit aber mit akzeptablen Ergebnissen erstellt werden.

Jeder Nutzer muß für sich selbst entscheiden, ob er Archivqualität nutzen möchte, bekommt dafür aber ein hohes Maß an Zukunftssicherheit und kann auf Jahre davon ausgehen, daß er einen Audiodatenträger nur einmal anfassen muß, um ihn auf die Festplatte zu rippen. Ein geringfügig höherer Zeitaufwand ergibt sich nur einmal beim Rippen der CD durch die Benutzung des Secure-Mode oder ähnlicher Verfahren. Eventuell ist bei Lame/Ogg-Vorbis die Encodierdauer etwas höher. Dieser Nachteil kann jedoch z.B. durch die Wahl des Musepack Encoders wegen dessen Geschwindigkeitsvorteils ausgeglichen werden.

Die Qualität eines Archives wird nicht durch die Wahl eines "Wunderformates" bestimmt, sondern durch die Art der Erstellung. Preset- oder gar Formatwechsel sind nicht nötig, wenn bei der Erstellung von vornherein auf Transparenz geachtet wird. Dies sorgt dann auch für einen einmaligen Zeit- bzw. Arbeitsaufwand, der später bei einem eventuellen Formatwechsel nicht noch einmal komplett aufgebracht werden muß. Es entsteht übrigens kein Vorteil durch den Wechsel von einem transparenten MP3- zu einem transparenten AAC-Archiv, der zu einem technisch bedingten Update zwingt.

Aus meiner Sicht eignen sich vor allem Musepack, Ogg-Vorbis, FLAC und LAME-mp3 als Formate für die Archivierung. (Dies gerade auch im Hinblick auf die existierende Wissensallmende und die Vermeidung der Folgen von so genannten

Software-Patenten.) Die Albenordner eines Archivs können mit Liedtexten (Lyrics), Videos, Artikeln und

Coverscans aufgewertet werden, was dazu führt, daß das Archiv in der Präsention dem Erscheinungsbild eines wohlgefüllten CD-Regals entsprechen kann. In Bezug auf Kriterien wie Suchgeschwindigkeit, Gapless Playback, Zugriffszeiten, Ausbaumöglichkeiten und Komfort beim Abspielen, sind vom jeweiligen Benutzer zusammengestellte computerbasierte Archivlösungen den Fertigprodukten aus dem Consumer-HIFI-Bereich deutlich überlegen.

Aus dem bisher Vorgetragenen ergibt sich folgende Reihung hinsichtlich der hörbaren Qualität encodierter Audiodateien:

# Archivqualität = transparente Lossy und Lossless Dateien

# CD-Qualität = nicht transparente Lossy Dateien

# Light-Qualität = nicht transparente Lossy Dateien für Streaming und portable Lösungen (meist unter Zuhilfenahme von SBR oder Optimierungen für niedrige Bitraten

# Minderwertig = Dateien unbekannter Herkunft, wie z.B. Filesharingdateien, transcodiertes Material oder Mitschnitte von Radiostreams/Line-IN

Weiterhin ergibt sich folgende Reihung hinsichtlich der hörbaren Qualität von per DAE ausgelesenen Audiodateien:

# Archivqualität = mit EAC per Secure Mode ausgelesen, mit DBpowerAmp unter Verwendung von Accurate Rip ausgelesen, mit Plextools ausgelesen, mit CDparanoia unter Linux ausgelesen,

# CD-Qualität = Klonkopien, Audiograbber, CDex, iTunes, Musicmatch, Windows Media Player, Real Player, ...

# Minderwertig = Dateien unbekannter Herkunft, z.B. per Filesharing

Die seitens

Real Audio,

Nullsoft und Apple gepushten AAC-Formate bringen aktuell keine spürbaren Verbesserungen mit sich. Bisher bietet MP3 gegenüber AAC sogar noch Vorteile. Hier funktionieren mit LAME-mp3 und Foobar2000 die lückenlose Wiedergabe, das Replaygainen und das Brennen. Das Taggen von mp3 würde sich deutlich verbessern lassen, wenn die entsprechende Hard- oder Software APE2-Tags verarbeiten könnte. Entsprechend ausgestattete PCs sind deshalb aktuell allen verfügbaren HIFI-Geräten überlegen. Nur mit einem PC/Mac mit direktem Anschluss an die HIFI-Anlage lassen sich alle gebotenen Features nutzen, wie auch gleichzeitig die größtmögliche Audioqualität erreichen.

Abschließend kann man natürlich noch die besprochenen Qualitätsstufen sinnvoll bestimmten Geräteklassen zuordnen. Das sähe dann so aus:

# Rechnerbasierte Audiowiedergabe mit direktem Anschluss an die HIFI-Anlage = Archivqualität und CD-Qualität

# mp3-fähige DVD-Player und großvolumige portable Player mit HD = CD-Qualität und Light-Formate

# Flashplayer, USB-Sticks, Webradio und Handys = Light-Formate

Nun stellt sich natürlich noch die Frage, wie die Codec-Landschaft und die entsprechende Verbreitung der hier favorisierten Audioformate wohl ausschauen würden, wären die Gratis-Encoder mit ähnlich großen Werbeetats, Anzeigen und teilweise dauerpräsenten Beiträgen in der Computerpresse gefördert worden. Interessanterweise wurden z.B. Ogg-Vorbis und Musepack nie beworben, aber trotzdem haben sich diese Formate etabliert. Die Gründe für den Erfolg liegen hier m.E. vor allem in der Mund-zu-Mund-Propaganda und in der Art und Weise, wie Entwickler und Nutzer miteinander kommunizieren. Die Entwickler- und Unterstützergruppen stehen den Anwendern recht nah, da Foren oder Diskussionsplattformen, wie etwa

Hydrogenaudio, es ermöglichen, auf Anregungen und Fehlermeldungen zu reagieren. Diese Entwicklungs- und Supportkonzepte haben zu rasanten und hervorhebenswerten Ergebnissen geführt, insbesondere im Bereich LAME-mp3. Der Wettkampf der Ideen zwischen Freier Software und der mit dem Ziel der Profitmaximierung produzierten, bleibt demnach weiterhin spannend und beobachtenswert.

Anhang, Quellen, weiterführende Literatur

[Beitrag von Duncan_Idaho am 15. Dez 2005, 21:34 bearbeitet]

Suche: