Was sind MP3, AAC, WMA und Co?
Codecs. Dabei handelt es sich um ein schönes internationales Wort, das sich aus den englischen Begriffen Encoder und Decoder zusammensetzt. Ins Deutsche könnte man den Begriff vielleicht mit Ver- und Entschlüsseler oder Komprimierer und Dekomprimierer übersetzen. Doch MP3 und Co. lassen sich noch genauer typisieren: Sie sind so genannte „lossy Codecs“, auf deutsch verlustbehaftete Ver-und Entschlüsseler. Um Platz zu sparen gehen bei ihrer Verwendung Klanginformationen verloren,. Und das unterscheidet sie im Wesentlichen von anderen Platzsparern wie „.zip“- „.rar“- oder „.hqx“-Dateien. Diese Datei-Kompressoren packen Daten geschickt, beim Auspacken werden die Dateien aber wieder vollständig rekonstruiert.
MP3, AAC und WMA werden auch „perceptual Codecs“ genannt, denn sie arbeiten mit unserer Wahrnehmung, besser gesagt: Sie nutzen die Schwächen unseres Gehörs, um Daten zu sparen. Aus diesem Grund ist es auch ziemlich sinnlos, den Verlusten in MP3-Dateien mit Audio-Messgeräten zu Leibe zu rücken. Die finden zwar heraus, dass der Codec etwas weglässt, aber das bestreitet ja auch niemand. Ohne Weglassen gäbe es nämlich keine Platzersparnis. Ob der Codec unser Gehör erfolgreich hinters Licht führt, lässt sich nur in einem Hörtest ermitteln.
Der Vollständigkeit halber will ich hier auch „lossless Audio Codecs“, etwa FLAC (Free Lossless Audio Codec) oder Apple Lossless nennen. Diese Codecs versprechen, dass die Kompression zu keinerlei Klangveränderungen führt.
Apropos Kompression: Wenn dieser Begriff im Zusammenhang mit Codecs verwendet wird, ist damit die Stauchung der Dateigröße gemeint und nicht die Dynamikbegrenzung von Musik durch Kompressoren oder Limiter.
Die Qualität verlustbehafteter Codecs bemisst sich zunächst einmal an der Bitrate, die in kbps (Kilobit pro Sekunde) angegeben wird. Somit trifft man beim Erstellen einer MP3-Datei schon die wesentlichste Entscheidung: Wähle ich eine geringe Bitrate, um Platz zu sparen? Oder eine höhere für bessere Klangqualität? Um das Zahlenspiel zu verdeutlichen ein Beispiel: Eine Minute Stereomusik im CD-Format (16 Bit, 44,1 kHz) erzeugt eine Datei, die etwa 10 Megabyte groß ist. Das entspricht einem Datendurchsatz von ungefähr 1411 Kilobit pro Sekunde. Typische MP3-Dateien arbeiten mit 128 kbps, reduzieren die Datei also auf weniger als ein Zehntel ihrer ursprünglichen Größe. Zum Vergleich: Lossless Audio Codecs verkleinern einen Song häufig auf 70 bis 80 Prozent der ursprünglichen Größe. Das ist schon ein erheblicher Unterschied.
Nur zur Info nebenbei: In seltenen Fällen können sogar normale Dateikomprimierer wie „.zip“ und „.rar“ Platzersparnis bei Audiodateien bringen. Zum Beispiel dann, wenn ich die Einzelspuren einer Mehrspur-Produktion an einen Freund schicken möchte. Alle unbespielten Stellen der Spuren (digital Null) werden beim Komprimieren eingespart, sind nach dem Auspacken aber wieder da. Bei normaler Stereo-Musik bringen diese Datei-Komprimierer jedoch so gut wie nichts.
MP3-Dateien müssen aber nicht zwingend mit einer festen Bitrate gestaucht werden. Das Zauberwort in diesem Zusammenhang heißt VBR (variable Bitrate) und ist recht clever: Bei der Analyse schaut der Codec nach, wie komplex die Musik strukturiert ist und passt die Bitrate der einzelnen Zeitabschnitte individuell an. Komplexe Stellen bekommen viele Bits, einfachere weniger. Aufgrund dieser Flexibilität erreicht VBR in der Regel die beste „Klangqualität-zu-Dateigröße-Bilanz“. Bei manchen Programmen lässt sich einstellen, ob die VBR-Kodierung mit hoher oder mittlerer Qualität erfolgen soll, bei anderen stellt man die höchste und niedrigste zu verwendende Bitrate ein. Einziger Nachteil von VBR: Nicht alle MP3-Player können Dateien mit variabler Bitrate abspielen.
Für dich ausgesucht
Sind WMA und AAC das gleiche wie MP3?
Im Prinzip ja, es gibt nur kleine technische Unterschiede. Es würde allerdings den Rahmen dieses Beitrags sprengen, die Differenzen herauszuarbeiten. AAC war als Nachfolger für MP3 gedacht, konnte dieses Ziel aufgrund der starken Verbreitung von MP3 aber nicht erreichen. WMA ist eine Eigenentwicklung von Microsoft und in vielerlei Hinsicht mit den Fraunhofer-Entwicklungen MP3 und AAC vergleichbar. Selbstverständlich lässt sich trefflich darüber streiten, welcher Codec bei welcher Bitrate die besten Ergebnisse bringt.
In der Praxis ist die Entscheidung längst gefallen: MP3 hat mit riesigem Abstand die größte Verbreitung. Seit Online-Musikläden Titel ohne Kopierschutz verkaufen, hat sich auch hier das MP3-Format auf breiter Front durchgesetzt. AAC wird in Apples iTunes Store verwendet – immerhin der Marktführer beim Musikverkauf online. Außerdem ist AAC Teil des MPEG-2-und 4-Standards, wird also auch vielfach als Format für den Filmton verwendet. WMA ist hingegen ein eigener Standard von Microsoft und schon deshalb weit verbreitet, weil der Windows Media Player auf diesen Codec voreingestellt ist. Trotz der nicht gerade unbedeutenden Lobby für AAC und WMA bleibt jedoch MP3 der ungekrönte König beim Nutzer.
Zur qualitativen Einschätzung nur soviel: Es gibt Unterschiede zwischen MP3, WMA und AAC. Ich persönlich halte sie allerdings für minimal. Wenn ich selbst Musik kodiere, wähle ich in aller Regel MP3. So ist sichergestellt, dass jeder Kunde oder Freund die Datei hören kann. Kompatibilität ist eben ein extrem wichtiges Kriterium, in vielen Fällen wichtiger als das allerletzte „Mychen“ Klangqualität, das AAC und WMA mehr bieten können (je nach Bitrate).
Wie funktioniert MP3?
Unkomprimierte Audiodateien, die uns in der Regel als WAV- oder AIF-Dateien über den Weg laufen, speichern mehr Informationen als unser Hirn verarbeiten kann. Sind zwei Töne sehr ähnlich, kann es sein, dass unser Gehirn nur einen davon wahrnimmt. Sind die Noten zwar sehr verschieden, aber die eine ist wesentlich lauter als die andere, ist es möglich, dass wir den leiseren Ton nicht hören. Außerdem reagiert das menschliche Gehör nicht auf alle Frequenzen im hörbaren Spektrum (20 Hertz bis 20000 Hertz) gleich empfindlich. Diese Phänomene des Hörens werden Psychoakustik genannt und seit langem erforscht.
Es gibt also zahlreiche Tabellen und mathematische Modelle, die das menschliche Hören detailliert beschreiben. Beim Encoding einer MP3-Datei wird das eintreffende Audiosignal analysiert und ebenfalls in mathematische Muster umgewandelt. Diese können nun mit den im Encoder gespeicherten psychoakustischen Mustern verglichen werden. Dabei werden alle Daten weggelassen, die nicht dem gespeicherten Muster entsprechen. Über die Bitrate bestimmt die kodierende Person, wie feingliedrig das gespeicherte Muster angewendet wird. Je geringer die Bitrate desto toleranter der Encoder, sprich: desto mehr Daten stuft er als verzichtbar ein.
Das ist zwar ein wenig vereinfacht dargestellt, soll aber an dieser Stelle reichen. Zusätzlich gibt es noch einen zweiten Kompressionsdurchgang, der der traditionellen Datei-Komprimierung (zip und Co.) ähnelt. MP3-Dateien werden in sehr kleinen Zeiteinheiten, Frames genannt, kodiert. Diese Frames können bei manchen Encodern miteinander interagieren: Hat eines noch Reserven und beim nächsten reicht der Speicher für die verarbeitenden Informationen nicht aus, tun sie sich zusammen und bündeln die Kräfte für ein optimales Ergebnis.
Wann sollte ich MP3 benutzen?
Das ist natürlich jedem selbst überlassen, aber bestimmte Grenzen lassen sich abstecken: Den von mir selbst produzierten Song, den ich in mühseliger Kleinarbeit fertig gestellt habe, würde ich nicht ausschließlich als MP3-Datei speichern. Möglicherweise reicht mir die MP3-Datei zum Anhören, ein gut aufgelöstes Master (bei mir zum Beispiel 24 Bit, 44,1 kHz) sollte es aber trotzdem geben. Denn nur dieses Master ist die richtige Grundlage für weitere Bearbeitungen (Mastering, Umschnitte oder Format-Konvertierungen). Sinnvoll ist der Einsatz von MP3 an allen Stellen, wo große WAV-Dateien einfach zu unhandlich sind. Also auf dem MP3-Player, beim Versand von Musik per E-Mail, auf einer Website und so weiter.
Die wichtige Faustregel lautet: MP3-Encoding ist immer der allerletzte Schritt in der Bearbeitungskette und nur dann sinnvoll, wenn die Dateigröße ein wichtiger Faktor ist.
Womit erzeuge ich MP3?
Viele Sequencer-Programme bieten die Möglichkeit, das Arbeitsergebnis als MP3-Datei zu exportieren. Ich selbst arbeite mit Logic und Pro Tools auf dem Mac und diese beiden Programme veranschaulichen wie unterschiedlich sich die MP3-Kodierung in der Praxis anfühlen kann. Logic kann in einem Export-Vorgang gleichzeitig eine WAV-Version des Titels und eine MP3-Version (oder AAC) auf der Festplatte speichern, und zwar in der Regel schneller als in Echtzeit. Für Pro Tools muss die MP3-Export-Funktion extra gekauft werden (für 22 Euro!). Beim Exportvorgang kann die Software leider nur ein File-Format zur Zeit speichern. Außerdem erfolgt der Export in Echtzeit, dauert also immer so lange wie der Titel.
Aber es gibt auch reihenweise andere, kostenfreie Lösungen: Der Windows Media Player und iTunes auf dem Mac als Standard-Musikprogramme auf jedem Rechner können auch MP3-Dateien erzeugen. Es gibt also eigentlich keinen Grund, für diese Funktion extra Geld auszugeben. Wer die zum Teil etwas eigenwillige Datei- und Speicherort-Verwaltung dieser Programme nicht mag, kann zum Beispiel auf das kostenlose Audacity zurückgreifen, dass es für Mac und Windows-PCs im Internet gibt. Das benutzt den LAME-MP3-Codec, den manche als qualitativ besser einschätzen als Fraunhofer-MP3, das im Windows Media Player und in iTunes zum Einsatz kommt. Mehr zur Qualitätsfrage später.