KI für Sound- und Musikdesign: Künstliche Intelligenz oder kurz KI scheint heute die Lösung für viele Aufgaben zu sein: Texte schreiben, Bilder entwerfen und Musikstücke komponieren – wir lassen für uns arbeiten und sind damit in der Zukunft angekommen. Konsens darüber, ob das gut oder schlecht ist, herrscht nicht: Auch zu Sounddesign und Track-Produktion gibt es beinahe so viele Meinungen wie KI-Produkte.
Wir haben Experten dazu befragt und die wichtigsten Software-Produkte recherchiert. Vor allem die Plugins für Mixing und Mastering haben uns überzeugt, während wir der Meinung sind, dass KI bei der Synthese noch in den Kinderschuhen steckt.
DETAILS & PRAXIS
Fünf Experten aus dem Business
Dieses Feature äußert keine Einzelmeinung. Um uns ein möglichst differenziertes Gesamtbild zu machen, haben wir uns also mit fünf Entwicklern beziehungsweise Musikern zur Bedeutung von KI im Sounddesign und der Musikproduktion ausgetauscht.
John Lehmkuhl alias PluginGuru ist für sein langjähriges Sounddesign bei Korg bekannt. Er liebt MidJourney für Grafikdesign und ist offen für technische Fortschritte. Christoph Härtwig, Product Marketing Manager bei Native Instruments, schätzt den praktischen Mehrwert von KI im täglichen Leben längst.
Für dich ausgesucht
Yuki Ohta arbeitet als Sound R&D Section Manager bei Korg Japan. Gelegentlich nutzt er ChatGPT fürs Brainstorming und das Skizzieren von neuen Ideen. Auch Sounddesigner Rob Papen verwendet ein KI-Grafikprogramm, betrachtet KI für kreative Aufgaben aber eher kritisch. Als Musikproduzent hat Thomas Lemmer, selbst im IT-Bereich tätig, schon mit KI-Anwendungen gearbeitet. Er optimiert damit Werbetexte für die Veröffentlichungen seiner neuen Singles und lässt auch schon mal eine Akkordfolge per KI generieren.
Künstliche Intelligenz als Marketing-Hype
Wie bei vielen neuen Trends stellt man sich schon mal die Frage, ob der jeweilige Modebegriff, hier „Künstliche Intelligenz“, zum Marketinginstrument hochstilisiert wird. Rob Papen bezeichnet die KI bei Grafiksoftware und Plugins für Musiker als fein abgestimmten Algorithmus. Hätte man MP3 erst heutzutage entwickelt, könnte man das Format auch als KI-Musikkompression beschreiben.
Ein passender Slogan könnte dann lauten: „MP3 komprimiert Ihre Musik per KI in ein kompaktes Dateiformat, investieren Sie in die Zukunft!“. Tatsächlich hätte man auch das Feature „Preset Variation“ des Software-Synthesizers Predator-3 von Rob Papen einfach als „AI-Preset-Variation“ vermarkten können. Immerhin leistet es mehr als der übliche Zufallsgenerator, den man schon von einigen Hardware-Synthesizern kennt. Künftig werden wahrscheinlich noch viele Hersteller auf den Zug von KI aufspringen.
Altes wird zu Neuem
Bleiben wir weiter kritisch: Bei KI – auf Englisch AI — geht es bislang hauptsächlich darum, mit bereits bestehenden Kreationen zu arbeiten, die etwa in einer Sample-Datenbank hinterlegt sind. Ähnlich wie John Lehmkuhl argumentiert auch Rob Papen: KI wird immer auf etwas beruhen, das bereits existiert. Im Wesentlichen steckt eine große Datenbank dahinter. Sie erfüllt zwar schnell Wünsche, agiert aber weder kreativ noch kritisch bei Entscheidungen.
Christoph Härtwig beobachtet ChatGPT oder Firmen wie Musical Bits. Hier geht es viel um Reproduktion. Machine Learning bei Izotope macht erst einmal nichts anderes, als existierende Daten zu verarbeiten und daraus Neues zu erzeugen.
Sounds sind keine Bilder
Bilder malen zu lassen, klappt per KI schon wirklich gut. Bei Klangbildern ist es nun einmal anders. Man hat keine besonders konkreten Vorstellungen, außerdem lassen sich Sounds auch nicht so präzise beschreiben. Missverständnisse und Fehlinterpretationen sind sozusagen vorprogrammiert.
John Lehmkuhl ist skeptisch, ob Sounds per KI tatsächlich einmal so abheben wie Bilder. Wenn man sich eine „Akustikgitarre mit Flügeln, die über den Ozean schwebt,“ wünscht, hat man ein ziemliches klares Bild im Kopf, wie das Ganze aussehen könnte. Bei Klängen sieht das anders aus. Augen und Ohren funktionieren unterschiedlich.
Hinzu kommt der Algorithmus, der nicht wie ein Mensch handelt. Wenn ein 3D-Bild eines Hundes gewünscht ist, das wie eine Mischung aus Esel und Hund anmutet, wird der Computer einfach die 3D-Daten eines Hundes sammeln und sie mit den 3D-Daten des Esels mischen. KI funktioniert also in zumindest der aktuellen kommerziellen Form noch recht simpel, meint Rob Papen.
KI als Unterstützung beim Musikdesign
Trotz aller Kritik erweist sich KI in der Praxis als effizient: Rob Papen etwa kann sich so eine Hilfe bei der Klangrestauration durchaus vorstellen. Yuki Ohta spricht sich hier für den KI-Assistenten von Izotope RX 10 aus.
Die Verwaltung von Soundsets wird KI irgendwann auch beschleunigen.Das Taggen und Sortieren der Sounds in einem riesigen Pool von Samples gestaltet sich für Ohta allerdings noch sehr zeitintensiv. Christoph Härtwig beurteilt KI wiederum einfach als Chance, sich während der Musikproduktion bei einigen Vorgängen inspirieren zu lassen.
Für Tuning und Timing-Verbesserungen von Vocal-Spuren sowie bei tontechnischen Optimierungen von Mixes helfen die neuen Plugins ebenso. Dabei bleibt die Frage nach dem persönlichen Anspruch natürlich bestehen. So ist Thomas Lemmer nach einigen Versuchen mit KI-Tools zum manuellen Mastering zurückgekehrt. Aus künstlerischer Perspektive konnten die Ergebnisse ihn nicht überzeugen.
Menschliches Ermessen zählt
KI wird nicht wie das Streaming die gesamte Musikbranche drastisch verändern. So kurzfristig ersetzt sie Professionelle keineswegs. Und selbst, wenn es so wäre, ergäben sich neue Arbeitsplätze, an die wir heute noch gar nicht denken.
Das Credo der Experten lautet: Kreative Prozesse und musikalische Innovation entstehen nicht durch einen Algorithmus. Das liegt schlicht daran, dass das, was der Algorithmus für einen guten Sound hält, für einen Musiker richtig schlecht klingen kann. Für Rob Papen oder Thomas Lemmer ist es immer eine Frage des persönlichen Geschmacks.
John Lehmkuhl wünscht sich den richtigen Umgang: „Der Schlüssel ist, dass wir als Künstler die Technologie beherrschen müssen, und nicht umgekehrt“. Die Seele des Menschen steht hinter der Musik. Für Yuki Ohta haben Klänge auch einen kulturellen Bezug und sind explizit fürs menschliche Gehör bestimmt — nicht für eine Maschine.
Keine neuen Genres per KI
Werden neue, KI-generierte Gattungen den Musikmarkt erobern? Yuki Ohta verneint dies entschieden: Originalität und Einzigartigkeit bleiben seiner Meinung nach etwas Subjektives. Solange Künstliche Intelligenz ein vom Menschen geschaffenes und kontrolliertes Werkzeug ohne eigene Emotionen bleibt, kann sie kein eigenes Klang- oder Musikgenre schaffen oder beanspruchen. Das wird sich aber dramatisch verändern, sollte KI tatsächlich einmal echte Gefühle entwickeln. Christoph Härtwig sieht das Potenzial von verbesserter KI für die Entwicklung neuer kreativer Werke. Ob wir das als Mensch selbst ästhetisch finden, ist eine andere Frage.
KI hat Zukunft
Die Diskussion um KI in der Musikproduktion wird uns noch lange beschäftigen. Sich gegen technische Fortschritte zu wehren, sei ungefähr so, als wolle man täglich den Sonnenaufgang aufhalten, kommentiert John Lehmkuhl. Als Sounddesigner möchte er neue Aspekte annehmen und so bei seinem Schaffen künftig produktiver sein.
Yuki Ohta geht davon aus, dass wir die Integration von generativen KI-Tools in naher Zukunft verstärkt in der Audio-Produktion und bei Songwriting-Tools erleben werden. Christoph Härtwig glaubt sogar ans Ende der Zeit von Sample-basierten Instrumenten und großen Libraries im Lauf der nächsten zehn Jahre.
Auch Thomas Lemmer ist davon überzeugt, dass in den nächsten Jahren viele AI-Tools für Software-Instrumente und andere Plugins kommen werden. Auch die schon vorhandenen Produkte für Mastering und Mixing werden seiner Meinung nach bald noch besser ausfallen.
Fazit
Künstliche Intelligenz wird menschliche Kreativität erst einmal nicht verdrängen können. Für einige Branchen wie das Bankwesen oder Behörden mag sie personell als Bedrohung gelten, Musiker und Produzenten brauchen sich aber keine Gedanken zu machen. Solange sie innovativ oder zumindest kreativ arbeiten, bleiben sie auf Kurs. AI-Tools und Plugins können indessen mit künstlicher Intelligenz zu neuen Taten animieren oder Routinen beschleunigen.
In der Summe ist Künstliche Intelligenz eine willkommene Option für Musiker. Vor allem Producer sollten die neuen Plugins einmal probieren. Es lohnt sich!
Produkte mit Künstlicher Intelligenz – eine Auswahl
A) Mastering, Mixing, Effekte
Izotope Ozone: Effizientes Mastering
Mit Ozone liefert Izotope ein smartes Plugin fürs Mastering. Es ist sehr leicht zu bedienen und mastert Tracks per Mausklick. Mit rund 200 Euro lohnt sich Ozone Standard für die meisten User. Noch günstiger ist die Version Elements. Wer es genau nimmt, kauft die als Advanced bezeichnete komplette Mastering Suite von Izotope Ozone.
Hersteller iZotope setzt seinen Fokus mit Ozone 10 weiter auf künstliche Intelligenz und innovative Module, die das Mastering erleichtern sollen. Für wen sich das Update lohnt, erfahrt ihr im Test.
Izotope RX: Audio Repair Spezialist
Als umfangreicher Werkzeugkasten zur Aufbereitung und Rettung verschiedener Audioaufnahmen versteht sich Izotope RX. Die Advanced-Version kostet über 1.000 Euro und ist damit wirklich nur für Profis relevant. Für kleinere Aufgaben sollten die erschwinglichen Versionen Elements und Standard ausreichen.
iZotope RX 10 Advanced kommt mit Repair Assistant, Sprechererkennung und mehr. Wie sich das neue Audio-Verbesserungswerkzeug in der Praxis schlägt, zeigt der Bonedo-Test.
Izotope Neutron: Mixing-Hilfe
Einen dynamischen Channelstrip aus mehreren Komponenten (EQ, Kompressor, Gate, Shaper. Exciter, Limiter etc.) stellt Izotope mit Neutron bereit. Mit dem Visual Mixer behält man den gesamten Mix im Blick und kann einzelne Spuren kontrollieren. Auch hier bietet Izotope drei Versionen: Elements, Standard und Advanced.
Das Channelstrip-Plugin iZotope Neutron 3 analysiert die DAW-Tracks und stellt die Effekte sowie die Balance der Pegel für euch ein, um beim Mixing zu helfen. Wie gut das funktioniert, zeigt der Test.
Izotope Nectar: Vocal Optimizer
Zur Optimierung von Gesang und Sprache ist Izotope Nectar das passende Plugin mit KI. Bereits in der Standardversion integriert ist Celemony Melodyne Essential zur tonalen und rhythmischen Korrektur der Vocals. Per Backer-Modul lassen sich auch mehrstimmige Chöre konstruieren. Auch für außergewöhnliche Designer-Kreationen taugt das bewährte Plugin Izotope Nectar.
iZotope Nectar 3 ist der neue Vocal-Channel-Strip der Mixing-Spezialisten iZotope. Mit überarbeiteter Oberfläche, KI-basierten Assistenten und vielen Effekten …
Zynaptiq Adaptiverb: Flexibler Reverb
Der Zynaptiq Adaptiverb ist kein gewöhnlicher Hall. Er nutzt die Harmonic Tracking Resynthese und erzeugt damit einen reflexionslosen Nachhall, der sich an die jeweilige akustische Situation anpasst. Es lassen sich ungewöhnliche wie auch musikalische Sounds entlocken. Als Kehrseite ist die relativ hohe CPU-Belastung zu nennen.
B) Klangerzeugung
Guk-ai Sistema: Synthesizer mit Texteingabe
Tatsächlich erbebt guk.ai den Anspruch, mit dem Plugin Sistema das erste KI-Software-Instrument zu präsentieren. Man beschreibt den gewünschten Sound per Texteingabe und kann das Ergebnis per Makro-Parameter ein wenig abändern. Prinzipiell klingt das spannend, komplexe Sounds darf man nicht erwarten.
SonicCharge Synplant 2 – Genopatch Technologie
Sonic Charge ist einer der KI-Wegbereiter für Software-Synthesizer. Mit der GenoPatch-Technologie importiert man bei Synplant 2 ein Audio-Sample und erzeugt daraus ein Synthesizer-Patch. Diese neuartige Herangehensweise führt die User auf erfrischende Weise an interessante Klängen heran.
Der Sonic Charge Synplant 2 sorgt für Aufsehen! Mit GenoPatch soll der Soft Synth per KI jeden Sound nachbauen können. Wie gut klingt das?
Audiolab Emergent Drums: Drum Samples designen
Emergent Drums von Audiolab erstellt per KI von Grund auf neue Drum Samples. Organisiert sind sie in Form von 16 Pads. Einen internen Sequencer gibt es nicht. Man muss die Drum Samples also in der DAW triggern. Der Preis für diesen Spaß ist eher happig. Für Sample Producer könnte sich die Investition aber rentieren.
Audialab Emergent Drums 2 ist eines der ersten Plugins, das Sounds mithilfe einer KI erzeugt. Wir haben das VST getestet.
C) MIDI Phrasen
Orb Producer Suite: Akkorde, Phrasen und Melodien kreieren
Alas nützlicher Assistent beim Komponieren erweist sich die Orb Producer Suite. Insgesamt enthält sie vier Plugins, die für bestimmte Parts eines Arrangements neue MIDI-Phrasen erzeugen: Chord, Melody, Bass, Arpeggio. Wer möchte, kann auch komplexere polyrhythmische Muster realisieren.
Audiomodern Playbeat: Drum Sequencing mit Samples
Audiomodern Playbeat ist eine kreativ verwendbare Groove Engine. Sie bietet achtfaches Sequening, Sample-Import und andere Features einer modernen VST-Drummachine. Das GUI ist zwar nicht selbsterklärend, mittels Randomizing entlockt man Playbeat aber einfach wie schnell brauchbare MIDI Patterns.
Wellenstrom sagt:
#1 - 23.02.2024 um 19:01 Uhr
Da soll ein Jeder nach seiner eigenen Facon selig werden. Nur eins ist klar - je mehr man als Musiker aus der Hand gibt und man in Sachen Komposition und Arrangement den Computer machen lässt, desto weniger ist am Ende der Kette ein Alleinstellungsmerkmal, eine individuelle Handschrift erkennbar. Musik lebt von der Identität, Individualität und der Biographie des Musikers. All das fließt in den Song ein. Damit kann keine KI dienen.
wiesel sagt:
#1.1 - 24.02.2024 um 06:17 Uhr
Sehe ich auch so. Sich bei Entscheidungsfindung z.B.:EQ o.ä. von so genannter KI helfen zu lassen ist ja in gewissem Rahmen noch vertretbar. Musikkomposition ohne den Faktor Mensch/Emotion/Erfahrung Gefühl/Wissen um Fehler. Naja, Die Ergebnisse klingen entweder wie "Kunstlederimitat", oder sind beliebig.Taschenrechner bleibt Taschenrechner und Mensch bleibt Mensch. Taschenrechner können ja Musik für Taschenrechner komponieren. Und ja, ich weiß das die Erde keine Scheibe ist.
Antwort auf #1 von Wellenstrom
Melden Empfehlen Empfehlung entfernenAmos omb sagt:
#2 - 24.02.2024 um 16:11 Uhr
Solange eine KI nicht mal im Stande ist vernünftige Sprach-Übersetzungen zu Stande zu bringen, wenn ein Text lyrische Parts enthält, muss man sich über die Notwendigkeit von Menschen in der Musikbranche wohl keine Sorgen machen.
David sagt:
#2.1 - 16.09.2024 um 16:13 Uhr
Bitte was? DeepL kann hervorragend übersetzen!
Antwort auf #2 von Amos omb
Melden Empfehlen Empfehlung entfernenleft-to-do sagt:
#3 - 25.02.2024 um 17:48 Uhr
Noch sind das ja "nur" die Anfänge der KI in der Musik. Aber ich warte schon drauf dass jemand sagt: "Jaaa ich hab einen wundervollen neuen Song, der genau meinem Gefühl entspricht. Den hab ich selbst ... ähhh ... von der KI schreiben lassen." - Das kommt bestimmt. Aber da die Welt schon jetzt überflutet wird von Mainstream-Musik, wie z.B. K-Pop, bei der das, was man hört garnicht mehr wichtig ist, sondern das ganze Drumherum, kommt es auf die Enstehung der Songs vermutlich bald garnicht mehr an. Da wird es dann verwegen sein, wenn man sich mit Instrumenten privat trifft, um selbstgemachte Hausmusik zu spielen. Ok, da ist jetzt auch ein bisschen Sarkasmus im Spiel, aber wie heißt das noch mal bei Willi Buschs Max und Moritz? "Wehe, wehe, wenn ich auf das Endes sehe!" Aber wir befinden uns ja erst im zweiten oder dritten Streich, da braucht man sich noch keine Gedanken zu machen. ;)
Eric van Richthoven sagt:
#4 - 03.01.2025 um 17:07 Uhr
Es wird noch viel Wasser von Berg kommen müssen, um zum Beispiel Songs, oder besser gesagt, das Sounddesign von den großen Hits der vergangenen Jahre zu reproduzieren. Ja, nach machen können die meisten, aber echte Songs schreiben, oder zu produzieren, können nur einige wenige auserwählte. Zum Beispiel, die Produzenten von Michael Jackson, Aha, Qeen, und viele andere.