Autotune
[aus: »Pop. Kultur und Kritik«, Heft 18, Frühling 2021, S. 20-33]
Das Jahr 2020 war eine sehr gute Zeit für Popmusik – wie auch schon das Jahrzehnt zuvor. Die Schwierigkeit, streckenweise sogar Unmöglichkeit, in der Corona-Phase vor einem größeren Publikum aufzutreten, konnte daran nichts Entscheidendes ändern. Einen wichtigen Grund dafür stellt sicherlich der Zwang dar, mit der Veröffentlichung von Stücken Geld zu verdienen; einen länger anhaltenden Produktionsstopp können sich viele Firmen und Musiker nicht leisten, selbst wenn sie staatliche Corona-Hilfen beziehen. Ein anderer Grund ist aber in der teilweise unkommerziellen Ausprägung der Popmusik zu suchen; sie wird von vielen Semi-Professionellen, Teilzeit-Künstlern und Pseudo-Selbständigen auch dann jeweils einige Monate oder Jahre lang aufgenommen und veröffentlicht, wenn es mit ihr kaum etwas zu verdienen gibt.
Dass sie in einigen Varianten mit recht kostengünstigem Equipment eingespielt werden kann, macht Popmusik sogar quarantänetauglich. Auf eine funktionierende Elektrizitätsversorgung bleibt sie allerdings angewiesen, zumindest bei der Verbreitung der Werke. Obwohl sie entsprechende Stücke regelmäßig ins digitale Netz stellten, spielten Musiker in der ersten Phase der staatlich verfügten Corona-Einschränkungen öfter bekannte Songs auf sog. akustischen Instrumenten ein – wohl als Symbol für ›Häuslichkeit‹, ›Bescheidenheit‹, ›Zurückgezogenheit‹ gedacht. Die Idee, Popmusik auf Liedkompositionen ungeachtet eines speziellen Klangs festzulegen, ist aber wahrscheinlich nicht die beste, das fällt einem spätestens auf, wenn Charts-Titel unbegleitet am Klavier dargeboten werden.
Das Kriterium ›elektrisch verstärkte und in einem Studio (oder mit heimischen Digitalgeräten) hergestellte Musik‹ reicht allerdings noch nicht aus, um Pop- von Rockmusik zu trennen. Als sehr nützliches Unterscheidungsinstrument, das die zuvor unwichtig gewordene Pop/Rock-Distinktion mit neuer Bedeutung erfüllt, hat sich in den letzten Jahren die Frage herausgestellt, ob die Stimmaufnahme einer deutlich erkennbaren digitalen Bearbeitung, vor allem durch Autotune und ähnliche Software, ausgesetzt worden ist: Tritt die Künstlichkeit der Stimme fast schon schmerzhaft hervor?
Autotune kann jedoch auch der Verstärkung des ›Natürlichen‹ dienen – einer ›Natur‹, die zur ›Perfektion‹ nicht mehr nur strebt. Entwickelt und zuerst auch ausschließlich eingesetzt worden ist die Software, um bei der Musikproduktion Gesangs-›Fehler‹ zu korrigieren. Mit ihr steht eine Technologie bereit, welche die seit über einem halben Jahrhundert gängigen Studio-Abläufe des Zusammenschneidens und Abmischens von Vokal-Takes teils überflüssig macht, teils vereinfacht, beschleunigt oder überbietet. Ungezügelter Ausdruck und Harmonie, moderne und klassische Kunstanforderungen können dadurch vereint bzw. nacheinander erfüllt werden: Auf die Aufnahme der teils unkontrollierten Expression folgt zur Verbesserung etwaiger Fehler die Bearbeitung mit Autotune, Melodyne etc.
Zur vollkommenen Synthese von klassischen und subjektiv-expressiven Vorstellungen im Rock- und Popsektor führt das selbstverständlich nur, wenn der Anhänger des nicht reglementierten Ausdrucks bereit ist, gewisse ›Unreinheiten‹ bei der Intonation als künstlerische Fehler anzuerkennen und beseitigen zu lassen. Der Anhänger des Klassischen wiederum muss konzedieren, dass Harmonie und Perfektion auch von Stimmen erzielt werden können, die für Opernarien oder Schubert-Lieder ungeeignet wären. Der gelungene Einsatz von Autotune & Co. ist nach Maßgabe dieses synthetischen Natürlichkeits-Ideals für den Hörer nicht bemerkbar; der ›gerundete‹, ›begradigte‹ Klang wird von ihm als Qualität der besonderen menschlichen Stimme aufgefasst. Technologisch ermächtigt, dürften die allermeisten heutigen Stücke darauf abzielen.
Ermöglicht wird durch die Software aber auch ein Sprechen und Singen, das ganz und gar unnatürlich klingt – nicht nach einem Fehler, nicht nach einer unausgebildeten, müden oder kranken Stimme, auch nicht nach einer raffinierten Vokalakrobatik, sondern nach einem maschinellen Sound. Je nach Grad des Autotune-Einsatzes kann noch die ursprüngliche bzw. bearbeitete menschliche Stimme erkannt bzw. erahnt und intuitiv ›rückgerechnet‹ werden. Die Annahme, es nicht mit einer vollkommen computergenerierten Stimme zu tun zu haben, dürfte aber oft weniger vom Hörerlebnis als von begleitenden Videoaufnahmen abhängen. Begünstigt wird das auch dadurch, dass Autotune ebenfalls ›live‹ benutzbar ist, nicht nur bei einer nachträglichen Bearbeitung; beim Singen selbst kann deshalb bereits auf das reagiert werden, was die Software vor einem Moment mit den vorherigen eigenen Vokaltönen angestellt hat. Im Ergebnis werden bei den Autotune-Stücken – falls sie den forciert unnatürlichen Klang aufbieten – zumeist flache, hohe, leicht gedehnte und/oder brüchige, zittrige, überschnappende Stimmen hörbar.
Ein ›Nein‹ auf die Frage nach einer deutlich erkennbaren Autotune-Benutzung muss noch nicht gegen ›Pop‹ sprechen, aber ›Ja‹ zeigt fast immer treffsicher an: Popmusik. Nicht etwa, weil im letzten Jahrzehnt eine doktrinäre Definition mit aller Macht etabliert worden wäre, sondern weil sich der Befund mit anderen Popmusik-Auffassungen gut verbindet, diese aber zugleich insofern momentan hinter sich lässt, als nun ein einfach zu überprüfendes Genre-Kriterium vorliegt. Ob das nur ein vorübergehendes Phänomen ist, hängt schlicht davon ab, wie lange Rockmusiker auf jenen auch für Laien rasch erkennbaren Einsatz von Autotune weiterhin verzichten.
Bei denen, die ohnehin üblicherweise dem Pop-Sektor zugeschlagen werden, müsste auf der anderen Seite ein rapider Ermüdungseffekt einsetzen, damit diese einfache Abgrenzung hinfällig würde. Eine beachtliche Zahl von Popstars wie Bandcamp-Artisten macht aber seit dem erfolgreichen Auftakt durch Kanye Wests Album »808s & Heartbreak« (2008) keinerlei Anstalten, zum ›Natürlichen‹ (sprich: zu einer unmerklichen technologischen Stimmbearbeitung) zurückzukehren; daran hat auch Covid-19 bzw. die damit einhergehende weltanschauliche (Selbst-)Verpflichtung aufs ›Wesentliche‹ und ›Menschliche‹ nichts ändern können.
Beim Kinderzimmer-Schreck (im Sinne von: Schrecken aus dem Kinderzimmer) 100 gecs – die sehr gerne bei Simpel-Melodien hohe Nervspitzen erreichen – überrascht das nicht: »Hand Crushed By A Mallet«. Bei A. G. Cook, dem Gründer des Labels PC Music, der in Interviews die Wörter »experimentell«, »inauthentisch« und »kommerziell« mit gleicher positiver Bedeutung verwendet (als schrieben wir noch das Jahr 1982), verwundert es ebenfalls nicht. Ende 2020 hat Cook nach seinem 49-Stücke-Werkzeugkasten-Album »7G« zusammen mit Charli XCX das psychedelisch versöhnliche »Cold (Live at Pop Carol)« vorgelegt. Charli XCX mag nach eigenem Bekunden an Autotune die unvorhersehbaren, fehlerhaft klingenden Passagen; in den Kommentarspalten schreiben Fans unter ihre Videos: »She went a long way from her mainstream hit Boom Clap. And I am happy for her. Sheʼs finally doing the music she wants without any restrictions from major record labels.« Das führt jedoch in die Irre, der einzige Unterschied liegt darin, dass die Songs nun mit viel größerer Frequenz veröffentlicht werden; die exponierten Stücke von Charli XCX (2020 etwa »Claws«) unterscheiden sich aber nicht immens von denen der momentan erfolgreicheren Kolleginnen, z.B. von Ariana Grandes »34+35« oder Blackpinks (feat. Selena Gomez) »Ice Cream«.
Zugegeben, die meisten Hits weisen neben teureren Videos und gefälligerem Auftreten ihrer Interpretinnen einen durchgängigeren Rhythmus auf. Beim Autotune-Einsatz weichen sie aber wenig bis gar nicht von dem der für den Mercury Preis nominierten Charli XCX ab (zum Vergleich etwa Dua Lipa/Angèle, »Fever«, oder Marshmello feat. Demi Lovato, »OK Not To Be OK«). Deshalb liegt das Argument nahe, die Stars seien austauschbar, Pseudo-Individualitäten, folglich werde auch das Persönlichste, die Stimme, einem maschinellen Standard, dem totalitären Zug zum Generischen ausgeliefert (dagegen spricht auch nicht unbedingt, dass die Autotune-Vocals sensible Naturen eine expressive, emotionale Qualität – Verstörung, Entfremdung, Ekstase, Unsicherheit etc. – verspüren lässt; für den Standardisierungs-Kritiker wären das bloß roboterartige Gefühlsäußerungen). Oder man könnte nüchterner darauf verweisen, dass die Differenzen durch Social-Media-Posts und durch Mode bereits ausreichend sichtbar würden und folglich die stimmliche Identifikation an Bedeutung verliere (auch alle in diesem Beitrag genannten Stücke sind über YouTube verfügbar).
Trifft letzteres wohl zu, bleibt die Sache doch erstaunlich. Parker Tyler hat vor ungefähr achtzig Jahren in seinem Essay »Charade of Voice« jene Neuheit und Andersartigkeit betont, die mit der technischen Innovation des Mikrofons zeitweilig verbunden war. Frank Sinatra habe die »radio state of perfection« schon vor seinen größeren Bühnenauftritten erreicht, sehr überraschend sei darum schließlich zu sehen gewesen, dass der »thick curtain of sound« einem »skinny youth« entstamme. Für den »bobby-sox admirer of Frankʼs« sei das genauso überraschend gekommen, »as if the sweet-expressioned but rather homely boy sitting next to her in class suddenly poured forth a torch song in tones hitherto thought the exclusive property of Nelson Eddy« (ein klassisch ausgebildeter US-amerikanischer Sänger der 1930er Jahre, der sowohl in Opernaufführungen als auch in Hollywoodfilmen auftrat). Denkt man das weiter, wäre nun wegen der Allgegenwart der Bilder vor dem Hören einer Tonaufnahme solch eine Überraschung nur noch umgekehrt denkbar: Welche Stimme besitzt diese mir von den Instagram-Fotos bestens bekannte Person? Je öfter die Antwort ›Autotune‹ lautet, desto seltener dürfte sie sich stellen. Wegen der starken historischen Bindung der Popmusik an das Timbre als Unterscheidungsmerkmal ist das bemerkenswert.
Solange die Differenzen zwischen den digital offenkundig stark bearbeiteten Stimmen nicht ebenso gut herausgehört werden (können) wie die zwischen den weniger hörbar modellierten, drängt sich eine andere, einfache Erklärung auf, weshalb die Stimmverzerrung Charts-Musik in beachtlichem Ausmaß prägt. Als Gag, Gimmick, Novelty Effect (wie einst der kurzzeitige Vocoder-Einsatz bei Disco- und Fusion-Stücken) kann das Phänomen angesichts seiner langen Dauer nicht mehr (weg) erklärt werden. Es bleibt darum nur der Hinweis auf den Modernitätsmarker übrig: etwas werde gemacht und geschätzt, weil es zeitgemäß und zukunftsweisend zugleich sei – oder anders ausgedrückt: weil es zu avancierten Entwicklungen in anderen Bereichen passe. Auf unseren Fall bezogen: Autotune habe sich durchgesetzt, weil es sich in das Panorama der Digitalisierung, der kosmetischen Chirurgie und der Nivellierung binärer Geschlechterdifferenz bestens einfüge. Popmusik nehme mit der Autotune-Software, die regionale, kulturelle, technisch-biologische Unterschiede verschleift, einen Zustand vorweg, in dem die Menschenart zuvor gern markierte Grenzen hinter sich ließe und in eine Epoche generischer Hybridität einträte.
Diese Erklärung ist wahrscheinlich zu schön bzw. zu doktrinär, um wahr bzw. annehmbar zu sein. Gälte sie, müssten Rockmusik, Folklore, Jazz und klassische Musik der Vergangenheit angehören und in der Gegenwart nur noch in Archiven gepflegt werden. Gegen diese Erklärung kann ebenfalls leicht eingewendet werden, dass man solcher Modernität durch die ›perfekte‹ digitale Modellierung der Stimme im Sinne eines Natürlichkeitseffekts oder -ideals Genüge tun könnte (Photoshop z.B. nutzen die Stars auch nur zu diesem Zweck).
Nützlich ist die These dennoch, wenn man sie nicht als Gesetz ernst nimmt, sondern als Ausgangspunkt, der einem weitere Überlegungen ermöglicht. Das mehr oder minder futuristische, latent ahumane Szenario macht einen historischen Unterschied gut sichtbar. Bei ähnlichem Zukunftsentwurf und vergleichbarer Weltanschauung lautet(e) die musikalische ›Lösung‹ in nicht wenigen Techno-Strömungen: Verzicht auf die Stimme, ›reine Maschinenmusik‹. Zwar führt die Beschränkung auf solche Klänge – und der damit häufig verbundene Verzicht, einem Publikum Musik ›live‹ mit sichtbarer motorischer Aktivität zu präsentieren – nicht zum Ende des ›alten Menschen‹, sondern oftmals nur zu erhöhter körperlicher Aktivität von Tanzenden; Gesang und Gespräch bekommen im Techno-Kontext aber tatsächlich kaum Raum. Autotune-Stimmen sind daran gemessen weniger futuristisch, viel stärker der alten phonozentrischen Rhetorik verhaftet.
Andererseits sind solche ›getunten‹ Stimmen im Alltag nicht anzutreffen, so schlecht die Qualität von Handy- und Laptop-Mikros auch sein mag (dazu mit High-Stress-Pitch Rico Nastys Song »iPhone«). Normalitätsvorstellungen kommt die Autotune-Singweise deshalb nicht entgegen. Sie erfüllt so den im künstlerischen Bereich sehr gut durchgesetzten modernen Anspruch der Verfremdung und entautomatisierten Wahrnehmung. Wegen des häufigen Einsatzes von Autotune in viel gehörten Produktionen verringert sich der Verfremdungseffekt im Laufe der Zeit jedoch stark. Die popmusikalische Allgegenwart des Autotune-Zeichens ›moderne Welt‹ steht im Konflikt mit der modern-künstlerischen Anforderung außeralltäglicher Formgebung. Dieses Schicksal haben allerdings auch viele Werke der Avantgarde erlitten, deren einst verstörende Maßnahmen längst routiniert erwartet werden; es handelt sich demnach nicht um eine exklusive Eigenschaft populärer Zusammenhänge.
Die mittlerweile vertrauten Stimmverfremdungen der Avantgarde greifen den klassisch ausgebildeten und/oder runden, vollen, angenehmen und/oder identifizierbaren, individuellen Klang durch allerlei Mittel (vom Megafon bis zu diversen elektronischen Bearbeitungen) an. Durch Autotune vergrößern sich ihre technischen Möglichkeiten, wichtiger ist aber, dass ihre alten Mittel wegen der starken Verbreitung des Autotune-Pop neue Aufmerksamkeit erlangen können. Im veränderten Kontext kommt ihnen eine neue Unterscheidungs-Qualität zu. Sehr attraktiv z.B.: Techno-Hall: Nkisi, »La Parole«; Trip-Hop-Dystopie: Nazar feat. Shannen, »Bunker«; angekratztes Soul-Pathos: Mourning [A] BLKstar, »Feels«; Helium-Effekt: Loraine James feat. Le3 bLACK, »London Ting // Dark As Fuck«; leicht heruntergedimmte Electro-Ekstase: Dis Fig, »Unleash«; hauchiges Echo: Nadia Tehran, »Tell Nobody (Booʼs TNB Flip)«; trash-spacig: Coucou Chloe, »Drop Ten«; Mega-Rap: Preservation feat. Mach-Hommy, »I-78«; bedröhnt, aufgeraut, aber straff: Shygirl, »Freak«.
Gleiches gilt für die Kombination aus sparsamen digitalen Klängen, Samples und Beats, die interessanten, scharf nuancierten oder stark ihrem eigenen Sprechrhythmus gehorchenden Stimmen einen Reiz verleiht, der nicht zuletzt von der jetzt stark hervortretenden Differenz zum Autotune-Klang herrührt. Besonders bemerkenswert: Little Simz, »Might Bang, Might Not«; Pa Salieu feat. Mahalia, »Energy«; Maassai, »My Name Jack?«; Nappy Nina, »Sick A Lot«; NBA Youngboy, »The Story Of O.J.«; Psypiritual & The Lasso, »Jimi«.
Eine Konsequenz des neu zusammengesetzten Vokalfelds besteht unvermeidlich darin, dass die natürlich klingenden Stimmen insgesamt weniger als Symbole oder Ausdruck charakterlicher Dispositionen der Sänger und Rapper aufgefasst werden, weil sich nun ein Teil der routiniert ablaufenden alltäglichen Wahrnehmung und auch der interpretatorischen Anstrengung in der allgemeinen Feststellung ›Non-Autotune‹ erschöpft. Jener Hörvorgang, der sich rein auf klangliche Qualitäten des Redens und Singens konzentriert, wird dadurch in der Summe begünstigt. Die noch unabsehbar lang vorhandene generische Kraft des Autotune treibt Pop deshalb weiter Richtung ›lʼart pour lʼart‹.
Ganz dorthin kann das allerdings nicht führen, dafür sorgt schon die andere, traditionellere Genre-Bestimmung von ›Popmusik‹ – der harmonisch eingängige, für gute, euphorische oder angenehme Stimmung sorgende runde, vorwärtstreibende oder funky-repetitive‚ ›perfekte‹ Song. Auch an ihm herrscht zuletzt kein Mangel, mit oder ohne Autotune: Chloe x Halle, »Do It«; Caroline Polachek, »So Cold Youʼre Hurting My Feelings«; Amaarae, »Fancy«; Jenevieve, »Baby Powder«; Tiwa Savage, »Koroba«; Doja Cat, »Say So«; Saweetie feat. Jhené Aiko, »Back To The Streets«; Quelle Chris & Chris Keys, »Sudden Death«. So kann es weitergehen.
Der Beitrag ist Teil der Forschungsarbeit des Siegener DFG-SFB 1472 »Transformationen des Populären«.