Gesichtsverkennung
von Gunnar Schmidt
30.8.2022

»Intelligentes Telefon«, »Face Tracking«, »Micro Motion Detection«, »Control Your In-Cabin Reality«

[aus: »Pop. Kultur und Kritik«, Heft 16, Frühling 2020, S. 61-69]

Mit der digitalen und visuellen Medienkultur vollzog sich schleichend eine Umkehrung des Verhältnisses von Mensch und Maschine. Aus dem »panoptischen Subjekt« (Peter Sloterdijk), das triumphal die Welt beherrscht, ist ein beherrschtes geworden. Zu diesem Befund gelangt man, wenn man eine sprachliche Figur ernst nimmt: Eine der Errungenschaften der Gegenwart bestehe darin, dass nicht mehr nur der Mensch die Welt beobachtet, sondern technische Einrichtungen den Menschen ›beobachten‹. Zumeist wird diese ›Beobachtung‹ als optisches Dispositiv aufgefasst. Die metaphorische Rhetorik nährt dabei das Phantasma eines Majestätssubjekts, einer unheimlichen Schaubefähigung. Zwar ist nicht zu bezweifeln, dass es politisch und kapitalistisch interessierte Instanzen gibt, die unüberschaubare Massen an Daten sammeln, um zu einer Ökonomie der Verhaltenslenkung beizutragen. Interessanter ist aber die Frage, was das algorithmisch gesteuerte Sammeln und Verarbeiten von Daten – auch von visuellen Daten – von subjektbezogenen Beobachtungsprozessen unterscheidet.

Als im Herbst 2019 Huawai das neue Smartphone Mate 30 vorstellte, konnte der Eindruck entstehen, die Anthropomorphisierung der Technik habe einen neuen Entwicklungssprung gemacht. Die Gesichtserkennung des Geräts verfügt über einige innovative Funktionen, denen »intelligente« Eigenschaften zugeschrieben werden. Im Werbetext auf der Internetseite von Huawei heißt es: »Dieses intelligente Telefon folgt der Richtung deines Blicks folgt und dreht den Bildschirm automatisch. Zum Schutz deiner Privatsphäre blendet es Benachrichtigungsdetails aus und sperrt Apps, falls jemand anders auf dein Display schaut. Bist du mit dem Gesicht zu nah am Telefon, erhältst du einen Hinweis, um deine Augen zu schützen. Diese intelligenten Hilfsfunktionen sind auf einfache und natürliche Art und Weise in dem Telefon integriert.« Der Umstand, dass die Intimitätssicherung zwischen Gerätebesitzer und Gerät über die Funktion der Gesichtserkennung geregelt wird, ist im konkreten Fall nicht ohne Ironie: Mag Huawei auch darum bemüht sein, als privates Tech-Unternehmen Anerkennung zu finden, sosehr ist es eine Tatsache, dass das Unternehmen ein zentraler Akteur der sog. ›IT-Diktatur‹ Chinas ist und als Infrastrukturzulieferer die Rahmenbedingungen der Individual- und Gesellschaftskontrolle sichert.

Ähnliche Innovationsbemühungen im Bereich des ›face tracking‹ unternimmt seit einiger Zeit die Autoindustrie, die den Innenraum des Fahrzeugs mit Kameras ausstattet, um damit die Augen des Fahrers zu verfolgen. Schaut beispielsweise der Fahrer auf ein bestimmtes Bedienelement im Display, wird es unmittelbar hervorgehoben. Ebenso ist es möglich, die Aufmerksamkeit des Fahrers zu prüfen und die Sitzposition zu überwachen, um im Falle eines Unfalls die Airbags optimal zu zünden. Das Unternehmen Guardian Optical Technologies hat ein Machine-Vision-System entwickelt, in das »micro motion detection« implementiert ist und z.B. an den Augenlidbewegungen ermisst, ob genügend Aufmerksamkeit oder gefährliche Ermüdung beim Fahrer festzustellen ist. Der Produkt-Claim des Unternehmens lautet »control your in-cabin reality« – womit insinuiert wird, dass die Kontrollmacht beim Fahrzeuglenker liege.

Was so verführerisch verkauft wird, ist genauer zu betrachten: Die mikrologische ›Beobachtung‹, der ein Echtzeitprozess aus Gesichtsbewegung, Registratur und Reaktion unterlegt ist, etabliert im Moment ihres Vollzugs eine Situation, die sich der Erfahrbarkeit entzieht. Die Synchronisierung der unwillkürlichen Aktionen aufseiten des Nutzers mit dem Processing aufgrund extremer Beschleunigung erzeugt einen Automatismus, der die Differenz zwischen Subjekt und Umwelt auflöst.

Die programmierte Zwangsläufigkeit der Abfolgen ruft nach Bewertungen des Zusammenspiels von Sinnesorganen, Nerven, Muskeln und technischer Umgebung, das vor allem die Auswirkungen auf das Subjekt betrifft. Idealisierung und strikte Ablehnung stehen bei der Beurteilung einander unversöhnlich gegenüber.

Die Behauptung, dass in der Verschmelzung von organischen und technischen Reflexprozessen eine neue Dimension der Dienstleistungsbereitschaft, der Sicherheitsgarantie sowie der freudvollen Nutzbarkeit der Technik, kurzum, des Souveränitätsgewinns entsteht, fußt auf der Prämisse, dass ›smart technology‹ den User von der Bedienung der Steuerung befreit. Der Nutzer wird fortan ›bedient‹. Das hoffnungsfrohe Versprechen ist nicht als leer zu denunzieren, denn tatsächlich vermag man Arbeitserleichterung im Umgang mit den digitalen Golems zu verspüren. Man muss nicht länger alles selbst machen, der Wunsch wird gleichsam von den Augen abgelesen.

In Gegenperspektive erscheinen die ausgelagerten Entlastungsvorkehrungen wiederum als prekär, was der Doppelsinn des Worts ›bedienen‹ nahelegt: Der Nutzer wird nicht nur mit etwas versorgt, er wird in gleichem Maße von den Devices gelenkt. Der evozierte hilfreiche Geist in Gestalt kleiner Kunstaugen muss für alle Kritiker der Überwachungsgesellschaft eine Horrorvorstellung sein, denn nichts garantiert, dass die gewonnenen Verhaltensdaten nicht auch auf Servern abgelegt werden, wo sie zu unabsehbaren Weiterverarbeitungen genutzt werden. Ob die Datensammlungen tatsächlich zur manipulativen Verhaltenssteuerung genutzt werden (können) oder lediglich eine paranoische Furcht davor hervorrufen, ist im Endeffekt wenig erheblich: Das Misstrauen gegen die Über-Ich-Prothesen ist in der Frühgeschichte der Moderne angelegt, wo nach Michel Foucaults maßgeblicher Analyse der Umschlag von der Disziplinierung des Subjekts mittels körperlicher Strafgebung zu einem institutionell verankerten Panoptismus erfolgte. Die Verinnerlichung des kontrollierenden Blicks lässt sich in einem Dreistufen-Modell schematisieren: Das ehedem allsehende Auge Gottes verwandelte sich in weltlich-juridische Instanzen (Auge des Gesetzes), um sich schließlich in optischen Dispositiven zu vergegenständlichen. Wer sich beobachtet weiß, beobachtet sich selbst umso genauer.

Ein Theoretiker von vollständig anderer Provenienz ist Carl Schmitt, der gleichwohl eine Nähe zu Foucault zeigt, wenn er religiöses und profanes Paradigma ineinander spiegelt. In seinen tagebuchartigen Aufzeichnungen »Glossarium« findet sich die Bemerkung, dass zwei totalitäre Bereiche existierten – Theologie und Technik; beide sorgten für die Schließung von Möglichkeitsräumen. Was für die Theologie unmittelbar einsichtig ist, benötigt im Fall der Technik eine paradox erscheinende Begründung. Schmitt kann durchaus erkennen, dass die vom Menschen erschaffene technische Umwelt Sicherheit und Versorgung garantiert, aber ebenso unabweisbar ist für ihn das Faktum, dass mit der systematischen Umzingelung des Lebens mit Technik die Selbstaufgabe des Menschen besiegelt wird. Diese überraschende Schlussfolgerung begründet Schmitt mit dem Hinweis auf den Verlust von »Offenheit« im Sinne einer »Bindungslosigkeit zur Umwelt«. Der Mensch wird zu einem Tier zweiter Ordnung.

Übertragen auf die neuesten techno-panoptischen Verhältnisse bedeutet die Sublimierung der optischen Instrumente, dass sich die Gerätenutzer nach und nach der Beobachtbarkeit ihrer feinmotorischen Bewegungen bewusst werden und beginnen, ihre Augenbewegungen und Gesten zu trainieren. Was ursprünglich als Beherrschung der äußeren Steuerung Geltung beanspruchte, läuft in Selbstdisziplinierung aus: Gehorsam gegenüber den Belangen der Apparatur. Auch wenn man dem weltanschaulichen Rigorismus Schmitts nicht folgen möchte, lassen sich Situationen ausmalen, in denen die registrierenden und reagierenden Sichtsysteme tatsächlich als Fortsetzung innerer Instanzen erscheinen: Der Autofahrer, der ekstatisch und selbstvergessen zu seinem Lieblingssong mitsingt, der aus den Lautsprechern in seinem Fahrzeug erschallt, wird ebenso zur Ordnung gerufen wie die Fahrerin, die dem Beifahrer die Hand auf das Bein legt und Blickkontakt mit ihm sucht. Oder hatte der Autolenker bei einem Unfall ein Handy in der Hand? Just dasselbe Smartphone, das als Unfallgefahr identifiziert wird, mag für zufällige oder nicht zufällige Mitbeobachter des Displays durch den Ausblendvorgang das sichtbare Zeichen liefern, dass der Besitzer etwas zu verbergen hat. Stellen die Signale aus der intelligenten Black Box für das Alltagsbewusstsein nicht mehr als Mahnungen dar, erkennt der konservative Kulturkritiker darin Disziplinierungstechniken oder, mit einem Wort Marshall McLuhans, »Massagen«, deren Tiefenwirkungen noch nicht abzuschätzen sind.

Die Furcht vor dem Zusammendrängen von ›bios‹ und ›techné‹ bietet sich für dystopische Fiktionen über die Selbstaufgabe des Menschen an, die vielfach in Romanen, Spielfilmen und Videogames genussfertig ausgemalt wurden. Verlässt man hingegen den Bereich des Fantastischen und bleibt alltagsnäher, so lässt sich feststellen, dass es ein Nebeneinander von verschiedenen Verhaltensstufen gibt, die auch in Konflikt miteinander gebracht werden können. Es ist nämlich gerade die technische Rigidität, die Gegenverhalten zu stimulieren vermag: Wird sich der Getrackte der Tatsache bewusst, dass das Eye-Tracking-System einen Abstraktionsvorgang am Gesicht vollzieht und es als mimisch-expressives Interface zur Umwelt auslöscht, kann er sich im Gegenzug in einem Akt der Selbstimagination als Virtuosen der fazialen Selbstinszenierung vorstellen. Durch kontrollierte mimische Choreografien, zu denen unweigerlich Augenbewegungen gehören, kann die Apparatur zu irrationalen, funktionslosen Reaktionen veranlasst werden. Der Schau-Spieler, der mit Augendrehen, rhythmischem Zwinkern, rasanten Kopfbewegungen, Starrblick oder Zuckungen agiert, erzeugt einen dadaesken Unsinn im intelligenten System. An derartig unangepasste Eskapaden und subversive Spiele wird der Normalkonsument kaum denken. Der Exzentriker hingegen kann die Erfahrung machen, dass ›Intelligenz‹ weniger in der technischen Anlage steckt, dafür in system-nonkonformem Verhalten. Durch kontrollierte ›Auseinandersetzung‹ enthüllt sich die Begrenztheit des Systems.

Das Gedankenspiel unangepassten und dysfunktionalen Verhaltens mag sich skurril ausnehmen, korrespondiert jedoch mit Strategien der Surveillance Art. Diese Kunst hat seit den Mittneunziger Jahren des 20. Jahrhunderts vielfältige Formen der kritischen Reaktion auf die politischen Bemühungen um öffentliche Sicherheit und Kriminalitätsverhinderung durch Überwachungstechnologien hervorgebracht. Zu den Maßnahmen des Widerstands gegen die Gesichtserkennung dienen vor allem Maskeraden und Camouflage-Techniken. In jüngster Zeit ist allerdings eine Tendenz zu beobachten, die das Gesicht nicht mehr als Reservat betrachtet, das mit Ablenkungs- und Unsichtbarkeitstechniken beschützt werden müsste. Auf der 2019er Ars Electronica in Linz waren auffällig viele medienkünstlerische Arbeiten mit dem Motiv des Antlitzes ausgestellt. Zentrales Anliegen war nicht mehr die Problematik der Erfassung, vielmehr wurde das Gesicht als ästhetisch manipulierbar, konstruierbar, transformierbar, belebbar und neukontextualisierbar ausgewiesen. Das Interesse am Porträt lag demnach wieder bei der expressiven Qualität, nun jedoch unter dem Aspekt medientechnischer Verfügung und überraschender ästhetischer Neufigurierung. Entspricht diese Kunstentwicklung einerseits dem Trend in der visuellen Medienkultur, das Gesicht als Image zu traktieren, setzt sich andererseits darin das modernitätstypische Kunstverhalten fort, die Grenzen der Darstellung und des Darstellbaren auszudehnen. Auch wenn sich die Kategorie des Ausdrucks bei den Exponaten der Ars Electronica als vollständig entpsychologisiert, denaturiert und damit losgelöst vom Diktat der Authentizität darstellte, lässt sich an dieser Entwicklung eine Parallele zur Situation in den 1920er Jahren ziehen. Der Vergleich ist lohnend, denn die Frage, worin der Berührungspunkt zwischen den neuartigen Sichtungsapplikationen einerseits und der medienkünstlerischen Porträtbearbeitung andererseits besteht, bekommt aus dem historischen Hallraum eine Antwort.

Schon vor hundert Jahren gerieten Maschinisierung in industrieller Ausprägung und Kunst in Gestalt des Expressionismus in einen Spannungszusammenhang. Ernst Bloch hat in der überarbeiteten Fassung von »Geist der Utopie« (1923) sehr eingehend die kulturformende Kraft der Zweckhaftigkeit, die in den industriell hergestellten Dingen steckt, mit dialektischem Werkzeug analysiert. Auf telegrammhafte Kurzform gebracht, lautete Blochs Diagnose: Der Billigkeit der massenhaft auftretenden Dinge wird eine kunstferne Schicht des Ornamentalen aufgetragen, die als etwas Unechtes erlebt wird und die Hässlichkeit der lieblos hergestellten Güter umso mehr hervortreten lässt. Dem Verdacht gemütlicher Rückwärtsgewandtheit ins Kunsthandwerkertum entgehend, erkennt der Philosoph im industriellen Produzieren durchaus die erleichternden Qualitäten, die allerdings wegen des kapitalistischen Wertschöpfungsinteresses nicht kultiviert werden. Mehr noch, für Bloch entspringt aus dem funktionalistischen Charakter der angemahnten »humanistischen Technik« der Umschwung, »soll Erleichterung geschehen und zugleich Grenze, Umschlag der Zweckform des Maschinengeistes, Erscheinung frei gewordener […] rein expressiver Buntheit und Fülle. […] Die Bedingungen der Möglichkeit der Maschine und ihrer reinen Verwendung sind letzthin geschichtsphilosophischer Art, eng verbunden mit den Bedingungen der Möglichkeit eines antiluxuriösen Expressionismus.«

In dieser Sichtweise erscheint die Kunst des Expressionismus als hervorgegangen aus der Zweckhaftigkeit und doch im Widerspruch dazu. Gleiches lässt sich für die Porträtkunst der heutigen Medienkunst annehmen. Sie will nicht wie die Surveillance Art in den Krieg gegen die neuen Medien ziehen, sie will vielmehr das Andere des Gesichts kenntlich machen: Aus der erfahrenen Armut der reflexhaften Maschineninteraktion entsteht der dialektische Kraftstoß, der darüber hinausweist. Wenn die Ausdruckstänzerinnen der 1920er Jahre ihre Körper verrenkten und ihre Antlitze in Grimassen verwandelten, dann zeigten sie damit ihre Freiheit gegenüber vorgestanzten und eingeübten Pathosformeln an. Wenn heute das Gesicht mit Morphing-, Granularisierungs- oder AI-Programmen zu undenklichen Formen verarbeitet wird, dann steht den Betrachtern dieser Kunst ebenfalls ein »neuer Überschwang« zu Gebote, der sich – auch im Angesicht-zu-Angesicht mit den optischen Registratur-Devices – in expressiv-ludische Performances übersetzen lässt.

Galt Blochs Kritik dem heruntergekommenen Ornament, das er in einem »›Kunstgewerbe‹ höherer Ordnung« aufzuheben beabsichtigte, entwickelt sich heute aus der Funktionalisierung der Gesichtserkennung ein Gesichtsbewusstsein höherer Ordnung. Der Versuch, die Technologien als lebensweltliche Selbstverständlichkeiten erscheinen zu lassen, sie also unterhalb der Wahrnehmungsschwelle zu halten, mag in weiten Teilen gelingen. Es ist aber auch genau diese Modalität des Entzugs, die Auffälligkeit erzeugen kann, weil das einbezogene Subjekt sich seiner Handlungsfähigkeit beraubt fühlt, weil es das Zögern und das Entscheiden vermisst. Eine mögliche Reaktionsform besteht darin, dass es dem ›beobachtenden‹ System ein Gesicht schneidet.

Die faziale Clownerie ist zweifelsohne unerheblich. Doch zeichnet sich eine Entwicklung ab, welche die Spielerei in einem anderen Licht erscheinen lässt. In den aktuellen High-End-Smartphones sind bereits Emotion-Tracking-Apps verbaut, und bereits in fünf Jahren soll die Mehrzahl aller elektronischen Geräte mit einem Emotion Tracking-System ausgestattet sein. Die Emotion-AI liest in der Nacktheit des Gesichts, die »Emotion Analytics« ermitteln Intentionen und Bedürfnisse, um die Versorgung mit Content auf die nächste Stufe der Befriedigung zu heben. Das Grimassieren wird unter diesen Bedingungen eine andere Qualität bekommen.

 

Schreibe einen Kommentar