Text-to-SpeechDieser Mann hat seine Stimme verschenkt

Thorsten Müller hat eine KI-gestützte Sprachausgabe entwickelt, die jeder Mensch frei nutzen darf. Müllers Stimme liest Texte nicht nur neutral, sondern auf Wunsch auch wütend, betrunken oder hessisch vor.

Thorsten Müller hält zwei Daumen nach oben.
Thorsten Müller will mit seiner Stimme Barrieren abbauen. – Alle Rechte vorbehalten Thorsten Müller

Thorsten Müllers Stimme sagt alles, was man von ihr will. Sie macht Dirty Talk und liest Märchen. Sie ruft radikale Parolen und säuselt Liebesgedichte. Denn Thorsten Müllers Stimme gehört ihm nicht mehr. Er hat sie zum frei verfügbaren Gut gemacht.

Ein digitaler Klon von Müllers Stimme, die Thorsten-Voice, ist im Netz kostenlos herunterladbar. Einsatzzweck: unbegrenzt. Wer möchte, darf sie sogar für kommerzielle Zwecke nutzen. Texte bis 500 Zeichen kann man sich auch direkt im Browser vorlesen lassen. Die Leseproben klingen erstaunlich natürlich. Müllers Stimme beherrscht sogar den Glottisschlag, der zum Gendern verwendet wird.


Müller, von Beruf Informatiker, ist ein Optimist. Einer der aus freien Stücken Gutes tut, einfach um die Welt angenehmer zu machen. Sein Credo ist: „Für mich sind alle Menschen gleich, unabhängig von Geschlecht, sexueller Orientierung, Religion, Hautfarbe oder Geokoordinaten der Geburt.“

Müller glaubt an eine Welt, „wo jeder überall willkommen ist und freies Wissen und Bildung kostenfrei für jeden zur Verfügung steht.“ In der Hoffnung, dass seine Stimme in diesem Sinne genutzt wird, hat er sie der Allgemeinheit gespendet. Er hofft, damit einen Beitrag zur Barrierefreiheit zu leisten.

Müllers Angebot wird umfangreich angenommen. Ein Lernsoftwarepaket der Berner Fachhochschule liest Menschen mit Sehbehinderung die Bildschirminhalte mit Müllers Stimme vor. Ein Berliner Informatiklehrer lässt Schüler*innen damit beispielsweise Zeit- oder Wetteransagen bauen. Eine Gemeinde will die Stimme für ein hyperlokaljournalistisches Audio-Angebot nutzen.

Die Stimme kann sogar Hessisch

Ein Bastler hat ein Roboterskelett gebaut, das wie Müller spricht. Seine Stimme ist auch Bestandteil eines KI-Baukastens des Chiphersteller Nvidia. Die quelloffene Smart-Home-Steuerung Home Assistant hat sie ebenfalls im Portfolio. Müllers Stimme wird zudem in mehr als 20 wissenschaftlichen Arbeiten erwähnt oder genutzt.

Thorsten Müllers Stimme gibt es nicht nur in normal-neutral, sondern sie klingt auf Wunsch auch fröhlich, wütend, angewidert, betrunken, schläfrig oder flüsternd. Eine Variante spricht sogar mit authentischem hessischem Dialekt. Wobei sich diese ausgerechnet mit dem berühmtesten hessischen Zungenbrecher etwas schwertut.

Banner mit Text: Finanziert durch euch! Journalismus mit Haltung. Garantiert nicht neutral. Nur möglich dank deiner Unterstützung. Spende jetzt.

Über 35.000 Aufnahmen mit jeweils einer Textdatei dazu hat Müller für das Projekt erstellt. 30 Stunden Gesamtlaufzeit. Ende 2019 hat er damit angefangen, später extra in ein hochwertiges Mikrofon und eine Sprecherkabine investiert. Mit Hilfe von sogenannter künstlicher Intelligenz hat er aus den Aufnahmen dann einen Klon seiner Stimme errechnet, der auch Dinge sagen kann, die Müller nicht eingesprochen hat.

Fake-Anrufe? Die Familie ist schon gewarnt

Über zehn Wochen am Stück hat sein Computer dafür pausenlos gerechnet. Details zum Projekt verrät Müller in seinem YouTube-Kanal.

Anfangs hat er Thorsten-Voice nur als Hobby für den privaten Gebrauch betrieben. Die Entscheidung, seine Stimme zu verschenken, kam später. Und sie ist ihm nicht leichtgefallen, sagt Müller. Er hat einige Nächte darüber geschlafen und verschiedene potenzielle Probleme gewälzt. „Die Stimme ist ja etwas sehr Persönliches“, sagt er.

Müller sorgte sich beispielsweise, ob er, wenn sich die Autorisierung per Stimme weiter verbreitet, von deren Nutzung im Online-Banking oder an der eigenen Haustür ausgesperrt würde. Und es wäre ja beispielsweise auch möglich, dass jemand seine Stimme nutzt, um sich als er auszugeben – und zum Beispiel von Familie oder Freunden Geld zu fordern. Müller sagt, er habe inzwischen seine Familie gewarnt. „Wenn ihr einen Anruf bekommt, der suspekt wirkt, solltet ihr besonders aufpassen.“

Eine weitere Sorge von ihm war: „Was ist, wenn meine künstliche Stimme Dinge sagt, die mir total konträr sind?“ Diese Sorge hat sich inzwischen bewahrheitet. Eine Person aus dem Reichsbürgerspektrum hat damit YouTube-Videos vertont, die beispielsweise die Rechtmäßigkeit der Bundesrepublik Deutschland in Frage stellen. „Das war kein gutes Gefühl“, sagt Müller.

Er habe sich daraufhin gefragt, ob er mit dem Verschenken seiner Stimme einen Fehler gemacht habe. Doch die positiven Nutzungen würden deutlich überwiegen. „Zu sehen dass man einen minimalen Beitrag leistet, um Leute zu unterstützen, das ist einfach nur geil“, sagt Müller.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

3 Ergänzungen

Wir freuen uns auf Deine Anmerkungen, Fragen, Korrekturen und inhaltlichen Ergänzungen zum Artikel. Bitte keine reinen Meinungsbeiträge! Unsere Regeln zur Veröffentlichung von Ergänzungen findest Du unter netzpolitik.org/kommentare. Deine E-Mail-Adresse wird nicht veröffentlicht.