Hierstetter: „Die große Angst vor KI war eine Überreaktion“

Vor allem in diesem Jahr wird sich zeigen, welche KI-Anwendungsfälle für die Kommunikationsbranche wirklich praktikabel sind und welche nicht. Wir sprachen mit dem mehrfachen Digitalgründer Armin Hierstetter, der den Sprecher-Marktplatz Bodalgo betreibt, über seine Sicht der Dinge.

Sie haben seit Jahren den Erfolgreichen Sprecher-Marktplatz Bodalgo. Nun sind plötzlich die KI-Stimmen total angesagt. Laufen Ihnen jetzt die Kunden scharenweise davon?

Hierstetter: Nein, das tun die zum Glück nicht (lacht). Für Bodalgo war Qualität seit der Gründung 2008 von entscheidender Bedeutung. Jede Stimme auf Bodalgo wird hinsichtlich Professionalität geprüft. Diese Herangehensweise zahlt sich aus, denn unsere Kunden wissen, dass sie immer die perfekte Stimme finden und am Ende ein herausragendes Ergebnis erhalten. KI-Stimmen sind zwar sehr weit gekommen, aber immer noch himmelweit davon entfernt, mit professionellen Sprecherinnen und Sprechern konkurrieren zu können. Das wird auch so noch sehr lange so bleiben.

Aber noch etwas genauer nachgefragt, wie wird sich denn das Sprecher-Geschäft bei Ihnen künftig verändern?

Hierstetter: Überhaupt nicht. Schauen Sie: Diejenigen, die heute KI-Stimmen verwenden, tun dies meist, weil sie nicht das Budget haben, einen Profi ranzulassen oder aber die Notwendigkeit für qualitativ hochwertigen Content nicht sehen oder vielleicht auch nicht haben. Die gehen dann auf Plattformen wie Fiver, wo sich zahllose Amateure für wenig Geld anbieten oder probieren es mit einer AI-Stimme. Diese Gruppe zählt aber nicht zu den Kunden von Bodalgo, deshalb spüren wir auch keine Auswirkungen. Wo ich übrigens echtes Potential sehe: Die Stimme KI-mäßig zu verändern, so wie das im neuen Pumuckl-Film gemacht wurde. Ein Synchronsprecher hat die Rolle eingesprochen, danach wurde die Stimme so verändert, dass Sie wie Hans Clarin klingt. KI allein hätte das nicht geschafft, weil die schauspielerische Darbietung gefehlt hätte. 

Mit dem Thema KI scheinen Sie sich aber intensiv zu beschäftigen. Mit Bodalgo Scripta bieten Sie insbesondere Journalisten eine Möglichkeit, Texte für Interviews per KI übersetzten und transkribieren zu lassen. Warum haben Sie sich dazu entschlossen, so etwas anzubieten?

Hierstetter: Klar ist KI generell ein wichtiges und spannendes Thema. Und es bietet fantastische Erleichterungen wie zum Beispiel Transkription, die wirklich ungeheuerlich gut funktioniert. Wenn Sie dieses Interview aufnehmen und hinterher abtippen müssen, dann sind Sie vielleicht eine halbe Stunde damit beschäftigt. bodalgoScripta erledigt das in 30 Sekunden. Transkription ist eine Dienstleistung, die bei bodalgo gut ins Portfolio passt. Deshalb haben wir das als Service aufgenommen. Wir verwenden KI aber auch an anderer Stelle, zum Beispiel um bei Sprecher-Castings KI-generierte Empfehlungen zu geben, wie Kunden das Briefing für Castings verbessern können, um relevantere Auditions zu erhalten. So eine Funktionialität hilft allen: Sprecher bekommen ein besseres Gefühl, was der Kunde will, und der Kunde erhält passendere Angebote.

Viele Experten empfehlen konkret die KI-Stimmen von Eleven Labs für den praktischen Einsatz. Und tatsächlich nutzen jaweltweit gesehen erstaunlich viele Content Creators vor allem deren  Stimme „Adam“. Und es gibt ja fast täglich Verbesserungen an den Stimmen. Warum werden denn Ihrer Meinung nach echte Stimmen auch im Social Media-Bereich nie ganz aus der Mode kommen?

Hierstetter: Sie haben das Argument schon in der Frage geliefert: Alle nutzen „Adam“. Als Marke strebe ich für meine Produkte und Dienstleistungen aber eine differenzierende Positionierung an. Adam ist dann wohl keine gute Wahl. Natürlich wird es künftig eine unbegrenzte Auswahl an KI-Stimmen geben. Aber dies löst ein weiteres Problem nicht: Interpretation von Texten, Regie von Sprechern etc. Sagen Sie Adam doch mal: ‚Schön, Adam, das klingt schon ganz gut. Jetzt aber noch mit ein bisschen ‚roter Teppich‘ in der Stimme. Sei ein bisschen Arrogant, so mit einem Augenzwinkern, damit es dennoch nahbar bleibt.‘ Viel Glück damit.

Nun gibt es ja bereits erste Stimmen und Analysen, wonach der KI-Hype im nächsten Jahr etwas nachlassen könnte. Sie beobachten den Markt täglich. Welche Erwartungen haben Sie insbesondere hier in Deutschland?

Hierstetter: Der Hype um KI selbst wird bleiben, das entwickelt sich ja so rasant, dass man gar keine Zeit hat, sich an den Hype zu gewöhnen. Bei KI-Stimmen sieht’s anders aus: Meiner Meinung nach haben hier die Sprecherinnen und Sprecher überreagiert mit ihrer Angst vor AI-Stimmen. Was viele nicht beachten: Audio-Produktion ist ein People Business. Die Produktionsfirmen wollen mit echten Stimmen arbeiten. Mit Stimmen, von denen sie genau wissen, was sie am Ende erwartet. KI-Stimmen sind ein Glücksspiel. Weil Sie nie wissen: Spricht der jetzt alles korrekt aus? Was, wenn die Aussprache daneben liegt? Oder die Betonung nicht passt? Klar kann man immer anpassen, aber dann müssen Sie auch wieder einen Menschen hinsetzen, der das dann nach Wunsch hinbiegt. Dann kann ich es auch gleich einen Profi sprechen lassen.

US-Prsäident Joe Biden hat diese Woche ein Dekret erlassen, wonach sich künftig KI-Anbieter unter anderem zu bestimmten Tests verpflichten müssen, wenn die Programme Risiken für die nationale Sicherheit sowie die öffentliche Gesundheit und Sicherheit darstellen. Begrüßen Sie die Initiative?

Hierstetter: Nein, das halte ich für puren Aktionismus. Der Staat sollte meiner Meinung nach erst dann eingreifen, wenn es auch etwas zu reglementieren gibt. Klar, dann ist das Kind schon in den Brunnen gefallen, sagen dann die anderen, und dass man vorher hätte einschreiten sollen. Aber immer a priori den Teufel an die Wand zu malen, schadet der Innovationskraft.

Vielleicht muss man die Dinge auch differenziert sehen. Etwa beim hochskalieren von Bildern mittels KI gibt es doch kaum Risiken. Muss überall der Staat jetzt genauer hinschauen? Die Frage ist ja auch, ob das international gesehen kontrollierbar sein wird.

Hierstetter: Hinschauen soll der Staat natürlich, das ist ja auch mit seine Aufgabe. Ich denke aber, dass wir bereits jetzt ausreichend Gesetze haben, die uns schützen. Nur weil jemand KI nutzt, um zum Beispiel unlauteren Wettbewerbsvorteil zu erlangen, braucht es ja keine neuen Gesetze. Viel komplizierter ist natürlich die Frage, wie man vorgeht, wenn KI-Modelle mit Daten und Werken von Dritten trainiert werden. Die Gefahr ist hier, das Augenmaß zu verlieren bei der Frage: Was ist sinnvoll, wann schießen wir über das Ziel hinaus. Ich bin froh, diese Frage nicht beantworten zu müssen. 

Es wird ja immer so getan, als würde die KI nun fast jeden Lebensbereich durchdringen. Welche Erfindung fanden Sie denn bis jetzt am sinnlosesten?

Hierstetter: Schwierig finde ich KI-basierte Technologie immer dann, wenn Sie uns selbständiges Denken abgewöhnt. Ich brauche keinen Kühlschrank, der automatisch bei Knuspr.de, Flaschenpost oder Amazon Fresh Milch kauft.

Foto: Bodalgo

Intreview: dh