ElevenLabs V3 – die KI kann jetzt auch flüstern

News  |  06/06/2025

Jetzt werden deine KI-Stimmen noch authentischer. Warum? Weil es ein neues Modell von ElevenLabs gibt: ElevenLabs V3. Und das kann sogar flüstern oder lachen oder ... Schau dir das mal genauer an. Oder hör in die Audio-Aufnahmen rein, dann weißt du genau, was ich meine.

v3 elevenlabs - noch authentischere KI-Stimmen


Das neue Modell ElevenLabs V3

ElevenLabs hat mit dem V3-Modell einen bedeutenden Schritt in der KI-Sprachsynthese gemacht. Durch die Einführung von Audio-Tags kannst du nun Emotionen, Sprechstile und sogar Soundeffekte direkt im Text einfügen und steuern. Dies eröffnet dir neue Perspektiven für die Erstellung von realistischen Hörbüchern, Podcasts, Dialogen und Voiceovers.


🎭 Emotionale Vielfalt mit Audio-Tags

Mit den neuen Audio-Tags kannst du Emotionen und Sprechstile präzise steuern. Hier einige Beispiele:

  • Emotionen: [excited], [sad], [angry], [happily], [sorrowful]
  • Sprechstile: [whispers], [shouts], [sarcastic], [curious], [mischievously]
  • Reaktionen: [laughs], [sighs], [starts laughing], [wheezing], [snorts]

Diese Tags kannst du direkt in den Text einfügen und so die gewünschte Stimmung oder Reaktion erzeugen.

🧪 Beispiele für den Einsatz von Audio-Tags

Beispiel 1: Emotionale Erzählung

[excited] You won't believe what happened next!

Die Stimme klingt hier begeistert und mitreißend.

Beispiel 2: Flüsternder Ton

[whispers] I have a secret to tell you.

Die Stimme wird leise und vertraulich.

Beispiel 3: Sarkastischer Kommentar

[sarcastic] Oh, that's just fantastic.

Die Stimme vermittelt Ironie und Spott.

elevenlabs V3 - noch authentischere KI-Stimmen

Hör doch mal rein:

elevenlabs V3 - noch authentischere KI-Stimmen



Feineinstellungen für optimale Ergebnisse

Neben den Audio-Tags bietet ElevenLabs V3 weitere Einstellungen mit der du die Stimmen  optimieren kannst:

  • Stability: Regelt die Konsistenz der Stimme. Niedrigere Werte führen zu mehr Ausdruck, höhere zu stabilerer Aussprache.
  • Similarity Boost: Erhöht die Ähnlichkeit zur Originalstimme, was besonders bei Voice-Cloning nützlich ist. 
  • Style Exaggeration: Verstärkt den gewählten Sprechstil, um bestimmte Effekte zu betonen.

Mit diesen Einstellungen kannst du die generierte Stimme präzise an deine Wünsche anpassen. 



🌍 Unterstützung für mehr als 70 Sprachen

ElevenLabs V3 unterstützt mehr als 70 Sprachen, darunter Deutsch, Englisch, Französisch, Spanisch und viele weitere. So kannst du auch schnell und leicht mehrsprachige  Inhalten mit konsistenter Qualität und Ausdrucksstärke produzieren.


Fazit

Mit ElevenLabs V3 und den neuen Audio-Tags kannst du KI-generierte Stimmen noch realistischer und ausdrucksstärker gestalten. Ob für Hörbücher, Podcasts oder interaktive Anwendungen – die Möglichkeiten sind vielfältig und eröffnen neue kreative Wege in der KI-Sprachwelt.


Das könnte dich auch interessieren:


Bleib up to date!