In meinem Artikel „Text2speech, also Sprachgenerierung aus Text ist gar nicht so einfach“ vom April 2024 (Link) hatte ich über die Schwierigkeit berichtet, eine Lösung für Text-to-speech (kurz: TTS) in gesprochenem Deutsch zu finden, die annehmbar klingt und Umlaute korrekt ausspricht. Die meisten Lösungen basieren auf mehr oder weniger gutem Englisch.
Leider werden die meisten Lösungen kostenpflichtig als cloudbasierte Dienste angeboten. Die, besserer Qualität, in der Regel kostenpflichtig, wenn auch nicht unbedingt überteuert. Aber da in der Regel für die Generierung Open source-Software verwendet wird, bzw. es Open souce-Lösungen für diese Zwecke gibt – ziemlich viele Lösungen sogar –, war es einfach eine Frage der Suchmethodik, das passende zu finden.
Über so eine Suche stieß ich auf das Projekt https://thorsten-voice.de/ und damit auf Thorstens Youtube-Kanal. Folgendes etwa viertelstündiges Video beantwortet nahezu alle meine Fragen zu kostengünstigen TTS-Lösungen. Ich suche so eine Lösung zur Vertonung von Videoclips. Jetzt habe ich alle Werkzeuge beisammen: Thorsten-Voice TTS in Windows nutzen | DDC / VITS; Tosten zeigt auch Lösungen für andere Betriebssysteme.
Kommentare
Keine Kommentare
Kommentare