Stimmsynthetisierung

zurück zur Übersicht

Die Stimmsynthese beschreibt das Einsprechen von Prompts, aus welcher eine synthetische Stimme (also eine geklonte Stimme) generiert werden kann. Hierzu muss aktuell eine große Menge an Text / Prompts in hoher Aufnahmequalität eingesprochen werden, um ein natürliches Klangbild mit einer Vielzahl an Varianten in Betonung, Sprachmelodie, Modulation etc. herstellen zu können. Dazu muss die Sprecherin an mehreren Tagen ins Studio kommen, um diese Prompts einzusprechen.

Da die einmal angefertigte Basis-Synthese im Anschluss in einer Vielzahl an Produktionen Verwendung finden kann und sehr viel Text einzusprechen ist, wird die Aufnahmezeit pro Tag auf maximal 5 Stunden inkl. Pausen festgelegt, um Heiserkeit oder eine Überbeanspruchung der Sprechmuskulatur zu vermeiden und damit eine hohe stimmliche und phonetische Qualität der eingesprochenen Texte und anschließenden daraus entstehenden vielfachen Veröffentlichungen zu gewährleisten.

Die im KI-Gagenkompass abgebildeten Gagen zur Aufnahme für die Stimmsynthese bilden ausschließlich die Aufnahme und Studiotage für die interne Nutzung zur Synthetisierung ab. Eine Verwertung, auch in Pitches, Layouts, Moodfilmen u.ä. ist nicht inbegriffen.

Der Hersteller der Synthese kann jedoch eine vorab zu vereinbarende Anzahl an Demos mit definierten Texten zur Bewerbung der synthetischen Stimme für seine Kartei, Website usw. erstellen und veröffentlichen. Bei einer Buchung der KI-Stimme fallen dann die Verwertungsgagen gem. Gagenkompass an.

Vor jeglicher Stimmsynthese muss ein vollumfänglicher Vertrag zwischen Auftraggeber:in und Sprecher:in geschlossen werden, welcher alle relevanten Parameter abdeckt.