Ich würde Clipchamp jetzt nicht unbedingt als reines KI-Werkzeug bezeichnen. Allerdings gibt es darin eine KI-Funktion namens Text-to-Speech. Und nur die wollen wir uns ansehen. Da gibt es die Auswahl zwischen ca. 50 Sprachen und ca. 80 Avataren. Trotzdem ist das Programm sehr einfach gehalten und mit sehr wenigen Klicks zu bedienen.
Für Amateurfilmer, die glauben keine gute Sprecherstimme zu haben oder eventuell keine gute technische Ausstattung für Mikrofonaufnahmen haben, ein tolles Werkzeug. Ich habe schon wirklich viele Filme gesehen, bei denen die Intonation des Sprechers völlig daneben war oder bei jedem Satz die letzte Silbe verschluckt wurde. Da hätte so eine Funktion Wunder gewirkt.
Das Programm Clipchamp ist von Microsoft® und ist ein Stück weit der Nachfolger vom guten alten MovieMaker.
Clipchamp gehört zum Lieferumfang von Windows 11. Nutzer von Windows 10 können das Programm über das Internet nutzen (app.clipchamp.com). Allerdings nur mit den Browsern Edge und Google Chrome. Firefox, Opera und Safari sind leider außen vor. Es gibt eine kostenlose Version und natürlich eine Kostenpflichtige, die mit happigen € 20,-- pro Monat zu Buche schlägt. Die Investition ist sicherlich nur interessant, wenn man das Tool jeden Tag benutzt. Ich bin bisher mit der kostenlosen Version gut klar gekommen.
Clipchamp ist ein einfach zu bedienendes Videoschnittprogramm, dessen Möglichkeiten recht begrenzt sind.
Zur Demonstration der Möglichkeiten von Text-to-Speech bediene ich mich bei einem kurzen Text über das Richter-Fenster im Kölner Dom, den ich von ChatGPT habe generieren lassen. Damit erkennt man schnell die Stärken und Schwächen von Text-to-Speech. Du kannst aber einen beliebigen Text deiner Wahl dafür nehmen.
Nach dem Programmstart klickst du auf „Neues Video erstellen“.
Klicke auf Aufnehmen und kreieren (1), dann auf Text-to-Speech (2), wähle die Sprache (3), die Stimme (4) und kopiere deinenText in das Text-Feld (5). Über Vorschau (6) kannst du dir das Ergebnis anhören und ggfls. am Text Korrekturen vornehmen. Bist du mit dem Ergebnis zufrieden, klickst du auf Speichern (7).
Abhängig von der Textmenge erscheint nach kurzer Zeit in der Timeline die generierte Audiospur (1). Über Exportieren (2) kannst du auswählen, in welchem Format du den Export durchführen möchtest. Da man die Audio-Spur nicht separat sichern kann, speichert man das als MP4-Datei und muss dann im Schnittprogramm Audio- und Videospur trennen. Wenn man keine Bilder oder Videos über der Audiospur platziert hat, ist das Bild sowieso schwarz.
Vergib einen Namen (1) und klicke dann über Auf Computer speichern (2), um die Datei an einem beliebigen Ort abzulegen. Zeitgleich wird im Ordner Downloads bereits das Video mit der Audio-Spur gespeichert (3). Je nach Länge des Clips kann die Renderzeit variieren. Aber das kennen wir ja alle.
Ergebnis:
Wenn man sich das anhört fallen einem mit Sicherheit Stellen auf, die nicht so gut klingen. Bei diesem Beispiel war die Pause zwischen Kölner und Dom einfach zu kurz. Das habe ich mit einem Komma zwischen den beiden Wörtern hinbekommen. An anderen Stellen hat das Setzen eines Punktes, obwohl der Satz dort nicht zu Ende war, geholfen. Die Zahl 11.263 wurde ganz falsch interpretiert. Nämlich als elf Punkt zweihundertdreiundsechzig. Den Punkt wegzulassen hat es auch nicht besser gemacht, also habe ich die Zahl in Worten ausgeschrieben. Trotzdem muss ich sagen, dass das Ergebnis insgesamt wirklich beeindruckend ist. Kein Rauschen des PC-Lüfters, keine Atemgeräusche, keine vorbeifahrenden Autos, keine Versprecher oder Stotterer, keine verschluckte letzte Silbe, kein Absacken der Stimme usw. usw.
Tipp:
Lasse genug Abstand zwischen den Textblöcken. Man kann sie dann sauber auseinanderschneiden und im Schnittprogramm exakt dort positionieren, wo sie hingehören. Auch bei Intonationsfehlern muss man mal mit Satzzeichen, wie z.B. dem Bindestrich, Punkt, Komma oder mal ein paar Leerzeichen versuchen, die Intonation zu korrigieren. Bei z.B. englischen Wörtern musst du kreativ werden. Statt Clipchamp kannst du auch Clipchemp oder etwa Clipchämp schreiben, damit diese korrekt ausgesprochen werden.
Noch ein Tipp:
Über die Schaltfläche Erweitert kannst du die Stimme höher oder tiefer einstellen und die Sprechgeschwindigkeit verändern.
Fazit:
Eine enorme Hilfe für Filmer ohne „gute“ Stimme oder ohne gute Aufnahmemöglichkeiten.