News Neues OpenAI-Modell: „Voice Engine“ kann mit 15-sekündiger Sprachaufnahme die Stimme klonen

daniel.e. schrieb:
Spaß beiseite, ich sehe da persönlich mehr Gefahr als Nutzen. Bei anderen Entwicklungen in der KI sehe ich mehr Potential und weniger direkte Gefahr.

Hoffen wir das es dann auch clevere Tools gibt die Missbrauch verhindern

1. Du kannst es nicht verhindern
2. Stelle dir vor du erstellst ein Film und kannst die Original Stimme vom Schauspieler in jede Sprache automatisch transformieren. Du kannst dir so alle Synchronsprecher sparen und der Zuschauer hat auch noch etwas davon. Auch kannst du dir Bücher z.B. von deiner Lieblingsperson vorlesen lassen. Sei es ein Autor oder die Mutter. Das sind einfache Beispiele von Hunderten.
 
  • Gefällt mir
Reaktionen: Alioth
Ayo34 schrieb:
Du kannst dir so alle Synchronsprecher sparen
Super für unabhängige Filmemacher. Gleichzeitig fallen dadurch zahlreiche Jobs weg, was dafür sorgt, dass bei Großen Produktionen die Gewinne noch mehr konzentriert werden. Man nehme einen Hollywood-Blockbuster, der in 20 Sprachen oder so übersetzt wird. Für jeden Sprache kommen mal schnell dutzende Synchronsprecher zum Einsatz, also insgesamt hunderte. Und in Zukunft? Ein einzelnes Unternehmen, welches die geschützten Algorithmen und die Rechenleistung hat, macht das.

An sich ist die Technologie ja cool, sorgt aber nur für noch mehr Macht von einzelnen Großkonzernen, die Gewinne abschöpfen werden, was die Schere zwischen arm und reich weiter auseinandergehen lassen wird.
 
  • Gefällt mir
Reaktionen: Strahltriebwerk
germanrule schrieb:
Super für unabhängige Filmemacher. Gleichzeitig fallen dadurch zahlreiche Jobs weg...

Genauso wie in den letzten 100 Jahren davor? Neue Technologien kosten Arbeitsplätze. Hätten wir die Bahn und das Auto nicht eingeführt, wären heute die ganzen Kutscher nicht arbeitslos. -.-
 
  • Gefällt mir
Reaktionen: Dark_Soul, Cruentatus, Alioth und eine weitere Person
Ich bin gespannt wann man nur noch durch Text Eingabe ganze Filme mit Musik, Effekten, Stimmen, Charaktere, Welten erstellen kann. Glaube des wird ne geile Zeit für erstellte Filme von jedermann.
Aber klar des ganze hinfaken von Tatsachen wird gigantisch.
Ich würde sagen die Glaubwürdigkeit von Digitalen inhalten mit realen Bezug ist erstmal Tod. Einfach kein Gewicht geben, nach ein paar Tagen ist doch wieder alles anderst.
 
  • Gefällt mir
Reaktionen: Alioth
Wir brauchen nicht mehr diskutieren, ob wir das wollen - der Drops ist gelutscht. Es geht jetzt nur noch um die Frage, wie die Menschheit damit umgeht. Innerlich merke ich bei mir schon eine Tendenz, mehr noch als zuvor auf Durchzug zu schalten. Wenn ich mich nicht auf Authentizität verlassen kann, dann wird es belanglos.
 
  • Gefällt mir
Reaktionen: Kadett_Pirx, MonteDrago, Strahltriebwerk und 5 andere
Audioaufzeichnung = null Beweiskraft, will ich als verheerend ansehen, viele Menschen die dran zu Grunde gehen, ihr werdet es sehen/hören.
 
  • Gefällt mir
Reaktionen: Strahltriebwerk und germanrule
Naja es gibt ja schon einige künstliche Intelligenzen, die das können.
In China ist der Enkeltrick mit einer Stimmen-Nachahmung sehr geläufig. Deswegen, das Telefon nur mit "Ja" annehmen. Nicht mit "Hallo Mama"

Frage OT: Ich finde die Übersetzungfähigkeiten von Chat GPT echt beeindruckend. Nur doof, dass man ChatGPT erklären muss, dass er übersetzen soll. Gibt es nicht ein direktes Übersetzungsprogramm von OpenAI bzw mit ChatGPT-Anbindung?
 
Ayo34 schrieb:
Genauso wie in den letzten 100 Jahren davor? Neue Technologien kosten Arbeitsplätze. Hätten wir die Bahn und das Auto nicht eingeführt, wären heute die ganzen Kutscher nicht arbeitslos. -.-
Ich finde das ist nicht vergleichbar, Bahn und Auto haben Mobilität bezahlbar und schneller gemacht. Vorher konnten die meisten Leute sich das Reisen doch kaum leisten.
Ernste Frage, welche großen Probleme lösen KI-generierte Fotos/Videos/Audios? Gibt es noch nicht genug Medien zum konsumieren? Sind diese zu teuer für den Massenmarkt?
 
  • Gefällt mir
Reaktionen: Strahltriebwerk und wesch2000
Djura schrieb:
Ab sofot keine Sprachis via Messenger und Co. mehr versenden. Und nicht telefonieren. Lässt sich im beruflichen Umfeld nur schwer vermeiden. :(
wenn die Paranoia wieder heftig triggert, hm?
 
Kaum zu glauben, wenn man die Comments hier liest. Man hat nicht den Eindruck, es hier mit einem Fachforum mit etwas Begeisterung für Technologie zu tun zu haben. Kommt eher rüber wie an einem Bier-Stammtisch mit grantigen Leuten 50+, die jede neue Entwicklung und Technik an sich verteufeln!

Kein Wunder, dass aus Deutschland seit Jahren kaum bahnbrechende Innovation kommt, obwohl die Menschen an sich enorm intelligent und fleißig sind, wie sonst nirgendwo. Liegt einfach an der Jammerei und dem Schlechtmachen von allem, mit was man nicht alltäglich vertraut ist.
 
  • Gefällt mir
Reaktionen: Karlchen_Klemmt, Dark_Soul und Reglohln
Ist echt ein schwieriges Thema. Ich denke KI wird generell so disruptiv wirken wie kaum eine andere Technologie zuvor. Ich denke da an Synchronsprecher, Übersetzer, Callcenter, Contentcreator, Kreative im Allgemeinen uvm.
 
  • Gefällt mir
Reaktionen: Alioth
Es gibt schon länger Stimmenveränderer, die in Echtzeit die Töne ändern.
Ein Beispiel ist hier. Einfach mal anhören und schauen, wie einfach das geht. Das Ergebnis ist jedenfalls beeindruckend. Gura klingt wirklich wie Gura. Ich war baff, als ich das damals zum ersten Mal gehört habe.

Ich weiß aber nicht, wie lange es dauert, die dafür nötigen Models zu generieren. Es sind sicher nicht nur ein paar Sekunden. Als ich mich damals etwas eingelesen habe, habe ich von Leuten gelesen, die ihre Modells mit vielen Stunden an Audiomaterial trainieren.

Eigentlich ist der Missbrauch nicht mehr wirklich weit weg. Die Technik ist langsam so weit, dass man mit 2-3 Klicks jemanden die Stimme "stehlen" kann. Fürs Zocken aber auch teils in Social Media ist das eine interessante Technologie.

Btw, es gibt Leute, die trainieren sich andere Stimmen an. No app required. Hier ist zB ein Dude, der sich nach jahrelangem Training wie eine Frau anhört (weiße Untertitel). Vorsicht beim Nachmachen! Man kann sich mit dem falschen Training die Stimmbänder ruinieren.
 
Fortschritt heißt nicht, alles zu tun, nur weil wir es können.
 
  • Gefällt mir
Reaktionen: Nowareeng und wesch2000
Brati23 schrieb:
Schon ein heftiges Missbrauchspotential vorhanden.

Jetzt mal ganz blöd gefragt: Was ist denn eigentlich der Gebrauchsfall? Welchen normalen, nicht missbräuchlichem Zweck dient so etwas? Außer Satire/Memes fällt mir hier absolut rein gar kein nicht illegaler Anwendungsfall ein...

(die im Text genannten "Beispiele" holen mich nicht ab - all das sind keine Anwendungsfälle wo die "echte" Stimme zwigend erforderlich ist)
 
  • Gefällt mir
Reaktionen: Brati23
Sowas würde ich verbieten. Die Anwendungsbeispiele oben halte ich für an den Haaren herbei gezogen.
 
Alioth schrieb:
Kaum zu glauben, wenn man die Comments hier liest. Man hat nicht den Eindruck, es hier mit einem Fachforum mit etwas Begeisterung für Technologie zu tun zu haben. Kommt eher rüber wie an einem Bier-Stammtisch mit grantigen Leuten 50+, die jede neue Entwicklung und Technik an sich verteufeln!
Man muss halt auch überlegen welchen Fortschritt man erreichen will und warum.

Ich äußere mich hier durchaus kritisch. Dabei stimmen deine Annahmen überhaupt nicht zu, im Gegenteil. Ich bin sehr technikbegeistert und erfreue mich gerne an neuen Technologien, dafür gebe ich auch durchaus mal viel Geld aus und bin oft auch früh dabei, vielleicht nicht gleich in der ersten Generation aber wenn ich finde dass es weit genug ist.

Doch hier in diesem Thema...da sehe ich einfach mehr Gefahren die es mit sich bringt als tatsächliche Vorteile die wir dadurch haben. Es kann einfach zu viel Unsinn damit getrieben werden, und um das zu verhindern ist es zu schlecht reguliert und ich sehe auch nur wenig Möglichkeiten das zu tun und einen Missbrauch zu verhindern. Da liegt eben der Hauptunterschied gegenüber vielen anderen neuen Technologien die einfach deutlich harmloser sind. Und ja selbst Technologien wie das Internet oder Smartphones haben nicht nur gutes in die Welt gebracht, ganz und garnicht.

Daher ist Kritik durchaus angebracht. Nicht jeder Fortschritt muss positiv sein.

aid0nex schrieb:
Welchen normalen, nicht missbräuchlichem Zweck dient so etwas?
Einen Nutzen sehe ich vor allem in der Unterhaltungsindustrie, beispielsweise könnte man Filme, Serien, Videos synchronisieren und diese dann auch in der Fremdsprache in der eigenen Stimme ertönen lassen. Das gibt es ja schon, und gerade was die Übermittlung von Gefühlen angeht sind die KI-Systeme noch lange nicht so weit wie ausgebildete Synchronsprecher, aber das ist auch nur ne Frage der Zeit, als eben solcher würde ich mir langsam ein zweites Standbein aufbauen. Oder als Ersatz für bereits verstorbene Personen wie bereits genannt.

Das wäre tatsächlich etwas praktisches.
Ansonsten könnte man beispielsweise Sprachassistenten mit beliebigen Stimmen ausstatten lassen. Wenn du möchtest, dass deine Alexa jetzt klingt wie Scarlett Johansson oder Karl Lauterbach, dann wäre das damit durchaus möglich. Klar, das braucht niemand, aber witzig ist es zumindest schon und schaden tut es jetzt auch nicht (von der eventuellen Verletzung von Persönlichkeitsrechten mal abgesehen).

Also ja, es gäbe schon sinnvolle Anwendungszwecke und bestimmt noch viele mehr, aber rechtfertigen diese auch die Gefahren?
 
Marcel55 schrieb:
Einen Nutzen sehe ich vor allem in der Unterhaltungsindustrie, beispielsweise könnte man Filme, Serien, Videos synchronisieren und diese dann auch in der Fremdsprache in der eigenen Stimme ertönen lassen.

Also im Endeffekt auch hier wieder: Damit sich die großen Firmen Arbeitskräfte sparen können. 😏 In diesem Fall die Synchronsprecher. Wieder eine Berufsgrupe die ausstirbt.
Ergänzung ()

Marcel55 schrieb:
Ansonsten könnte man beispielsweise Sprachassistenten mit beliebigen Stimmen ausstatten lassen. Wenn du möchtest, dass deine Alexa jetzt klingt wie Scarlett Johansson oder Karl Lauterbach, dann wäre das damit durchaus möglich. Klar, das braucht niemand, aber witzig ist es zumindest schon und schaden tut es jetzt auch nicht (von der eventuellen Verletzung von Persönlichkeitsrechten mal abgesehen).

Lustig ja, aber kein enormer Vorteil der ein Gamechanger ist, gleichzeitig aber viel Gefahrenpotential. Daher eine ablehnende Haltung von mir.
 
Zurück
Oben