News Microsoft: VASA-1 erzeugt lebensechte Videos aus einem Bild plus Ton

Crazy Zeug. Wäre allerdings schöner, wenn die KI Power genutzt werden würde, um echte Probleme zu lösen. In der Medizin z.B.
 
  • Gefällt mir
Reaktionen: chillipepper
d3nso schrieb:
Die Deepfake Fetisischten werden das feiern, endlich P0rn von und für jeden :volllol:

Von den Leuten für die Leute! :D

Spaß bei Seite, wer hätte gedacht das so etwas nicht kommt? Man muss immer bedenken, dass die KI von heute die schlechteste ist die wir jemals haben werden. Ich freue mich auf KI und man neue Technologien einfach annehmen. Tut man das nicht, lebt man in der Vergangenheit und wird früher oder später überholt werden.

Das ist genau die gleiche Diskussion die wir vor ~250 Jahren mit der Dampfmaschine hatten und vor ~50 Jahren mit (Schweiß) Robotern. Es ist einfach die natürliche Weiterentwicklung.
 
  • Gefällt mir
Reaktionen: Strahltriebwerk, lordZ, FeelsGoodManJPG und 2 andere
Definitiv sehr beeindruckend 👌 ✌️

wenn man nicht weiß, dass es ein KI-erzeugtes Video ist, denke ich, dass es viele als echt wahrnehmen.

Da wird in Zukunft viel Fake und Blödsinn rauskommen. Mit Sicherheit werden allen möglichen Personen Worte in den Mund gelegt, die sie real nie gesagt haben...
 
karamba schrieb:
Wäre allerdings schöner, wenn die KI Power genutzt werden würde, um echte Probleme zu lösen. In der Medizin z.B.

Das passiert doch, nur bekommt man davon nichts mit.

engineer123 schrieb:
Mit Sicherheit werden allen möglichen Personen Worte in den Mund gelegt, die sie real nie gesagt haben...

Politiker lieben diesen Trick :D
 
  • Gefällt mir
Reaktionen: floTTes, Zockmock, nyster und eine weitere Person
@Cool Master

die Fragestellung wird vermutlich irgendwann so verlaufen:
KI-Statements können irgendwann auch von Experten kaum noch "erkannt" werden...
Hat die Person das vielleicht wirklich gesagt...

Am Ende steht sowas wie Rufmord oder Zerstörung von allen möglichen öffentlichen oder YT Persönlichkeiten,
weil der Zweifel bleibt, ob das Video nicht doch echt ist.

Edit:
Die zwei Bespiele in der news sagen ja unproblematische Dinge,
genauso gut kann man ihnen aber positive und begeisterte Statements zu Themen wie
Drogen
Waffen
Kriminalität
Extremismus
(insert illegal speech here)

in den Mund legen.
 
  • Gefällt mir
Reaktionen: Spike S., Zockmock, Cool Master und eine weitere Person
Kein Wunder.
Hat Microsoft doch Zugriff auf sämtliche Teams Video Calls um ihre KI zu trainieren was Gesichtsmimik und Lippen synchronität angeht.

habla2k schrieb:
wenn man das nicht will, warum dann so einen Real-Life Avatar?
Für Teams Call von HomeOffice Mitarbeiter. Die seit 3 Monaten nicht mehr beim Coiffeur waren und 15kg zugenommen haben?
Für Frauen die sich nicht täglich 2h Schminken wollen sondern ein Photoshopptes Bild verwenden?

Mimir schrieb:
z.B. extrem effiziente Datenübertragung.
Und dabei ganz nebenbei die kompletten persönlichen Quirks die jeder Mensch so hat aus seiner Mimik Raus schneiden und durch generische ersetzten.
Joa seeehr gute Idee.
Das macht Gespräche bestimmt viel Persönlicher.
 
  • Gefällt mir
Reaktionen: Nefcairon und guzzisti
Und auf Wiedersehen ihr Nachrichtensprecher. Euer Job wurde von der KI übernommen.
 
  • Gefällt mir
Reaktionen: Zockmock, chillipepper, Big Bopper und 3 andere
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas?
Als Content-Creator kannst du schnell dein Gesicht in einem Video einbauen und Leuten etwas erklären ohne dich erst mal für die Kamera zu recht zu machen. Der Aufwand beim Dreh von guten Videos ist ziemlich hoch.
Das Spiel kannst du in diese Richtung auf alles mögliche ausweiten.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Nefcairon, floTTes, Cool Master und eine weitere Person
Zu viel Gesik/Emotion für mein Empfinden. Mal sehen ob es besser wird.
 
  • Gefällt mir
Reaktionen: nylez
Tolle Zukunftsaussichten:
Ein Modell nach individuellen Ansprüchen erschaffen lassen (3D aus allen Richtungen) und dann noch ein Video dazu berechnen lassen.
 
  • Gefällt mir
Reaktionen: nyster
Endlich beim Videocall auch oben ohne da sitzen ;)
 
  • Gefällt mir
Reaktionen: Nefcairon, floTTes, Zockmock und 2 andere
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter. Außer eben Deepfakes zu erstellen.
Mal ein Beispiel, wo ich mir sowas sinnvoll vorstellen kann:
-> du sitzt in einem Online Meeting und sprichst mit Leuten aus aller Welt. Stand heute sprichst du sehr wahrscheinlich international in Englisch. Hin und wieder fällt es aber dennoch auch gut geübten Sprechern schwer, nicht nativ speaker zu verstehen.
Erfahrungsgemäß bspw. Leute aus dem chinesischen/indischem Raum, die englisch sprechen sind recht schwer zu verstehen.
Lange Rede, kurzer Sinn - es wäre mit sowas sehr einfach möglich, dass einfach alle Meeting Teilnehmer nativ ihre Muttersprache in das Mikro labern und eine KI dann A) die Übersetzung in Echtzeit vornimmt und B) eine andere KI eine Animation des eigenen Selbst passend zur getätigten Übersetzung anstatt einer Webcam Aufnahme vorzeigt. Lippensynchron und idealerweise mit Mimik. C) wäre dann das ganze noch mit eine per KI generierten Stimme der eigenen durchzuführen.

Wozu das ganze? Weil es solche Meetings schlicht einfacher macht...
Braucht man sowas? Nö, ganz klar nein.

Aber why not? Es gibt so vieles, was man nicht braucht auf der Welt, dennoch ist es gängige Praxis...
Solange man da 512x512@45 FPS mit nem 2000€ 4090 allein für das Bild raus bekommt, ist das aber noch weit weg von praxisrelevant. Aber das wird sich in Zukunft mit Sicherheit ändern.
 
  • Gefällt mir
Reaktionen: Strahltriebwerk, floTTes und CadillacFan77
Endlich xbeliebige, naturgetreue Deep-Fakes.
Man nehme ein Bild und fake es mit den Merkmalen einer prominenten Person.
Dann bastele man sich aus diversen Tonaufnahmen dieser prominenten Person einen neuen zusammengereimten Ton, der ganz anderer Inhalte als Aussage wiedergibt.
Und nun mixe man das alles mit diesem neuen Tool - fertig ist der Doppel-Deepfake-Supershit.
Endlich können Verschwörungstheoretiker, AfD'ler und andere radikale Gruppierungen ganze Regierungen und Staatsapparate nach gutdünken durch den Dreck ziehen und Behauptungen en Masse bei Youtube, Telegram udn Co. platzieren.
Hätte man den ganzen KI Kram bloß lieber gleich sofort straff kontrolliert oder verboten, es führt in falschen Händen zu nichts Gutem.
Wer da diverse alte Filme rauskramt, wird sich denken, dass das heutzutage doch nicht mehr so ein ausgedachter Blödsinn ist, wie wir früher immer lachend hingestellt haben mögen.
 
  • Gefällt mir
Reaktionen: Weyoun
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung?
Promis können so ihr Gesicht für Werbezwecke verkaufen ohne ihre Zeit zu investieren. Ist heute bei Fotos schon sehr verbreitet. Taylor Swift muss einen neuen Mixer oder Hautcreme nicht mehr selbst bewerben.

Claus Kleber muss die Nachrichten nicht mehr selbst vorlesen.
 
  • Gefällt mir
Reaktionen: Nefcairon
So faszinierend und beeindruckend ich das auch finde. Ich halte diese Technik für das mit gefährlichste, was es auf der Welt zur Zeit gibt. Diese Technik wird der Untergang der Menschheit werden, werden keine oder nur schlechte Sicherheitskriterien eingebaut. Mann stelle sich vor, was passiert, werden Menschen wie Trump, Putin und Co. Dinge in den Mund gelegt. Ich sehe schwarz. Wer und warum braucht so etwas`?
 
  • Gefällt mir
Reaktionen: SP-937-215, daVinci und Weyoun
Haldi schrieb:
Und dabei ganz nebenbei die kompletten persönlichen Quirks die jeder Mensch so hat aus seiner Mimik Raus schneiden und durch generische ersetzten.
Joa seeehr gute Idee.
Das macht Gespräche bestimmt viel Persönlicher.

Ich finds immer wieder amüsant, wenn leute sich experimentelle Demos als finale Anwendung vorstellen und keine Sekunde überlegen, was das hier überhaupt darstellt, wie groß die Fortschritte in den letzten Jahren waren und wo die Reise hingehen wird.

Immer wird exakt das genommen, was man hat, kritisiert dass dieses und jenes einem da nicht passt und dann sagt man, "joa ne, so wird das nix, weil dies und das nicht klappt".

Man kann das hier doch nicht so bewerten wie, keine Ahnung, ein Smartphone, das man morgen kaufen könnte. Das hier sind wissenschaftliche Paper die praktisch nur eine Technik erarbeiten und daraus die Machbarkeit demonstrieren.
Das ist ein Schritt von möglicherweise vielen hunderten oder tausenden Schritten hin zu einer finalen Anwendung... Sowas nennt sich nunmal Forschungsarbeit.

Ich bin ehrlich schockiert, dass viele Leute ein scheinbar sehr geringes Vorstellungsvermögen haben.

Wenn das jetzt zu scharf im Ton war, dann sorry. Ist wirklich nicht persönlich gemeint. Ich verstehs nur nicht...
 
  • Gefällt mir
Reaktionen: Strahltriebwerk, Nefcairon, Spike S. und 2 andere
Twin_Four schrieb:
Endlich beim Videocall auch oben ohne da sitzen ;)
Mit dem Skin von deinem Chef? ;-P

Man kann schon jetzt viel Mist anstellen, was man imemr wieder liest, es trifft ja schon prominente Personen und es werden schon politische Größen mit Fakes konfrontiert.
Und spätestens da ist die rote Linie mehr als nur leicht überschritten.
Irreführung von Regierungen und vielleicht dem Militär, das sind gesellschaftskritische Faktoren, die am Ende zu gefährlichen Aktionen führen können.
KI-generierte Inhalte sollten vor allem eine deutliche Kennzeichnungspflicht haben.
In Fotos, Texten und Videos solten daher Dinge wie Wasserzeichen oder Symbole fest verankert sein.
Und dann begintn das Spiel erneut, wo Hacker dann eben diese Sicherheitsfeatures raushacken wollen werden, um das in den Gruppierungen dann für sich nutzen zu können, vielleicht auch zur Erpressung und Terrorismus etc..
Vielleicht tauchen ja bald sogar Dinge wie die Sextapes von Sleepy Don auf?
Wären die Gerichtsverfahren ja schnell zu Ende. ^^ ;-P
 
  • Gefällt mir
Reaktionen: Firefly2023 und Weyoun
Zurück
Oben