Was für ein Programm ist das?
2 Antworten
Zur Info !
Letzten Monat lud ein YouTube-Nutzer namens demonflyingfox ein Video mit dem Titel "Harry Potter von Balenciaga" hoch. Es zeigte Charaktere aus den Harry-Potter-Filmen – Hagrid, Ron, Hermine, Snape, McGonagall, Dobby – als hagere Models mit aggressiven Wangenknochen (leicht kläffend), gekleidet in Gothic-Umhänge und Lederjacken. Zu einem laufstegwürdigen Electronica-Beat blinzeln, nicken und sprechen die Schauspieler Zeilen aus den Büchern, die mit modischen Referenzen neu gemischt wurden. "Du bist Balenciaga, Harry", sagt Hagrid, anstatt die Nachricht zu überbringen, dass Harry ein Zauberer ist. Das Video ist seltsam und urkomisch unheimlich. Innerhalb von drei Wochen hat es fast fünf Millionen Aufrufe erhalten; Eine Fortsetzung, die vor weniger als einer Woche veröffentlicht wurde, hat mehr als eineinhalb Millionen eingespielt. Popkulturelle Mashups einer berühmten Sache mit einer anderen sind ein Archetyp der Internet-Meme-Bildung. Das Ungewöhnliche an "Harry Potter by Balenciaga" ist, dass es mit Werkzeugen der künstlichen Intelligenz erstellt wurde. Wie mir der Schöpfer des Videos, der in Berlin lebende Fotograf Alexander Niklass, der den Kanal demonflyingfox erstellt hat, sagte, demonstriert das Video die neu entdeckte Fähigkeit der KI, "filmähnliche Momente zu schaffen".
KI-Tools waren an jedem Schritt des Niklass-Prozesses und an jedem Element des Videos beteiligt. Er schuf die grundlegenden statischen Bilder mit Midjourney und erinnerte an die Harry-Potter-Schauspieler und -Outfits durch Textaufforderungen wie "männliches Model, Groteske, Balenciaga-Werbung". Dann nutzte er ElevenLabs – ein "Voice-Cloning"-Tool –, um Modelle der Stimmen der Schauspieler auf der Grundlage zuvor aufgenommener Audioaufnahmen zu erstellen. Schließlich speiste er die Bilder in einen Dienst namens D-ID ein, der für die Erstellung von "Avatar-Videos" verwendet wird – subtil animierte Porträts, die nicht so weit von denen entfernt sind, die in den Zeitungen der Potter-Welt erscheinen. D-ID fügte die charakteristischen Lippensynchronisationen und Kopfnicken hinzu, die laut Niklass eine Anspielung auf Models waren, die ihr Kinn für die Kameras neigten. Die Kombination aus kindgerechtem Film und Luxusmode für Erwachsene hatte weder eine besondere Symbolik noch drückte sie eine künstlerische Absicht aus. Es ist "Unterhaltung", sagte Niklass. Doch der überzeugendste Aspekt des Videos ist vielleicht seine Leere, eine bedeutungslose Kollision kultureller Symbole. Der Unsinn ist der Punkt.
K.I.-Tools waren vielleicht in der Lage, die Gesichter von Schauspielern zu replizieren und modische Outfits zu generieren, aber nur Niklass konnte sich das Konzept ausdenken, das eine scharfe Beobachtung sowohl der Haute Couture als auch der Zaubererwelt erforderte – und auch einen sehr spezifischen, extrem Online-Sinn für Humor. Mit Tools wie Midjourney, die für jeden online öffentlich zugänglich sind, "kann jetzt jeder etwas visuell Ansprechendes erstellen", sagte er. "Aber KI kann noch keinen Geschmack erzeugen", fuhr er fort. Mit "Geschmack" meinte er "ein gutes ästhetisches Urteilsvermögen" – Hintergrundwissen über das, was man erzeugt, und ein Gespür dafür, was gut aussieht, ohne zu sehr ins unheimliche Tal zu fallen. Anders ausgedrückt: Die Ausführung mag durch generative KI demokratisiert worden sein, Ideen jedoch nicht. Der Mensch ist immer noch der Urheber, Herausgeber und Kurator der Auswirkungen von KI. Ein Beweis für Niklasss Geschmack sind die vielen Nachahmer seiner Videos, die jetzt auf YouTube zu finden sind: Jeder kann auf die gleiche Technologie zugreifen und versuchen, eine Replik nach der von ihm festgelegten Formel zu erstellen. (Ein Video-Tutorial, das von einem KI-Bildungskanal namens PromptJungle erstellt wurde, zeigt den genauen Prozess.) Es gibt "Matrix by Gucci", "Star Wars by Balenciaga" und "The Office by Balenciaga"-Videos, aber keines davon ist so ansprechend seltsam wie das Original.
Midjourney. Für die Animation bspw. Pikalabs, Stable Video Diffusion oder Runway Gen 2. Das Lipsyncing ist nochmal was anderes, vielleicht First Order Motion Model oder etwas neueres
??? Junge was is los? XD Hast du deine Antwort mir KI zu nem Roman hochskalieren lassen oder was. Der typ wollte einfach grob wissen wie man das macht, und du beschreibst noch jede Person, jeden charakter, usw, wtf