Themenspecial 07. Juni 2024
Themenspecial: Künstliche Intelligenz (mit Michael Förtsch von 1E9) 👾
Alles zum Themenspecial

Wird es eine Meta-KI geben?

1 Antwort

Vom Beitragsersteller als hilfreich ausgezeichnet

Eine spannende Frage! Die Antwort lautet: wohl grundsätzlich ja. Start-ups, Tech-Giganten wie Microsoft, Meta, Google und KI-Forscher im Allgemeinen arbeiten bereits sehr aggressiv daran, Modelle multimodal zu machen. Das heißt, dass sie nicht nur Texte, sondern auch Bilder, Audio und Video analysieren und darauf reagieren können. Es ist auch möglich, ein multimodales Sprachmodell mit einem Roboter zu verknüpfen, was dessen Fähigkeit, mit der Welt zu interagieren, erhöht.

Hier mehr Infos: https://arxiv.org/html/2404.11027v1

Aber darüber hinaus „einfach mal zu machen“, das ist natürlich noch eine Herausforderung.

Dazu sind derzeit noch mehrere Modelle möglich, die zusammenarbeiten. Wenn z.B. in ChatGPT nach einem Bild gefragt wird, wird das von ChatGPTs GPT-4o an DALL-E 3 weitergegeben.

Aber: Die grundsätzliche Möglichkeit für eine KI, verschiedene, auch sehr unterschiedliche Aufgaben zu erfüllen, ist bereits gegeben. So hat Deepmind bereits 2022 mit Gato ein Transformer-Modell - ganz ähnlich GPT-3/4 oder Gemini - vorgestellt, das sowohl chatten, ein Videospiel spielen, einen Roboterarm steuern und einiges mehr kann. Deepmind bezeichnete das als „generalist agent“.

Hier gibt’s Infos dazu: https://1e9.community/t/ein-google-ki-forscher-sagt-menschengleiche-kuenstliche-intelligenz-ist-bald-machbar/17177

Und hier: https://en.wikipedia.org/wiki/Gato_(DeepMind)

Das Problem war, dass das Modell viele verschiedene Dinge konnte, aber nichts davon richtig gut. Soweit bekannt ist, arbeitet Deepmind weiter intensiv an diesem Prinzip, ... wohl auch, um es nach und nach in aktuelle Modelle zu überführen.


Suboptimierer 
Beitragsersteller
 10.06.2024, 12:24

Vielen Dank für die fachkundige Antwort.

0