Die künstliche Intelligenz kann ja Bilder generieren wie "Frau im roten Mantel, die im Regen steht, schwarzer Regenschirm, blaue Schuhe"
Aber was sie nicht wirklich kann ist eine Frau zu generieren die ihre blauen Schuhe am Kopf trägt. Weil sie offenbar den Schuh als keine eigene Einheit versteht und woanders hinsetzen kann.
Was muss sich ändern damit das eine KI kann? Müsste sie jedes einzelne Kleidungsstück und jede Einzelheit der Anatomie am Menschen mit Millionen Bildern erlernen und verstehen? Könnte sie dann solche Bilder erzeugen? Warum hat das noch keiner gemacht/probiert?
Ich bin darauf gekommen, weil ich eingetippt hab, dass ich will, dass ein Mensch auf seine Hand beißt und nur Bilder kamen, wo sich ein Mensch in Portrait Pose seine Finger an den Mund hält.