Hallo zusammen,

aktuell schreibe ich eine Seminararbeit zum Thema Generierung von synthetischer Daten mit Hinblick auf medizinische Anwendungen, in der ich unter anderem die wichtigsten und meistgenutzten Techniken erklären soll, mit denen die Generierung synthetischer Daten möglich ist. Nach meiner Recherche habe ich bereits einige Identifizieren können, unter anderem VAE, GANs, SMOTE, Gaussian Mixture Model oder Bayesian Networks. Allerdings sind das nur diejenigen, die ich durch Recherche immer wieder finden konnte, es ist aber kein "wissenschaftlicher Beleg", dass diese tatsächlich die wichtigsten sind. Nach langem Suchen habe ich aber leider keine Statistik oder Erhebung gefunden, die sich darum kümmern wie häufig welche Techniken benutzt werden, damit ich auf Basis dieser meine Arbeit aufbauen kann.

Kennt jemand von euch derartige Statistiken oder Erhebungen?

Ich bedanke mich schonmal für eure Antworten!