Hey zusammen,
ich betreibe Clustering mit K-Means.
Nun weiß ich zuvor leider nicht wie viele Cluster vorhanden sind. Eine Lösung dafür ist die sogenannte Elbow Method. Leider basiert die Methode immer darauf einen Graphen zu Plotten und diesen wortwörtlich anzusehen.
Ich möchte den Elbow aber natürlich rechnerisch ermitteln. Jemand eine Idee?
Mein erster Versuch war die größte Differenz zwischen einen Punkt und dem nächsten zu berechnen, leider funktioniert das offenbar nicht so toll. Was ist also ein "Elbow" rechnerisch?
https://predictivehacks.com/k-means-elbow-method-code-for-python/
Hier so ein Elbow, bei dem würde die größte Differenz funktionieren. Der "Elbow" liegt bei 4:
Bei diesem Beispiel liegt der Elbow allerdings bei 4 und die größte Differenz funktioniert hier nicht:
Durch Hinsehen würde man aber schon sagen, dass 4 der "Elbow" ist. Ich nehme an, irgendwie kann man das auch berechnen, wenn man es "sehen" kann.
Wenn ich google Bemühe, dass werden zwar alle möglichen Implementierungen für die Methode vorgeschlagen. Aber alle arbeiten damit den Graphen zu plotten und anzusehen.
Gruß