Guten Morgen,
ich möchte mir mit R eine Visualisierung von 100.000 Datensätzen erstellen lassen, aber leider ist der Plot, den R erzeugt, falsch. Er kann so nicht aussehen. Der Code:
termData <- read.csv("terms2-64-to100k.csv", sep=",")
plot(termData$n, termData$term, type="l", xlab="n", ylab="Z(n)")
Hier der Plot, den R mir liefert:
Bis zum 10.000. Datensatz bin ich mit Excel ganz gut hingekommen und es ist auch ganz gut erkennbar, wohin der Graph strebt:
Aber R macht ziemlichen Kokolores. Die Datensätze steigen recht monoton - zwar immer wieder mit kleinen Ausreißern, aber im Großen und ganzen wird Z(n) größer, je größer n wird. Das sieht man im Excel-Diagramm auch ganz gut, aber mit 100.000 Datensätzen kommt Excel leider auch an seine Grenzen.
Dass R mir allerdings für die 100.000 Datensätze ein komplett anderes Diagramm liefert, ist seltsam. Importiere ich nur 10.000 Datensätze, sind die Diagramme gleich, nur ab 100.000 gibt R mir nicht mehr das richtige Diagramm aus. Woran kann das liegen? Gibt es eine bessere Funktion zum Plotten größerer Datensätze?
LG
PS: Falls der Datensatz von Interesse ist: http://daten-transport.de/?id=JdqdfELXtfxm