Was sind die häufigsten Anfangsbuchstaben?

2 Antworten

Hier ist die Verteilung der häufigsten Anfangsbuchstaben in der deutschen Wikipedia:

'd': 2260568
's': 1268038
'a': 1169851
'e': 1159625
'i': 817659
'b': 784587
'w': 779179
'u': 647492
'v': 636705
'g': 601012
'm': 599957
'z': 496288
'f': 478716
'k': 439772
'n': 429592
'h': 402237
'l': 291121
'p': 270888
't': 269020
'r': 254169
'j': 230445
'o': 165401
'c': 108209
'ü': 85715
'ä': 18467
'ö': 18332
'q': 15767
'y': 7274
'x': 3300
'é': 465
'š': 396
'č': 298
'µ': 277
'à': 200
'á': 193
'ž': 176
'ç': 137
'ō': 113
'å': 110
'α': 110

Ich habe dafür den Korpus deu_wikipedia_2021_1M analysiert, der 1 Millionen Sätze von Wikipedia enthält:

https://wortschatz.uni-leipzig.de/de/download/German

Alle Anfangsbuchstaben wurden in Kleinbuchstaben umgewandelt, Satzzeichen (Kommas, Anführungszeichen, etc.) wurden ignoriert.

P.S. Hier ist noch die Verteilung bei einem anderen Korpus, "Mixed typical", von 2011:

'd': 1083132
's': 588219
'e': 565650
'a': 475631
'w': 400148
'i': 352902
'b': 321794
'g': 308701
'm': 261856
'v': 239681
'f': 220259
'k': 218819
'h': 203064
'n': 193441
'u': 178609
'z': 164366
'p': 140829
'l': 120878
't': 110771
'r': 108817
'j': 74111
'o': 47587
'ü': 41488
'c': 27214
'ä': 7992
'ö': 6847
'q': 6460
'y': 5023
'x': 826

Ich denke, das lässt sich so generell gar nicht beantworten. Das hängt vor allem von der Sprache ab, auf die Du dich beziehst. Im Deutschen könnte ich mir vorstellen, dass das "D" (schon durch die bestimmten Artikel) gute Chancen hat, dem S Konkurrenz zu machen; ebenso wie die Vokale A E I O U.


Wasser262 
Beitragsersteller
 30.06.2024, 17:18

Also D und S

0