Häufigsten japanischen Zeichen?

2 Antworten

Du könntest beispielsweise einfach mal im Internet nach „hiragana frequency“ suchen. Das liefert dann Seiten, wie diese...

https://gawron.sdsu.edu/crypto/lectures/hiragana.html

Da findet man dann relative Häufigkeiten von Hirgana. Hier die konkrete Häufigkeitstabelle:

https://gawron.sdsu.edu/crypto/japanese_models/hir_freq.html

Hiragana Frequency Table
う	u	0.074
ん	n'	0.069
い	i	0.066
し	shi	0.041
き	ki	0.031
に	ni	0.030
[...]

Grundlage für die Haufigkeitstabelle, waren wohl einige Nachrichten-Artikel. Wobei zu beachten ist, dass im Text vorkommende Wörter, die mit Kanji geschrieben wurden, für die Analyse auch in Hiragana umgewandelt wurden. Hier findet man ein Beispiel, welches für die Zählung der Hiragana verwendet wurde...

https://gawron.sdsu.edu/crypto/japanese_models/news_sample_hir.html

Ich kann mir durchaus vorstellen, dass die Häufigkeitsverteilung evtl. anders aussehen würde, wenn man Kanji extra betrachtet hätte. Das ist halt eines der Probleme bei solch einer Untersuchung: Es gibt mehrere Schriftsysteme (Kanji, Hiragana, Katakana), die im Japanischen gemischt verwendet werden. Je nach Kenntnisstand bzw. Präferenz von Autor und Zielgruppe, kann ein Wort mal in Kanji und mal in Hiragana geschrieben zu finden sein. Einmal trägt das Wort dann keine Hiragana bei und einmal eben doch. Was zählt man nun?


Physiokoala891 
Fragesteller
 12.02.2020, 12:19

ja das das japanische 3 schriftsxsteme hat ist mir klar. ich habe nur mal gehört das man rein mit Katakana und Hiragana vieles schrieben kann. Kanji werden oft in höheren bereichen genutzt. kann mich auch irren. also würde ich jetzt rein Hiragana und Katakana nehmen.

1
mihisu  12.02.2020, 12:58
@Physiokoala891
ich habe nur mal gehört das man rein mit Katakana und Hiragana vieles schrieben kann. Kanji werden oft in höheren bereichen genutzt.

Ja, man kann theoretisch alles mit Hirgana bzw. Katakana schreiben.

Und so hoch sind die „höheren Bereiche“, von denen du sprichst, nicht. Man wird nur relativ selten einen Text finden, der komplett mit Hiragana bzw. Katakana geschrieben wurde. Am ehesten noch in Kinderbüchern für Kinder, die noch keine oder nur wenige Kanji können.

In den meisten normalen Texten wird der größte Teil an Wörtern mit Kanji geschrieben. Hiragana erfüllen dann eher grammatikalische Funktionen. (Es gibt auch Wörter die man üblicherweise eher in Hiragana geschrieben findet, Wörter ausländischen Ursprungs werden häufig mit Katakana geschrieben, etc. Aber das alles ändert nichts daran, das Kanji nun einmal einen Großteil normaler japanischer Texte ausmachen.)

Die Frage ist nun: Möchte man zählen, wie häufig die einzelnen Hiragana in japanischen Texten vorkommen würden, wenn man alles mit Hiragana schreiben würde? Oder möchte man zählen, wie häufig die einzelnen Hiragana tatsächlich in japanischen Texten stehen, so wie die Texte nun einmal geschrieben sind?

============

Ich habe mal einfach ein paar News-Artikel von asahi.com hergenommen und da (ohne vorige Umwandlung in Hiragana) gezählt, wie oft welche Hiragana darin vorgekommen sind.

Hier kannst du den zusammengefügten Text finden, den ich als Grundlage für meine Zählung verwendet habe: https://pastebin.com/raw/e0q6cPkk

Der Text besteht aus 20317 Zeichen (Kanji, Hiragana, Katakana, lateinische Buchstaben, sonstige Zeichen). Darin befinden sich 2829 Hiragana. Die Verteilung der einzelnen Hiragana sieht da folgendermaßen aus:

の	8,70%
た	5,94%
と	5,37%
を	5,13%
い	5,05%
に	5,02%
し	4,70%
て	4,28%
は	4,24%
る	3,99%
が	3,96%
で	3,15%
な	2,65%
か	2,58%
っ	2,37%
す	1,98%
ら	1,98%
れ	1,70%
も	1,59%
り	1,52%
う	1,48%
ま	1,45%
ど	1,45%
さ	1,31%
き	1,20%
ん	1,20%
こ	1,17%
あ	1,03%
め	1,03%
だ	0,99%
よ	0,88%
く	0,81%
つ	0,78%
え	0,71%
け	0,67%
や	0,67%
わ	0,53%
そ	0,46%
ち	0,46%
お	0,42%
み	0,42%
ろ	0,39%
ば	0,39%
せ	0,35%
ほ	0,35%
べ	0,35%
ご	0,32%
げ	0,28%
じ	0,28%
む	0,25%
ず	0,21%
ね	0,18%
へ	0,18%
ひ	0,14%
ゆ	0,14%
づ	0,14%
ゃ	0,14%
ぐ	0,11%
ざ	0,11%
び	0,11%
ぶ	0,11%
ぼ	0,11%
ふ	0,07%
ぜ	0,07%
ゅ	0,07%
ぎ	0,04%
ぞ	0,04%
ぱ	0,04%
ょ	0,04%
ぬ	0,00%
ぢ	0,00%
ぴ	0,00%
ぷ	0,00%
ぺ	0,00%
ぽ	0,00%
0
Physiokoala891 
Fragesteller
 12.02.2020, 13:46
@mihisu

ich hab es eigentlich mir so gedacht das ich hiragana und katakana kombiniert nehme und dann die 30 häufigsten nehme und sie dem deutschen gleich setze. Ich versuche nämlich für eine geschichte eine eigene schrift zu entwickeln.

0