Tool zur Analyse von Text: Worthäufigkeit?

3 Antworten

Du kannst die Worthäufigkeit eines Textes mit folgenden Pythonskript analysieren:

word_list = ['Emma','Woodhouse','father','Taylor','Miss','been','she','her']
#i'm using this example text in place of the file you are using
text = 'This is an example text. It will contain words you are looking for, like Emma, Emma, Emma, Woodhouse, Woodhouse, Father, Father, Taylor,Miss,been,she,her,her,her. I made them repeat to show that the code works.'
text = text.replace(',',' ') #these statements remove irrelevant punctuation
text = text.replace('.','')
text = text.lower() #this makes all the words lowercase, so that capitalization wont affect the frequency measurement

for repeatedword in word_list:
counter = 0 #counter starts at 0
for word in text.split():
if repeatedword.lower() == word:
counter = counter + 1 #add 1 every time there is a match in the list
print(repeatedword,':', counter) #prints the word from 'word_list' and its frequency

Der Output sieht bei diesem Beispiel folgendermaßen aus:

 Emma : 3
Woodhouse : 2
father : 2
Taylor : 1
Miss : 1
been : 1
she : 1
her : 3

Selbstverständlich musst du die word_list und den text anpassen.

Quelle: http://stackoverflow.com/questions/33990697/python-word-count-of-text-file


deKlaus 
Fragesteller
 26.04.2017, 21:11

ich habe schon geahnt, dass ich mich früher oder später mit Phyton befassen muss ... :-)

0
Prolativ  26.04.2017, 21:45

Ich kann dir nur empfehlen Python zu lernen. Zudem ist es genau so leicht wie PHP zu lernen :-)

0

Also ich hab zwar Mac aber ich weiß dass das bei Windows definitiv auch geht. Da gehst du in Pages/Word und dann gehst du auf Wortsuche und dann gibst du einfach das Wort ein und dann zeigt er dir an wie oft das vorkommt und du kannst durchskippen zu den Stellen wo das jeweils ist 


deKlaus 
Fragesteller
 26.04.2017, 10:49

danke für den Tipp, ich suche es allerdings etwas komfortabler. :-)
Ein Tool, bei dem ich nicht jedes Wort einzeln eingeben muss, sondern eben angezeigt wird welche Wörter die Häufigsten sind.

0
L2345  26.04.2017, 10:51
@deKlaus

Ach so Entschuldigung, nein da weiß ich leider nix zu :-/

0

Meinst du z.B. sowas? 

https://www.online-utility.org/text/analyzer.jsp

Da kannst du einen Text reinkopieren und dann wird dir angezeigt welche Worte wie oft darin vorkommen (und wie viel % des Gesamttextes sie ausmachen).

Alternativ: http://textalyser.net/


deKlaus 
Fragesteller
 26.04.2017, 13:53

genau, aber mit deutscher Stoppwortliste und ggfs. offline für sehr lange Texte ...

0
mastema666  26.04.2017, 14:01
@deKlaus

Was fertiges kenne ich so spezialisiert jetzt auch nicht, aber eine deutsche Stoppwortliste findest du z.B. auf https://goo.gl/mUHUKq und den Rest sollte man eigtl relativ einfach selbst basteln können, im Grunde müsste man ja nur Satzzeichen aus dem Text entfernen, ihn dann nach Leerzeichen aufsplitten und zählen was wie oft vorkommt und nicht in dieser Stoppwortliste enthalten ist.

0