Tool zur Analyse von Text: Worthäufigkeit?
Hallo zusammen,
ich suche ein Tool, dem ich einen Text geben kann und das mir daraufhin analysiert, welche Wörter wie häufig darin vorkommen.
Ich bin auch interessiert an weiteren (kostenfreien)Tools (oder Programmcodes in php, c#), die Texte prinzipiell analysieren können.
3 Antworten
Du kannst die Worthäufigkeit eines Textes mit folgenden Pythonskript analysieren:
word_list = ['Emma','Woodhouse','father','Taylor','Miss','been','she','her']
#i'm using this example text in place of the file you are using
text = 'This is an example text. It will contain words you are looking for, like Emma, Emma, Emma, Woodhouse, Woodhouse, Father, Father, Taylor,Miss,been,she,her,her,her. I made them repeat to show that the code works.'
text = text.replace(',',' ') #these statements remove irrelevant punctuation
text = text.replace('.','')
text = text.lower() #this makes all the words lowercase, so that capitalization wont affect the frequency measurement
for repeatedword in word_list:
counter = 0 #counter starts at 0
for word in text.split():
if repeatedword.lower() == word:
counter = counter + 1 #add 1 every time there is a match in the list
print(repeatedword,':', counter) #prints the word from 'word_list' and its frequency
Der Output sieht bei diesem Beispiel folgendermaßen aus:
Emma : 3
Woodhouse : 2
father : 2
Taylor : 1
Miss : 1
been : 1
she : 1
her : 3
Selbstverständlich musst du die word_list und den text anpassen.
Quelle: http://stackoverflow.com/questions/33990697/python-word-count-of-text-file
Ich kann dir nur empfehlen Python zu lernen. Zudem ist es genau so leicht wie PHP zu lernen :-)
ich habe schon geahnt, dass ich mich früher oder später mit Phyton befassen muss ... :-)
Also ich hab zwar Mac aber ich weiß dass das bei Windows definitiv auch geht. Da gehst du in Pages/Word und dann gehst du auf Wortsuche und dann gibst du einfach das Wort ein und dann zeigt er dir an wie oft das vorkommt und du kannst durchskippen zu den Stellen wo das jeweils ist
Meinst du z.B. sowas?
https://www.online-utility.org/text/analyzer.jsp
Da kannst du einen Text reinkopieren und dann wird dir angezeigt welche Worte wie oft darin vorkommen (und wie viel % des Gesamttextes sie ausmachen).
Alternativ: http://textalyser.net/
genau, aber mit deutscher Stoppwortliste und ggfs. offline für sehr lange Texte ...
Was fertiges kenne ich so spezialisiert jetzt auch nicht, aber eine deutsche Stoppwortliste findest du z.B. auf https://goo.gl/mUHUKq und den Rest sollte man eigtl relativ einfach selbst basteln können, im Grunde müsste man ja nur Satzzeichen aus dem Text entfernen, ihn dann nach Leerzeichen aufsplitten und zählen was wie oft vorkommt und nicht in dieser Stoppwortliste enthalten ist.
danke für den Tipp, ich suche es allerdings etwas komfortabler. :-)
Ein Tool, bei dem ich nicht jedes Wort einzeln eingeben muss, sondern eben angezeigt wird welche Wörter die Häufigsten sind.