Übereinstimmungen in einer Liste feststellen / Python?

Mein Problem: Ich möchte aus einer Liste zum Teil gleiche Items erkennen. Etwas schwierig zu verstehen. Hier ein Beispiel:

[test.txt, test_np.txt, main.txt, main_np.txt]

In test.txt und test_np.txt steckt ja beides mal dieses test drin. Bei main das genau gleiche. Und das _np bleibt natürlich bei egal welchem Anfang

Ist es also irgendwie möglich zu erkennen das in zwei Strings in einer liste eine gleiche Buchstabenfolge oder Wort drinsteckt(und die dann einander zuzuordnen)?

Falls was unklar ist gerne melden!

Dankeschön schon mal im Vorraus.

3 Antworten

Vom Beitragsersteller als hilfreich ausgezeichnet

ralphdieter

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Programmiersprache, Python

11.03.2023, 14:41

zum Teil gleiche Items erkennen

Das ist weniger ein Programmierproblem als eine Frage der präzisen Spezifikation:

Bei "test_np.txt" und "main_np.txt" hast Du 7 gleiche Buchstaben, und alle Namen enden mit ".txt". Das ist aber vermutlich nicht, was Du als Treffer sehen willst. Beschreibe also zuerst ganz genau, was als Treffer gelten soll, bevor Du auch nur eine Zeile Code schreibst.

Ich könnte mir vorstellen, dass du die Strings als <Name><Variante>.<Endung> siehst und verschiedene Varianten zusammenfassen willst. Dann hilft es, alle Strings erst in diese Komponenten zu zerlegen und dann alle nach (Name, Endung) zu gruppieren. Mit einem regulären Ausdruck geht das recht komfortabel. So ungefähr könnte der Code dann aussehen:

from collections import defaultdict
import re

items = ["test.txt", "test_np.txt", "main.txt", "main_np.txt"]
groups = defaultdict(set)
pattern = re.compile("([a-zA-Z0-9]+)([^.]*)(.*)?")

for item in items:
    parts = pattern.match(item).groups()
    groups[ parts[0::2] ].add( item )

for key in groups:
    print(key, ":", groups[key])

Diese Zeilen sind in 5 Minuten geschrieben, aber den richtigen regulären Ausdruck darin zu finden kann Stunden oder sogar Tage dauern. Je genauer Du weißt, was er tun soll, desto schneller bist Du fertig.

Berny96

10.03.2023, 16:07

Eine Möglichkeit wäre, die Strings in der Liste paarweise zu vergleichen und nach gemeinsamen Substrings zu suchen.

Beispielcode:

def find_common_substrings(lst):
    result = []
    for i in range(len(lst)):
        for j in range(i+1, len(lst)):
            # Suche nach gemeinsamen Substrings zwischen lst[i] und lst[j]
            common_substrings = set()
            for k in range(len(lst[i])):
                for l in range(k+1, len(lst[i])+1):
                    if lst[i][k:l] in lst[j]:
                        common_substrings.add(lst[i][k:l])
            # Wenn gemeinsame Substrings gefunden wurden, füge sie zum Ergebnis hinzu
            if len(common_substrings) > 0:
                result.append((lst[i], lst[j], common_substrings))
    return result

Dieser Code durchsucht die Liste lst nach gemeinsamen Substrings und gibt eine Liste von Tupeln zurück, die jeweils zwei Strings aus lst enthalten, die gemeinsame Substrings haben, sowie eine Menge von Substrings, die sie gemeinsam haben. Zum Beispiel könnte der Aufruf

find_common_substrings(['test.txt', 'test_np.txt', 'main.txt', 'main_np.txt'])

folgende Ausgabe liefern:

[('test.txt', 'test_np.txt', {'test'}), ('main.txt', 'main_np.txt', {'main'})]

Wie du also siehst, hat der Code erkannt dass "test" in test.txt und test_np.txt vorkam, diese gebündelt und einander zugeordnet. Dass gleiche dann mit main -> main_np.txt und main.txt.

Messi796

10.03.2023, 15:57

Hi, ich antworde dir gerne, leider ist mir noch unklar wie und wo du die Strings gespeichert hast. Ausserdem empfhele ich dir, solche Fragen auf "Stack Overflow" zu stellen, da du da sicher besser aufgehoben bist (Ist etwa wie gutefrage, nur für programierer und halt auf englisch)

Ähnliche Beiträge

Python datei exportieren?

Hallo, ich versuche eine datei (zum test eine einfache test.txt datei) datei zu exportieren. Damit meine ich: Ich habe ein python programm mit dieser datei in eine ausführbare EXE compiled und nun möchte ich wenn man diese exe ausführt dass dann die txt datei mit den daten in einem beliebigen verzeichnis mit den exakt gleichen daten gespeichert wird.

...zum Beitrag

Gibts in Python dafür n schöne Funktion?

wenn ich eine liste von strings habe und es dopplete oder dreifache einträge gibt, kann ich da irgendwie die elemente rauslöschen die doppelt sind sodass nur jeweils ein element übrig bleibt ohne eine extra funktion dafür zu schreiben?

...zum Beitrag

Objekterkennung in Python?

Hallo ich mag mit einer IP Cam einen Raum überwachen das Programm soll nur erkennen ob an einer immer gleichen Stelle ein Trackingpoint sichtbar ist wie der aussieht ist mir egal. Fakt ist es soll einen Kontrollpunkt geben welcher sagt okay ich hab was gefunden war erfolgreich findet er ihn nicht probiert er es nochmal. Nun bräuchte ich Möglichkeiten diese Punkte in Python zu finden.

...zum Beitrag

String zerlegen und in eine Liste packen?

Hallo ich möchte erfahren, wie ich in Python eine String Buchstabe für Buchstabe in eine Liste packen kann, also “hallo” wird zu[“h”, “a”, “l”, “l”, “o”]

in Python 🐍

info:

bitte keine zusätzlichen module

brauche es für hangman

...zum Beitrag

Wie kann man doppelte Werte in Python anzeigen lassen?

Hey! Ich würde gerne in Python folgendes machen:

Gegeben sind zwei Listen mit beliebiger Anzahl an Strings:

list_1 = ["Gute", "Frage", "Python"]
list_2 = ["Gute", "Antwort"]

Nun sollte das Programm herausfinden, welche dieser Werte in beiden Liste vorkommen und diese dann auf der Console anzeigen:

if list_1.__contains__("Gute") and list_2.__contains__("Gute"):
    print("Gute")

Das Problem: Aufgrund meiner noch geringen Kentnisse, weiss ich nicht, wie ich diesen Teil verallgemeinern kann. Ich kann zwar mit .contains herausfinden, ob sich spezifische Stings in den Listen befinden und kann dann somit eine Aktion ausführen, jedoch ist dies schwachsinnig, wenn ich mehrere if-Befehle machen müsste. Zudem wird der Befehl nur ein einziges Mal ausgeführt, wenn die Voraussetzungen wahr sind.

Wie kann ich den Code so umschreiben, dass es nach zwei deckungsgleichen Stings sucht und den Namen, der jeweils doppelten Strings auf der Console anzeigt, ohne dass ich irgendwelche Plug-ins importieren muss? Am besten wäre eine while Schleife geeignet, da if nur ein einziges Mal ausgeführt wird. Ich arbeite mit Replit & PyCharm.

...zum Beitrag

Python: Wieso sind die beiden Strings nicht gleich?

Ich habe einen Webserver mit Python und Flask erstellt.

Der Chat funktioniert super, aber wenn ich versuche zu schauen, ob ein bestimmter Nutzer eine bestimmte Nachricht geschrieben hat, geht das nicht.

Hier ein Screenshot:

Wie ihr hier sehen könnt, sind die beiden Strings identisch. Es wird jedoch gesagt, dass sie es nicht sind.

Kann mir jemand sagen, was falsch ist?

...zum Beitrag

"Mehrdimensionale Liste in Python nach String durchsuchen?

Hi,

ich fange gerade an, mit Python zu arbeiten. Derzeit bin ich dabei eine Datenbank zu schreiben. Entschuldigt bitte die Frage, aber wie nach langem Suchen bin ich immer noch nicht fündig geworden. Ich möchte eine mehrdimensionale Liste nach Strings, also nach Namen, durchsuchen. Irgendwie kriege ich es gerade nicht hin. Wie gesagt, ich bin Anfänger. Also bitte seht es mir nach, dass ich eine eventuell so banale Frage stelle.

Danke schon mal! :-)

...zum Beitrag

Mutable Python vs Immutable?

a = 1
b = 1

Referenzieren hier beide auf unterschiedliche Instanzen, weil int mutable ist?

Und ist es bei Listen auch so?

Z.B.

L1 = [ 1, 2, 3 ]
L2 = [ 1, 2, 3 ]

Also referenziert es bei mutable Typen nicht auf die gleiche Instanz, oder?

...zum Beitrag

Python, falsche Input Eingabe verhindern?



Liste = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
loop1 =True
while loop1:
    monat = int(input("Für wie viele Monate hast du den Vertrag? \n "))
    if monat not in Liste:
        print("Vertippt?")
    elif monat <= 1:
        print("Alles klar, dein Vertrag dauert " + str(monat) +" Monat ")
        break
    elif monat > 1:
        print("Alles klar, dein Vertrag dauert " + str(monat) +" Monate ")
        break

Sollte der User versehentlich anstatt einer Zahl im Input "Monat" einen String schreiben, crashed das Programm. Wie kann ich auch bei einer String eingabe den Loop weiterführen?

...zum Beitrag

Namensliste (Texte verketten) in Python?

Moin!

Ich muss in Python eine Namensliste verketten.

Vornamen + Nachnamen verketten schaff ich ja noch. Jedoch aus dem ganzen eine Liste machen... da bin ich planlos.

Hier mal die Angabe:

A2 Texte verketten

a) Schreibe eine Prozedur, die zwei String-Variablen übergeben bekommt und den Zusammenschluss der beiden Variablen zurückgibt.

b) (Bsp: aus „Herr“ und „Breuer“ wird „Herr Breuer“)

c) Erstelle eine Liste, in der die Vornamen von Personen geschrieben werden, und eine Liste mit den dazugehörigen Nachnamen.

d) Gib dann die Namen (Vorname Nachname) alle in der Liste eingetragenen Person aus.

Ich hoffe da kann mir jemand helfen! Danke :)

...zum Beitrag

Die Zeile einer Textdatei in der alle Elemente einer Liste vorhanden sind ausgeben lassen?

Guten Abend,

ich habe eine Porgramm welches ein Textdokument mit einem langen Text (als String) in eine Liste einliest.

In einer anderen Liste können nun bestimmte Wörter als einzelne Elemente enthalten sein.

Bsp.

liste_woerter = ["war","hier","haben"]

Nun würde ich gerne nur die Zeilen der Liste mit dem Textdokument ausgeben, in denen ALLE diese drei Wörter vorhanden sind.

Mit meinem jetztigen Programm, lässt sich immer nur ein Wort abfragen. Dieses sieht akutell in etwa so aus:

for zeile in datei:
   datei += [zeile.strip()] #hier wird die Liste des Textes der Datei (als String) erstellt
   if liste_woerter[0] in zeile: #hier wird überprüft, ob das erste Element in einer Zeile vorkommt
       print(zeile) #in dem Fall werden alle Zeilen in dem ein "war" vorkommt ausgegeben

Nun will ich -wie gesagt-, dass nicht alle Zeilen wo das "war" drinne steht ausgegeben werden, sonder NUR die Zeilen wo "war", "hier" UND "haben" (alle drei) drinne stehen.

Vielen Dank im Voraus!

...zum Beitrag

Python Schleife?

Hallo,

ich habe folgenden Code, der sich in einer for-Schleife befindet.

dskt=open(rf"{os.environ['USERPROFILE']}\test.txt", "r+")
a=dskt.read().split("\n").pop(0)
print(a)
output="\n".join(a)
print(output)
dskt.write(output)
dskt.close()

In der Datei test.txt stehen Dateipfade (einer pro Zeile). Das Programm soll bei jedem Schleifendurchlauf die erste Zeile der Datei entfernen und die veränderten Daten (also ohne die erste Zeile) danach wieder in die Datei zurückschreiben, was aber nicht funktioniert. Stattdessen ist die Datei direkt schon beim ersten Durchlauf komplett leer. Bei der ersten print-Anweisung wird mir keine Liste ausgegeben, sondern der Pfad als String. Bei der zweiten werden alle Buchstaben einzeln untereinander ausgegeben.

Ich habe die Vermutung, dass das Programm nicht nur nach Zeilenumbrüchen trennt, sondern auch, wenn ein Pfad in der Datei "\n" enthält (z.B. test\neuer_ordner).

Könnte mir jemand sagen, was ich falsch gemacht habe?

...zum Beitrag

Wie holt man die Zahlen und Zeichen aus einer Python Zeichenkette?

Hallo, ich programmiere ein Taschenrechnerprogramm in python. Nun möchte ich beim ist_gleich Button die Zahlen und die Zeichen aus einem String voneinander trennen.

Beispielcode:

string = "13/5*7"

Die Ausgabe soll eine Liste sein:

string[1] soll 13 sein,

string[2] soll / sein,

string[3] soll 5 sein,

string[4] soll * sein und

string[5] soll 7 sein.

Kann mir bitte jemand helfen? Währe sehr dankbar. Liebe Grüße Alex950

...zum Beitrag

Problem mit Slicing Index 0 in Python?

Hallo zusammen,

ich versuche aus einer gegebenen Liste mehrere Gruppen mit drei Werten auszulesen und dies mit einer schleife zu wiederholen, während der Slice um eine Position verschoben wird.

Zur Veranschaulichung, hier die Liste:

liste = [...., 10, 1, 4, 17, 9, 6, 15, 13, 20]

Ich möchte nun die letzten drei Gruppen mit je drei Werten auslesen.

hier das Ergebnis welches ich erwarte:

[9, 6, 15]

[6, 15, 13]

[15, 13, 20]

Aber mit meinem Code:

liste = [ 10, 1, 4, 17, 9, 6, 15, 13, 20]

# Schleife, um die letzten 3 Gruppen (Tripplet) mit je drei Werten auszugeben

for i in range(3):

Tripplet = liste[-5 + i:-2+i]

print(Tripplet)

erscheint nur diese Ausgabe:

[9, 6, 15]

[6, 15, 13]

[]

Wie ihr seht will ich mit negativen Indices arbeiten, da mir so die Länge der gegegenen Liste gleich ist. Das Problem ist nun, das der zweite Slicingindex in meiner Schleife im dritten Durchlauf NULL wird. Aber NULL ist anscheinend in Python als EndIndex nicht vorgesehen bzw. nicht als Negativer Index. So also nicht: [-3:0]

Ich müßte den Endindex weglassen um bis zum Ende der Liste zu slicen. also so: [-3:] Doch wie implementire ich das in einer Schleife?

Ich bin sehr gespannt auf eure Antworten.

Lg. Dennis

...zum Beitrag

Was möchtest Du wissen?

Deine Frage stellen