Zwei Dataframes Spalten vergleichen pro Zeile (Pandas/Python)?
Hallo,
Ich habe zwei Dataframes, zum einen eine "Allgemeine Übersicht" (Tel.Nummer + Kostenstelle) zum anderen eine monatliche Rechnung (Tel.Nummer + Eurobetrag)
Kurzgesagt möchte ich kontrollieren ob eine Tel.Nummer welche in der Rechnung auftaucht, in der "Allgemeinen Übersicht" vorhanden ist und sollte dies der Fall sein, dass die jeweilige Kostenstelle im DF der Rechnung ergänzt wird.
Ich habe leider keine Ahnung wie ich das umsetzen kann, daher auch noch keinen Code.
Als Hilfestellung habe ich mein Problem vereinfach in Excel visualisiert.
1 Antwort
Vorab, ich kenne Pandas nicht, insbesondere auch nicht die dort gebotenen Funktionalitäten.
Hier ist, wie man so etwas generisch löst:
Du hashst die Telefonnummern in der Übsericht und hinterlegst die gewünschten Daten - für Python:
Ein Dictionary, die Telefonnummern sind Schlüssel, Die Kostenstelle etc. die Daten.
Danach iterierst Du über die Rechnungen und machst für jede Telefonnumemr ein Lookup im hash, Python:
if phoneno in dctionary:
#do whatever is required
Je nachdem wie die Daten in Panadas vorliegen und welche Funktionalitäten Pandas bietet, kann man das vielleicht auf eine einfache Comprehension o.ä. reduzieren.