Wie kombiniert man zwei Spalten von Text in einem pandas Dataframe?
In pandas kann man die str.cat()
-Funktion verwenden, um die Werte von zwei Spalten von Text in eine einzelne Spalte zusammenzufügen. Sie können die zu kombinierenden Spalten und das zwischen ihnen zu verwendende Trennzeichen angeben. Hier ist ein Beispiel dafür, wie man die Werte der zwei Spalten "Spalte1" und "Spalte2" in eine neue Spalte "neue_Spalte" mit einem Trennzeichen von "-" in einem Dataframe "df" kombiniert:
df['neue_Spalte'] = df['Spalte1'].str.cat(df['Spalte2'], sep='-')
Dies erstellt eine neue Spalte mit dem Namen neue_Spalte
im Dataframe, die den kombinierten Wert von Spalte1 und Spalte2 mit "-" als Trennzeichen enthält.
Man kann auch die .apply()
-Funktion und eine Lambda-Funktion verwenden, um dasselbe zu erreichen:
df["neue_Spalte"] = df.apply(lambda x : x["Spalte1"] + '-' + x["Spalte2"], axis = 1)
Alternativ kann man auch die .join()
-Methode der Zeichenkette des Dataframes verwenden, diese Methode ermöglicht es, zwei Spalten mit einem angegebenen Trennzeichen zu einer einzigen Spalte zusammenzufügen, das folgende Beispiel zeigt, wie man die zwei Spalten "Spalte1" und "Spalte2" mit "-" als Trennzeichen zusammenfügt:
df["neue_Spalte"] = df["Spalte1"] + "-" + df["Spalte2"]
Wähle die Methode, die am besten zu deinem Anwendungsfall und deinen Daten passt.