Erhalten Sie eine Liste aus einer Spalte oder Zeile eines Pandas-Dataframes
In Pandas ist ein DataFrame eine 2-dimensionale, beschriftete Datenstruktur mit Spalten, die von unterschiedlichen Typen sein können. Sie können auf eine Spalte eines DataFrames als Series-Objekt zugreifen, indem Sie den Namen der Spalte als Attribut verwenden. Beispiel:
import pandas as pd
# Erstellen Sie einen einfachen DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# Zugriff auf die Spalte 'A' als Series
spalte_a = df['A']
# Zugriff auf die Spalte 'A' als Liste
spalte_a_liste = df['A'].tolist()
Wenn Sie auf eine Zeile eines DataFrames als Series zugreifen möchten, können Sie den Zugriff loc
verwenden, um eine Zeile nach ihrem Label auszuwählen und eine Series zurückzugeben, oder den Zugriff iloc
, um eine Zeile nach ihrer ganzzahligen Position im DataFrame auszuwählen und eine Series zurückzugeben.
# Zugriff auf die erste Zeile als Series
erste_zeile = df.loc[0] # or df.iloc[0]
# Zugriff auf die erste Zeile als Liste
erste_zeile_liste = df.loc[0].tolist() # or df.iloc[0].tolist()
Beachten Sie, dass der Index in einem DataFrame auch eine Spalte ist. Wenn Sie also einen Index in Ihrem DataFrame haben, wie z.B. einen Zeitstempel, können Sie ihn auch verwenden, um Zeilen und Spalten auszuwählen.
# DataFrame mit Zeitstempel als Index
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]},index=pd.date_range('2022-01-01',periods=3))
df.loc['2022-01-01','A']
Sie können auch die Zeilen mit logischen Operationen filtern
df[df.A>1]
and dann auch bestimmte Spalten auswählen
df[df.A>1]['B']