How-to articles, tricks, and solutions about DATAFRAME
Sie können die Eigenschaft .iloc[] verwenden, um eine Zeile anhand ihres Integer-Index in einem pandas DataFrame oder Series auszuwählen.
Hier ist ein Beispielcode-Schnipsel, der das Problem demonstriert:
Der Wahrheitswert einer Serie in pandas kann ambivalent sein, da sie mehrere Werte enthalten kann.
Hinweis: Im obigen Beispiel wird zunächst ein leeres DataFrame erstellt und dann werden die Spalten nacheinander mithilfe des Zuweisungsoperators (=) hinzugefügt.
In Pandas ist ein DataFrame eine 2-dimensionale, beschriftete Datenstruktur mit Spalten, die von unterschiedlichen Typen sein können.
Hier ist ein Beispiel dafür, wie man einen Pandas DataFrame zeilenweise hinzufügt:
Hier ist ein Beispielcode-Schnipsel, der zeigt, wie man die Ausgabe einer Pandas GroupBy-Operation von einer Serie in einen DataFrame umwandelt:
Hier ist ein Beispiel dafür, wie man eine Liste von Wörterbüchern in einen pandas DataFrame konvertiert:
Sie können die Pandas-Bibliothek verwenden, um ein Python-Wörterbuch in einen Dataframe zu konvertieren.
Hier ist ein Beispielcode-Schnipsel, der zeigt, wie man die groupby()-Methode in pandas verwendet, um einen DataFrame nach zwei Spalten zu gruppieren und die Anzahl der Gruppen zu erhalten:
Hier ist ein Beispiel dafür, wie Sie ein pandas DataFrame nach Substring-Kriterien filtern können:
Du kannst die Methode .loc verwenden, um das DataFrame zu filtern und eine boolesche Maske zu erhalten, und dann die Eigenschaft .index verwenden, um den Index der Zeilen zu erhalten, die einen bestimmten Wert entsprechen.
Sie können die Eigenschaft DataFrame.columns verwenden, um auf die Spaltenbeschriftungen eines DataFrame als Index-Objekt zuzugreifen.
In dem obigen Code-Schnipsel wird die Methode to_csv verwendet, um einen DataFrame in eine CSV-Datei zu schreiben.
Sie können eine Pandas DataFrame mit den Methoden isin() und ~(not in) filtern.
Um den Index eines Pandas-DataFrame in eine Spalte umzuwandeln, können Sie die Funktion reset_index() verwenden und angeben, dass Sie den Index in eine neue Spalte verschieben möchten, indem Sie den Parameter inplace=True und name verwenden.
You can use the isna() method to check for NaN values in a Pandas DataFrame.
Um den Namen der Indexspalte in einem Pandas DataFrame festzulegen, können Sie die Methode .rename_axis() oder die Eigenschaft .index.name verwenden.
Sie können die Methode .head() verwenden, um die ersten Zeilen einer Pandas-Serie oder eines DataFrames in einem "hübschen" Format auszugeben.
Sie können die Eigenschaft .loc eines Pandas-Dataframes verwenden, um Zeilen aufgrund einer Liste von Werten auszuwählen.
In pandas kann man die Methode groupby() verwenden, um Daten nach einer oder mehreren Spalten zu gruppieren und dann die Methode agg() verwenden, um verschiedene Statistiken für jede Gruppe zu berechnen.
Sie können NaN-Werte in einer Spalte eines Pandas-Dataframe ersetzen, indem Sie die Methode fillna() verwenden und den Wert eingeben, mit dem Sie NaN ersetzen möchten.
Sie können eine neue Spalte zu einem vorhandenen pandas DataFrame hinzufügen, indem Sie die Methode assign() oder die Notation [] verwenden.
Sie können die Methoden .at oder .iat verwenden, um den Wert einer bestimmten Zelle in einem DataFrame abzurufen.
In pandas kann man die str.cat()-Funktion verwenden, um die Werte von zwei Spalten von Text in eine einzelne Spalte zusammenzufügen.