Matplotlib-Histograme
Histograme in der Python-Bibliothek Matplotlib verstehen
In unserer Organisation verstehen wir die Bedeutung der Datenvisualisierung für eine effektive Dateninterpretation. In diesem Artikel werden wir uns mit Histogrammen befassen, einer Art der Datenvisualisierung, die sich hervorragend eignet, um die Verteilung eines Datensatzes darzustellen.
Was ist ein Histogramm?
Ein Histogramm ist eine Art Balkendiagramm, das die Verteilung einer kontinuierlichen numerischen Variable abbildet. Dabei werden die Daten in Bins (Intervalle) auf der x-Achse gruppiert. Die y-Achse zeigt die Häufigkeit oder Anzahl der Beobachtungen pro Bin. Ein Histogramm ermöglicht es uns, die Form der Datenverteilung – einschließlich Zentrum, Streuung und Schiefe – schnell zu erkennen.
Erstellen eines Histogramms in der Python-Bibliothek Matplotlib
Die Python-Bibliothek Matplotlib bietet eine benutzerfreundliche Schnittstelle zum Erstellen von Histogrammen. Wir können die Funktion hist() verwenden, um ein Histogramm zu plotten. Werfen wir einen Blick auf die Syntax der Funktion hist():
Histogramme in Matplotlib unter Python plotten
import matplotlib.pyplot as plt
import numpy as np
# Generate some data
data = np.random.randn(1000)
# Create a histogram
plt.hist(data, bins=30)
plt.show()In diesem Beispiel importieren wir zunächst das Modul matplotlib.pyplot sowie das Modul numpy. Anschließend generieren wir einige Zufallsdaten mit dem Modul numpy. Abschließend verwenden wir die Funktion hist(), um ein Histogramm mit 30 Bins zu erstellen.
Anpassen eines Histogramms
Wir können unser Histogramm auch anpassen, um es aussagekräftiger zu gestalten. Beispielsweise können wir die Farbe der Balken ändern, einen Titel und Achsenbeschriftungen hinzufügen sowie die Größe der Abbildung anpassen. Hier ist ein Beispiel für ein angepasstes Histogramm:
Histogramme in Matplotlib unter Python anpassen
import matplotlib.pyplot as plt
import numpy as np
# Generate some data
data = np.random.randn(1000)
# Create a histogram with customizations
fig, ax = plt.subplots(figsize=(10, 5))
ax.hist(data, bins=30, alpha=0.5, color='blue')
ax.set_title('Distribution of Random Data')
ax.set_xlabel('Value')
ax.set_ylabel('Frequency')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
plt.show()In diesem Beispiel erstellen wir eine größere Abbildung mit figsize und legen die Transparenz der Balken über alpha auf 0,5 fest. Zusätzlich fügen wir Titel und Achsenbeschriftungen mit set_title, set_xlabel und set_ylabel hinzu und entfernen die oberen und rechten Spines mit spines.
Fazit
Histogramme sind ein leistungsstarkes Werkzeug zur Visualisierung von Datenverteilungen. Dank der Python-Bibliothek Matplotlib ist das Erstellen und Anpassen von Histogrammen ein einfacher und unkomplizierter Vorgang. Wir hoffen, dass dieser Artikel Ihnen geholfen hat, Histogramme besser zu verstehen und sie erfolgreich in Ihren Datenvisualisierungsprojekten einzusetzen.