Seaborn und pandas

Einführung in die Datenvisualisierung mit Seaborn

Erin Case

Data Scientist

Was ist pandas?

  • Python-Bibliothek für die Datenanalyse
  • Einfaches Einlesen von Datensätzen aus CSV- und TXT-Dateien und weiteren Dateitypen
  • Datensätze liegen in Form von DataFrame-Objekten vor
Einführung in die Datenvisualisierung mit Seaborn

Arbeiten mit DataFrames

import pandas as pd

df = pd.read_csv("masculinity.csv")
df.head()
    participant_id        age    how_masculine    how_important
0                1    18 - 34         Somewhat         Somewhat
1                2    18 - 34         Somewhat         Somewhat
2                3    18 - 34             Very         Not very
3                4    18 - 34             Very         Not very
4                5    18 - 34             Very             Very
Einführung in die Datenvisualisierung mit Seaborn

Verwenden von DataFrames mit countplot()

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv("masculinity.csv")
sns.countplot(x="how_masculine", data=df)
plt.show()

Zähldiagramm für die Spalte „how_masculine“

Einführung in die Datenvisualisierung mit Seaborn

Die ersten 10 Zeilen des „Masculinity“- DataFrame

Einführung in die Datenvisualisierung mit Seaborn

Ein „unordentlicher“ DataFrame

Einführung in die Datenvisualisierung mit Seaborn

Lass uns üben!

Einführung in die Datenvisualisierung mit Seaborn

Preparing Video For Download...