Datenzusammenfassung

Explorative Datenanalyse in Python

Izzy Weber

Curriculum Manager, DataCamp

Untersuchen von Datengruppen

  • .groupby() gruppiert Daten nach Kategorien
  • Aggregatfunktion zeigt, wie man gruppierte Daten zusammenfasst

 

books[["genre", "rating", "year"]].groupby("genre").mean()
|       genre |   rating |        year |
|-------------|----------|-------------|
|   Childrens | 4.780000 | 2015.075000 |
|     Fiction | 4.570229 | 2013.022901 |
| Non Fiction | 4.598324 | 2013.513966 |
Explorative Datenanalyse in Python

Aggregatfunktionen

  • Summe: .sum()
  • Anzahl: .count()
  • Minimum: .min()
  • Maximum: .max()
  • Varianz: .var()
  • Standardabweichung: .std()
Explorative Datenanalyse in Python

Zusammenfassen nicht gruppierter Daten

  • .agg() wendet Aggregatfunktionen auf einen DataFrame an

 

books[["rating", "year"]].agg(["mean", "std"])
|      |   rating |        year |
|------|----------|-------------|
| mean | 4.608571 | 2013.508571 |
|  std | 0.226941 |     3.28471 |
Explorative Datenanalyse in Python

Aggregationen für Spalten festlegen

books.agg({"rating": ["mean", "std"], "year": ["median"]})
|        |   rating |   year |
|--------|----------|--------|
|   mean | 4.608571 |    NaN |
|    std | 0.226941 |    NaN |
| median |      NaN | 2013.0 |
Explorative Datenanalyse in Python

Namen für Zusammenfassungsspalten

books.groupby("genre").agg(
    mean_rating=("rating", "mean"),
    std_rating=("rating", "std"),
    median_year=("year", "median")
)
|  genre      | mean_rating | std_rating | median_year |
|-------------|-------------|------------|-------------|
|   Childrens |    4.780000 |   0.122370 |      2015.0 |
|     Fiction |    4.570229 |   0.281123 |      2013.0 |
| Non Fiction |    4.598324 |   0.179411 |      2013.0 |
Explorative Datenanalyse in Python

Visualisierung kategorialer Zusammenfassungen

sns.barplot(data=books, x="genre", y="rating")
plt.show()

Ein Balkendiagramm mit Buchgenres und ihren Durchschnittsbewertungen

Explorative Datenanalyse in Python

Lass uns üben!

Explorative Datenanalyse in Python

Preparing Video For Download...