Statistiche descrittive nell’analisi dei sondaggi

Analisi dei dati da sondaggio in Python

EbunOluwa Andrew

Data Scientist

Cosa sono le statistiche descrittive nei sondaggi?

  • Misure base per descrivere i dati di un sondaggio.
  • Descrivono singole variabili e il campione del sondaggio.

lente d'ingrandimento e penna su un grafico

Analisi dei dati da sondaggio in Python

Perché usare le statistiche descrittive?

  • Riassumono i dati in modo chiaro
  • Forme
    • Tabelle
    • Visualizzazioni
  • Aiutano a trovare outlier

Grafici con lente d'ingrandimento

Analisi dei dati da sondaggio in Python

Frequenza e distribuzioni

  • Dati raggruppati per numero di occorrenze in ogni classe
  • Su dati qualitativi e quantitativi
  • Conteggio degli esiti in un dataset grezzo di sondaggio
  • Bar chart, istogrammi, torte, linee, ecc.

Osservazione di dati statistici, grafici e diagrammi

Analisi dei dati da sondaggio in Python

Tendenza centrale: media, mediana, moda

  • Valore unico che rappresenta il centro della distribuzione
  • Media = valore medio
  • Mediana = valore centrale in ordine crescente
  • Moda = valore più frequente
Analisi dei dati da sondaggio in Python

Misure di variabilità

  • Misurano quanto i dati si discostano dal centro
  • Range
    • Distanza tra valore massimo e minimo
  • Deviazione standard
    • Varianza media
    • Indica la distanza tra un valore e la media

Folla dall'alto che forma un grafico di crescita con linee che li collegano

Analisi dei dati da sondaggio in Python

Sondaggio: dietary_habits

dietary_habits.head()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             5 |              4 |
| 18-24 | Male   |             4 |              1 |
| 45-54 | Male   |             3 |              3 |
| 18-24 | Male   |             2 |              1 |
| 18-24 | Female |             3 |              1 |
Analisi dei dati da sondaggio in Python

Distribuzione di frequenza: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number")
|        | Number |
|--------|--------|
| Male   | 40     |
| Female | 38     |

Indice: Gender

Analisi dei dati da sondaggio in Python

Distribuzione di frequenza: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number").plot(kind='bar')

grafico a barre della distribuzione di frequenza per genere

Analisi dei dati da sondaggio in Python

Misure di tendenza centrale: dietary_habits

  • .mean()
  • .median()
  • .mode()
Analisi dei dati da sondaggio in Python

Misure di tendenza centrale: dietary_habits

  • .mean()
dietary_habits.mean()
| meals_per_day  | 3.128205 |
| eat_out_per_wk | 1.897436 |
| dtype: float64 |          |
Analisi dei dati da sondaggio in Python

Misure di tendenza centrale: dietary_habits

  • .median()
dietary_habits.median()
| meals_per_day  | 3.0 |
| eat_out_per_wk | 1.5 |
| dtype: float64 |     |
Analisi dei dati da sondaggio in Python

Misure di tendenza centrale: dietary_habits

  • .mode()
dietary_habits.mode()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             3 |              1 |
Analisi dei dati da sondaggio in Python

Misure di variabilità: dietary_habits

print(dietary_habits.meals_per_day.max() - dietary_habits.meals_per_day.min())
3
print(dietary_habits.meals_per_day.std())
0.6518500018473766
Analisi dei dati da sondaggio in Python

Passiamo alla pratica !

Analisi dei dati da sondaggio in Python

Preparing Video For Download...