Che cos'è la statistica?

Introduzione alle statistiche in R

Che cos'è la statistica?

  • Il campo della statistica: la pratica e lo studio della raccolta e dell'analisi dei dati.

  • Una statistica riassuntiva: un dato o un riassunto di alcuni dati.

Introduzione alle statistiche in R

Che cos'è la statistica?

  • Il campo della statistica: la pratica e lo studio della raccolta e dell'analisi dei dati.

  • Una statistica riassuntiva: un dato o un riassunto di alcuni dati.

Cosa possono fare le statistiche?

  • Quanto è probabile che qualcuno acquisti un prodotto? Le persone sono più propense ad acquistarlo se possono utilizzare un altro sistema di pagamento?
  • Quanti occupanti avrà il tuo hotel? Come puoi ottimizzare l'occupazione?
  • Quante taglie di jeans devono essere prodotte per adattarsi al 95% della popolazione? Dovrebbe essere prodotto lo stesso numero di taglie?
  • Test A/B: Quale annuncio è più efficace per convincere le persone ad acquistare un prodotto?
Introduzione alle statistiche in R

Cosa non possono fare le statistiche?

  • Perché Game of Thrones è così popolare?

Invece...

  • Le serie con scene più violente sono viste da più persone?

Ma...

  • Tuttavia, questo non può dirci se un maggior numero di scene violente porti ad un maggior numero di visualizzazioni.
Introduzione alle statistiche in R

Tipi di statistiche

Statistiche descrittive

  • Descrivere e riassumere i dati

2 auto, 1 autobus, 1 bicicletta

  • Il 50% degli amici va al lavoro in auto
  • Il 25% prende l'autobus
  • 25% di biciclette

Statistiche inferenziali

  • Usa un campione di dati per fare inferenze su una popolazione più ampia.

2 auto, 1 autobus, 1 bicicletta circondati da altre auto, autobus e biciclette

Quale percentuale di persone si reca al lavoro in auto?

Introduzione alle statistiche in R

Tipi di dati

Numerico (Quantitativo)

  • Continuo (misurato)
    • Velocità dell'aereo
    • Tempo trascorso in coda
  • Discreto (contato)
    • Numero di animali domestici
    • Numero di pacchi spediti

Categorico (qualitativo)

  • Nominale (non ordinato)
    • Sposato/non sposato
    • Paese di residenza
  • Ordinale (ordinato)

fortemente in disaccordo/quasi in disaccordo/né in accordo né in disaccordo/quasi in accordo/fortemente in accordo

Introduzione alle statistiche in R

I dati categorici possono essere rappresentati come numeri

Nominale (non ordinato)

  • Sposato/non sposato (1/0)
  • Paese di residenza (1, 2, ...)

Ordinale (ordinato)

  • Fortemente in disaccordo (1)
  • In qualche modo in disaccordo (2)
  • Né d'accordo né in disaccordo (3)
  • Un po' d'accordo (4)
  • Fortemente d'accordo (5)
Introduzione alle statistiche in R

Perché il tipo di dati è importante?

Statistiche di sintesi
car_speeds %>% 
  summarize(avg_speed = mean(speed_mph))
  avg_speed
1  40.09062
Trame

grafico di dispersione della velocità dell'auto rispetto al peso dell'auto

Introduzione alle statistiche in R

Perché il tipo di dati è importante?

Statistiche di sintesi
demographics %>% 
  count(marriage_status)
  marriage_status     n
1          single   188
2         married   143
3        divorced   124
Trame

grafico a barre del conteggio dello stato di matrimonio

Introduzione alle statistiche in R

Esercitiamoci!

Introduzione alle statistiche in R

Preparing Video For Download...