Cos'è la statistica?

Introduzione alla statistica in R

Maggie Matsui

Content Developer, DataCamp

Cos'è la statistica?

  • La statistica: pratica e studio di raccolta e analisi dei dati

  • Statistica riassuntiva: un fatto o riassunto su alcuni dati

Introduzione alla statistica in R

Cos'è la statistica?

  • La statistica: pratica e studio di raccolta e analisi dei dati

  • Statistica riassuntiva: un fatto o riassunto su alcuni dati

Cosa può fare la statistica?

  • Quanto è probabile che qualcuno acquisti un prodotto? La probabilità aumenta con un metodo di pagamento diverso?
  • Quanti ospiti avrà il tuo hotel? Come ottimizzare l'occupazione?
  • Quante taglie di jeans produrre per coprire il 95% della popolazione? Produrre la stessa quantità per ogni taglia?
  • Test A/B: quale annuncio porta più acquisti?
Introduzione alla statistica in R

Cosa non può fare la statistica?

  • Perché Game of Thrones è così popolare?

Invece...

  • Le serie con più scene violente hanno più spettatori?

Ma...

  • Anche così, non possiamo dire se più violenza causa più visualizzazioni
Introduzione alla statistica in R

Tipi di statistiche

Statistiche descrittive

  • Descrivono e riassumono i dati

2 auto, 1 bus, 1 bici

  • Il 50% degli amici va al lavoro in auto
  • Il 25% prende il bus
  • Il 25% va in bici

Statistiche inferenziali

  • Usano un campione per fare inferenze su una popolazione più ampia

2 auto, 1 bus, 1 bici circondati da più auto, bus e bici

Che percentuale di persone va al lavoro in auto?

Introduzione alla statistica in R

Tipi di dati

Numeriche (Quantitative)

  • Continue (misurate)
    • Velocità di un aereo
    • Tempo in coda
  • Discrete (contate)
    • Numero di animali domestici
    • Numero di pacchi spediti

Categoriali (Qualitative)

  • Nominali (non ordinate)
    • Sposato/non sposato
    • Paese di residenza
  • Ordinali (ordinate)

fortemente in disaccordo/abbastanza in disaccordo/né d'accordo né in disaccordo/abbastanza d'accordo/fortemente d'accordo

Introduzione alla statistica in R

I dati categoriali possono essere numerici

Nominali (non ordinate)

  • Sposato/non sposato (1/0)
  • Paese di residenza (1, 2, ...)

Ordinali (ordinate)

  • Fortemente in disaccordo (1)
  • Abbastanza in disaccordo (2)
  • Né d'accordo né in disaccordo (3)
  • Abbastanza d'accordo (4)
  • Fortemente d'accordo (5)
Introduzione alla statistica in R

Perché il tipo di dato conta?

Statistiche riassuntive
car_speeds %>% 
  summarize(avg_speed = mean(speed_mph))
  avg_speed
1  40.09062
Grafici

diagramma a dispersione velocità auto vs peso auto

Introduzione alla statistica in R

Perché il tipo di dato conta?

Statistiche riassuntive
demographics %>% 
  count(marriage_status)
  marriage_status     n
1          single   188
2         married   143
3        divorced   124
Grafici

grafico a barre del conteggio per stato civile

Introduzione alla statistica in R

Ayo berlatih!

Introduzione alla statistica in R

Preparing Video For Download...