Dati mancanti e valori anomali

Esercitarsi con le domande di statistica per i colloqui in Python

Conor Dewey

Data Scientist, Squarespace

Gestire i dati mancanti

  • Elimina l'intera riga
  • Imputa i valori mancanti
Esercitarsi con le domande di statistica per i colloqui in Python

Elimina l'intera riga

df.dropna(inplace=True)

 

Esercitarsi con le domande di statistica per i colloqui in Python

Imputa i valori mancanti

  • Valore costante
  • Record selezionato a caso
  • Media, mediana o moda
  • Valore stimato da un altro modello
Esercitarsi con le domande di statistica per i colloqui in Python

Funzioni utili

  • isnull()
  • dropna()
  • fillna()
Esercitarsi con le domande di statistica per i colloqui in Python

Gestire i valori anomali

  • Deviazioni standard
  • Intervallo interquartile (IQR)
Esercitarsi con le domande di statistica per i colloqui in Python

Deviazioni standard

 

Curva gaussiana

1 Wikimedia
Esercitarsi con le domande di statistica per i colloqui in Python

Intervallo interquartile (IQR)

  IQR visualizzato

1 Wikimedia
Esercitarsi con le domande di statistica per i colloqui in Python

Riepilogo

  • Elimina l'intera riga
  • Imputa i valori mancanti
  • Deviazioni standard
  • Intervallo interquartile
Esercitarsi con le domande di statistica per i colloqui in Python

Prepariamoci al colloquio!

Esercitarsi con le domande di statistica per i colloqui in Python

Preparing Video For Download...