Individuare schemi nei dati mancanti

Gestire i dati mancanti in Python

Suraj Donthi

Deep Learning & Computer Vision Consultant

Trovare correlazioni tra valori mancanti

  • Heatmap o mappa di correlazione dei valori mancanti
  • Dendrogramma dei valori mancanti
Gestire i dati mancanti in Python

Heatmap dei valori mancanti

  • Grafico della correlazione dei mancanti tra colonne
  • Spiega le dipendenze dei mancanti tra colonne

Heatmap dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python
import missingno as msno
diabetes = pd.read_csv('pima-indians-diabetes data.csv')

msno.heatmap(diabetes)

Heatmap dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Dendrogramma dei valori mancanti

  • Diagramma ad albero dei mancanti
  • Raggruppa le variabili per correlazione
msno.dendrogram(diabetes)

Dendrogramma dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Dendrogramma dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Dendrogramma dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Dendrogramma dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Dendrogramma dei valori mancanti per il dataset diabete

Gestire i dati mancanti in Python

Riepilogo

  • Analizza l’heatmap dei valori mancanti
      msno.heatmap(df)
    
  • Analizza il dendrogramma dei valori mancanti
      msno.dendrogram(df)
    
Gestire i dati mancanti in Python

Ayo berlatih!

Gestire i dati mancanti in Python

Preparing Video For Download...