Eksik veriler ve atama

Power BI'de Python'a Giriş

Jacob H. Marquez

Data Scientist

Eksik veri nedir?

"Eksik" için yaygın değerler:

  • null
  • NA
  • 99
  • ""
Power BI'de Python'a Giriş

Eksik veri nedir?

"Eksik" için yaygın değerler:

  • null
  • NA
  • 99
  • ""
entity year fished
Australia 1988 153148
Australia 1989 null
Australia 1990 567895
Australia 1991 632987
Australia 1992 643578
Australia 1993 null
Power BI'de Python'a Giriş

Veri neden eksik olur?

  • Katılımcı ankette bir soruyu unuttu ya da yanıtlamayı reddetti
  • Katılımcı çalışmanın ikinci bölümünden ayrıldı
  • Ölçüm cihazında bir aksaklık oluştu
  • Gizlilik yasaları verinin kullanımını kısıtlıyor
Power BI'de Python'a Giriş

Rastgele mi eksik?

Rastgele eksik

Seattle, New York City ve Paris için inç cinsinden yağış tablosu.

Power BI'de Python'a Giriş

Rastgele mi eksik?

Rastgele olmayan eksik

Seattle, New York City ve Paris için inç cinsinden yağış tablosu. Seattle’dan bir satır eksik.

Power BI'de Python'a Giriş

Rastgele mi eksik?

Rastgele olmayan eksik

Seattle, New York City ve Paris için inç cinsinden yağış tablosu. Seattle’dan bir satır eksik.

  • Cihaz düşük değerleri algılayamıyor
  • Bazı gruplar bilgi vermeyi tercih etmiyor
Power BI'de Python'a Giriş

Eksik veriler nasıl ele alınır?

Rastgele olmayan eksik

  • Analizi durdurun
  • Eksikliğin nedenlerini anlayın
  • Daha fazla veri toplayın
  • Kısıtlar ve varsayımları açıkça belgeleyin

Rastgele eksik

  • Gözlemleri silin
  • Eksik için gösterge değişkeni ekleyin: eksikse 1, değilse 0
  • Atama
Power BI'de Python'a Giriş

Atama

Tanım: eksik bir değerin başka bir değerle değiştirilmesi.

Atama türleri:

  • Ortalama
  • Medyan
  • Mod
  • Önceki veya sonraki değerler

Sütunun %5’i ya da daha azı eksikse en uygunudur.

Değerleri sıralamayı unutmayın!

Power BI'de Python'a Giriş

Atama - Örnek

Rastgele eksik

Seattle, New York City ve Paris için inç cinsinden yağış tablosu — bazı gözlemler eksik.

Medyanla atama

Seattle, New York City ve Paris için inç cinsinden yağış tablosu. Eksikler şehir medyanıyla doldurulmuş.

Power BI'de Python'a Giriş

Veri kümesi

Fatura StockCode Açıklama Miktar FaturaTarihi Fiyat Müşteri ID
506303 PADS PADS TO MATCH ALL CUSHIONS 1 4/29/2010 10:43:00 AM 0.001 14249
496725 M Manual 1 2/3/2010 2:16:00 PM 1.5 13619
502660 M Manual 6 3/25/2010 5:18:00 PM 1.5 13187
509669 90214S LETTER "S" BLING KEY RING 10 12/13/2009 3:54:00 PM 1.25 16725
Power BI'de Python'a Giriş

Hadi pratik yapalım!

Power BI'de Python'a Giriş

Preparing Video For Download...