Eksik verileri yönetme

pandas ile Veriyi Yeniden Şekillendirme

Maria Eugenia Inzaugarat

Data Scientist

Gözden geçirme

  • DataFrame'leri stack ve unstack etme:
    • Tüm sütun indeks seviyeleri
    • Bir satır indeks seviyesi
    • Stack veya unstack edilecek seviyeleri seçin
pandas ile Veriyi Yeniden Şekillendirme

Unstack eksik değerlere yol açar

Alt grupların etiket setleri aynı değil

animals
                                jump  run  fly
class    order         name                   
Mammalia carnivora     dog        No  Yes   No
         Diprotodontia Kangaroo  Yes   No   No
Aves     hervibora     bird       No   No  Yes
pandas ile Veriyi Yeniden Şekillendirme

Unstack eksik değerlere yol açar

Alt grupların etiket setleri aynı değil

animals
                                jump  run  fly
class    order         name                   
   Mammalia carnivora     dog        No  Yes   No <--
         Diprotodontia Kangaroo  Yes   No   No
Aves     hervibora     bird       No   No  Yes
pandas ile Veriyi Yeniden Şekillendirme

Unstack eksik değerlere yol açar

Alt grupların etiket setleri aynı değil

animals.unstack(level='class')
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo  NaN      Yes  NaN       No  NaN       No
      carnivora      Dog  NaN       No  NaN      Yes  NaN       No
Charadriiformes   Avocet   No      NaN   No      NaN  Yes      NaN
pandas ile Veriyi Yeniden Şekillendirme

Unstack eksik değerlere yol açar

Alt grupların etiket setleri aynı değil

animals.unstack(level='class')
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo  NaN      Yes  NaN       No  NaN       No
  -----------------------------
      carnivora      Dog  NaN <--  No   NaN      Yes  NaN       No
  -----------------------------
Charadriiformes   Avocet   No      NaN   No      NaN  Yes      NaN
pandas ile Veriyi Yeniden Şekillendirme

unstack ile NaN yönetimi

animals.unstack(level='class', fill_value=    )
pandas ile Veriyi Yeniden Şekillendirme

unstack ile NaN yönetimi

animals.unstack(level='class', fill_value='No')
pandas ile Veriyi Yeniden Şekillendirme

unstack ile NaN yönetimi

animals.unstack(level='class', fill_value='No').sort_index(level=['order', 'name'], ascending=[True, False])
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo   No      Yes   No       No   No       No
      carnivora      Dog   No       No   No      Yes   No       No
Charadriiformes   Avocet   No       No   No       No  Yes       No
pandas ile Veriyi Yeniden Şekillendirme

stack ve eksik değerler

Özgün DataFrame'de eksik olan indeks ve sütun değerlerinin birleşimleri

flowers
     petals Stigma
     number   size
rose     40    NaN
Lily      8      5
pandas ile Veriyi Yeniden Şekillendirme

stack ve eksik değerler

Özgün DataFrame'de eksik olan indeks ve sütun değerlerinin birleşimleri

flowers.stack()
            Stigma  petals
rose number    NaN    40.0
Lily number    NaN     8.0
       size      5     NaN
pandas ile Veriyi Yeniden Şekillendirme

stack ve eksik değerler

Özgün DataFrame'de eksik olan indeks ve sütun değerlerinin birleşimleri

flowers.stack(dropna=True)
            Stigma  petals
rose number    NaN    40.0
Lily number    NaN     8.0
       size      5     NaN
pandas ile Veriyi Yeniden Şekillendirme

stack ve eksik değerler

Özgün DataFrame'de eksik olan indeks ve sütun değerlerinin birleşimleri

flowers.stack(dropna=False)
            Stigma  petals
rose number    NaN    40.0
         size    NaN     NaN <--
Lily number    NaN     8.0
       size      5     NaN
pandas ile Veriyi Yeniden Şekillendirme

stack ile NaN yönetimi

flowers.stack(dropna=False).fillna(0)
            Stigma  petals
rose number      0    40.0
       size      0       0
Lily number      0     8.0
       size      5       0
pandas ile Veriyi Yeniden Şekillendirme

Hadi pratik yapalım!

pandas ile Veriyi Yeniden Şekillendirme

Preparing Video For Download...