Menangani data hilang

Mengubah Bentuk Data dengan pandas

Maria Eugenia Inzaugarat

Data Scientist

Tinjauan

  • Stack dan unstack DataFrame:
    • Semua level indeks kolom
    • Satu level indeks baris
    • Pilih level untuk stack atau unstack
Mengubah Bentuk Data dengan pandas

Unstack menghasilkan nilai hilang

Subkelompok tidak memiliki set label yang sama

animals
                                jump  run  fly
class    order         name                   
Mammalia carnivora     dog        No  Yes   No
         Diprotodontia Kangaroo  Yes   No   No
Aves     hervibora     bird       No   No  Yes
Mengubah Bentuk Data dengan pandas

Unstack menghasilkan nilai hilang

Subkelompok tidak memiliki set label yang sama

animals
                                jump  run  fly
class    order         name                   
   Mammalia carnivora     dog        No  Yes   No <--
         Diprotodontia Kangaroo  Yes   No   No
Aves     hervibora     bird       No   No  Yes
Mengubah Bentuk Data dengan pandas

Unstack menghasilkan nilai hilang

Subkelompok tidak memiliki set label yang sama

animals.unstack(level='class')
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo  NaN      Yes  NaN       No  NaN       No
      carnivora      Dog  NaN       No  NaN      Yes  NaN       No
Charadriiformes   Avocet   No      NaN   No      NaN  Yes      NaN
Mengubah Bentuk Data dengan pandas

Unstack menghasilkan nilai hilang

Subkelompok tidak memiliki set label yang sama

animals.unstack(level='class')
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo  NaN      Yes  NaN       No  NaN       No
  -----------------------------
      carnivora      Dog  NaN <--  No   NaN      Yes  NaN       No
  -----------------------------
Charadriiformes   Avocet   No      NaN   No      NaN  Yes      NaN
Mengubah Bentuk Data dengan pandas

Tangani NaN dengan unstack

animals.unstack(level='class', fill_value=    )
Mengubah Bentuk Data dengan pandas

Tangani NaN dengan unstack

animals.unstack(level='class', fill_value='No')
Mengubah Bentuk Data dengan pandas

Tangani NaN dengan unstack

animals.unstack(level='class', fill_value='No').sort_index(level=['order', 'name'], ascending=[True, False])
                                 jump            run           fly         
        clas             Aves Mammalia Aves Mammalia Aves Mammalia
        order       name                                              
  Diprotodontia Kangaroo   No      Yes   No       No   No       No
      carnivora      Dog   No       No   No      Yes   No       No
Charadriiformes   Avocet   No       No   No       No  Yes       No
Mengubah Bentuk Data dengan pandas

Stack dan nilai hilang

Kombinasi nilai indeks dan kolom yang tidak ada di DataFrame asli

flowers
     petals Stigma
     number   size
rose     40    NaN
Lily      8      5
Mengubah Bentuk Data dengan pandas

Stack dan nilai hilang

Kombinasi nilai indeks dan kolom yang tidak ada di DataFrame asli

flowers.stack()
            Stigma  petals
rose number    NaN    40.0
Lily number    NaN     8.0
       size      5     NaN
Mengubah Bentuk Data dengan pandas

Stack dan nilai hilang

Kombinasi nilai indeks dan kolom yang tidak ada di DataFrame asli

flowers.stack(dropna=True)
            Stigma  petals
rose number    NaN    40.0
Lily number    NaN     8.0
       size      5     NaN
Mengubah Bentuk Data dengan pandas

Stack dan nilai hilang

Kombinasi nilai indeks dan kolom yang tidak ada di DataFrame asli

flowers.stack(dropna=False)
            Stigma  petals
rose number    NaN    40.0
         size    NaN     NaN <--
Lily number    NaN     8.0
       size      5     NaN
Mengubah Bentuk Data dengan pandas

Tangani NaN dengan stack

flowers.stack(dropna=False).fillna(0)
            Stigma  petals
rose number      0    40.0
       size      0       0
Lily number      0     8.0
       size      5       0
Mengubah Bentuk Data dengan pandas

Ayo berlatih!

Mengubah Bentuk Data dengan pandas

Preparing Video For Download...