pandas'ta verileri kategoriye göre gruplama

Python'da Kategorik Verilerle Çalışma

Kasey Jones

Research Data Scientist

.groupby() temelleri: veriyi bölme

adult = pd.read_csv("data/adult.csv")
adult1 = adult[adult["Above/Below 50k"] == " <=50K"]
adult2 = adult[adult["Above/Below 50k"] == " >50K"]

{{2}} ile değiştirilir

groupby_object = adult.groupby(by=["Above/Below 50k"])
Python'da Kategorik Verilerle Çalışma

.groupby() temelleri: fonksiyon uygulama

groupby_object = adult.groupby(by=["Above/Below 50k"])

Bir fonksiyon uygulayın:

groupby_object.mean()
                       Age        fnlgwt  Education Num  Capital Gain ...
Above/Below 50k                                                                                
 <=50K           36.783738  190340.86517       9.595065    148.752468 ...   
 >50K            44.249841  188005.00000      11.611657   4006.142456 ...

Tek satır:

adult.groupby(by=["Above/Below 50k"]).mean()
Python'da Kategorik Verilerle Çalışma

Sütun belirtme

Seçenek 1: yalnızca iki sütunda .sum() çalıştırır.

adult.groupby(by=["Above/Below 50k"])['Age', 'Education Num'].sum()
                    Age  Education Num
Above/Below 50k                       
 <=50K           909294         237190
 >50K            346963          91047

Seçenek 2: tüm sayısal sütunlarda .sum() çalıştırır, sonra alt küme alınır.

adult.groupby(by=["Above/Below 50k"]).sum()[['Age', 'Education Num']]

Büyük veri kümelerinde özellikle Seçenek 1 tercih edilir

Python'da Kategorik Verilerle Çalışma

Birden çok sütuna göre groupby

adult.groupby(by=["Above/Below 50k", "Marital Status"]).size()
Above/Below 50k  Marital Status        
 <=50K            Divorced                  3980
                  Married-AF-spouse           13
                  Married-civ-spouse        8284
                  Married-spouse-absent      384
                  Never-married            10192
                  Separated                  959
                  Widowed                    908
 >50K             Divorced                   463
                  Married-AF-spouse           10 <--- Yalnızca 10 kayıt
                  Married-civ-spouse        6692
    ...
Python'da Kategorik Verilerle Çalışma

.groupby() ile pratik

Python'da Kategorik Verilerle Çalışma

Preparing Video For Download...