DataFrame’lere giriş

pandas ile Veri İşleme

Richie Cotton

Data Evangelist at DataCamp

pandas’ın amacı nedir?

pandas ile Veri İşleme

Kurs içeriği

  • Bölüm 1: DataFrame’ler
    • Sıralama ve alt kümeleme
    • Yeni sütunlar oluşturma
  • Bölüm 2: Veriyi Özetleme
    • Özet istatistikler
    • Sayma
    • Gruplu özet istatistikler
  • Bölüm 3: Dilimleme ve İndeksleme

    • Dilimleme ile alt kümeleme
    • İndeksler ve indeksle alt kümeleme
  • Bölüm 4: Veri Oluşturma ve Görselleştirme

    • Grafik çizme
    • Eksik veriyi işleme
    • Veriyi bir DataFrame’e okuma
pandas ile Veri İşleme

pandas, NumPy ve Matplotlib üzerine kuruludur

Üstte bir üçgen, altta iki dikdörtgen. Üçgen pandas paketini, dikdörtgenler NumPy ve matplotlib paketlerini temsil eder.

pandas ile Veri İşleme

pandas popülerdir

pandas emojisi yüzlerce kez tekrarlanmış; pandas’ın çok sayıda kullanıcısını temsil eder.

1 https://pypistats.org/packages/pandas
pandas ile Veri İşleme

Dikdörtgen veri

Ad Irk Renk Boy (cm) Kilo (kg) Doğum Tarihi
Bella Labrador Kahverengi 56 25 2013-07-01
Charlie Poodle Siyah 43 23 2016-09-16
Lucy Chow Chow Kahverengi 46 22 2014-08-25
Cooper Schnauzer Gri 49 17 2011-12-11
Max Labrador Siyah 59 29 2017-01-20
Stella Chihuahua Açık kahverengi 18 2 2015-04-20
Bernie St. Bernard Beyaz 77 74 2018-02-27
pandas ile Veri İşleme

pandas DataFrame’leri

print(dogs)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56         24    2013-07-01
1  Charlie       Poodle  Black         43         24    2016-09-16
2     Lucy    Chow Chow  Brown         46         24    2014-08-25
3   Cooper    Schnauzer   Gray         49         17    2011-12-11
4      Max     Labrador  Black         59         29    2017-01-20
5   Stella    Chihuahua    Tan         18          2    2015-04-20
6   Bernie  St. Bernard  White         77         74    2018-02-27
pandas ile Veri İşleme

Bir DataFrame’i keşfetme: .head()

print(dogs.head())
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56         24    2013-07-01
1  Charlie       Poodle  Black         43         24    2016-09-16
2     Lucy    Chow Chow  Brown         46         24    2014-08-25
3   Cooper    Schnauzer   Gray         49         17    2011-12-11
4      Max     Labrador  Black         59         29    2017-01-20
pandas ile Veri İşleme

Bir DataFrame’i keşfetme: .info()

print(dogs.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 6 columns):
 #   Column         Non-Null Count  Dtype 
 --  ------         --------------  ----- 
 0   name           7 non-null      object
 1   breed          7 non-null      object
 2   color          7 non-null      object
 3   height_cm      7 non-null      int64 
 4   weight_kg      7 non-null      int64 
 5   date_of_birth  7 non-null      object
dtypes: int64(2), object(4)
memory usage: 464.0+ bytes
pandas ile Veri İşleme

Bir DataFrame’i keşfetme: .shape

print(dogs.shape)
(7, 6)
pandas ile Veri İşleme

Bir DataFrame’i keşfetme: .describe()

print(dogs.describe())
       height_cm  weight_kg
count   7.000000   7.000000
mean   49.714286  27.428571
std    17.960274  22.292429
min    18.000000   2.000000
25%    44.500000  19.500000
50%    49.000000  23.000000
75%    57.500000  27.000000
max    77.000000  74.000000
pandas ile Veri İşleme

Bir DataFrame’in bileşenleri: .values

print(dogs.values)
array([['Bella', 'Labrador', 'Brown', 56, 24, '2013-07-01'],
       ['Charlie', 'Poodle', 'Black', 43, 24, '2016-09-16'],
       ['Lucy', 'Chow Chow', 'Brown', 46, 24, '2014-08-25'],
       ['Cooper', 'Schnauzer', 'Gray', 49, 17, '2011-12-11'],
       ['Max', 'Labrador', 'Black', 59, 29, '2017-01-20'],
       ['Stella', 'Chihuahua', 'Tan', 18, 2, '2015-04-20'],
       ['Bernie', 'St. Bernard', 'White', 77, 74, '2018-02-27']],
      dtype=object)
pandas ile Veri İşleme

Bir DataFrame’in bileşenleri: .columns ve .index

print(dogs.columns)
Index(['name', 'breed', 'color', 'height_cm', 'weight_kg', 'date_of_birth'],
dtype='object')
dogs.index
RangeIndex(start=0, stop=7, step=1)
pandas ile Veri İşleme

pandas felsefesi

Bunu yapmanın tek — ve tercihen yalnızca tek — bariz bir yolu olmalıdır.

     - Tim Peters’ın Python Zen’i, Madde 13

Yeşil bir İsviçre çakısı

1 https://www.python.org/dev/peps/pep-0020/
pandas ile Veri İşleme

Hadi pratik yapalım!

pandas ile Veri İşleme

Preparing Video For Download...