Düz Dosyalara Giriş

pandas ile Kolaylaştırılmış Veri Alımı

Amany Mahfouz

Instructor

pandas

pandas logosu

pandas ile Kolaylaştırılmış Veri Alımı

DataFrame'ler

  • İki boyutlu veriler için pandasa özgü yapı

Ülkeler, başkentler ve ülke alanı (mil kare) içeren veri çerçevesi

pandas ile Kolaylaştırılmış Veri Alımı

DataFrame'ler

  • İki boyutlu veriler için pandasa özgü yapı

Sütun etiketleri (Country, Population ve Area (sq. mi.)) vurgulanmış veri çerçevesi

pandas ile Kolaylaştırılmış Veri Alımı

DataFrame'ler

  • İki boyutlu veriler için pandasa özgü yapı

Satır etiketleri/indeksleri vurgulanmış veri çerçevesi

pandas ile Kolaylaştırılmış Veri Alımı

Düz Dosyalar

  • Basit, üretmesi kolay format
  • Veriler düz metin olarak saklanır (biçimlendirme yok)
  • Her satırda bir kayıt
  • Alanlar bir ayırıcı ile ayrılır
  • En yaygın düz dosya türü: virgülle ayrılmış değerler
  • Hepsi için tek pandas işlevi: read_csv()
pandas ile Kolaylaştırılmış Veri Alımı

CSV Yükleme

  • us_tax_data_2016.csv örneği
STATEFIPS,STATE,zipcode,agi_stub,...,N11901,A11901,N11902,A11902
1,AL,0,1,...,63420,51444,711580,1831661
import pandas as pd

tax_data = pd.read_csv("us_tax_data_2016.csv")
tax_data.head(4)
   STATEFIPS STATE  zipcode  agi_stub   ...     N11901  A11901  N11902   A11902
0          1    AL        0         1   ...      63420   51444  711580  1831661
1          1    AL        0         2   ...      74090  110889  416090  1173463
2          1    AL        0         3   ...      64000  143060  195130   543284
3          1    AL        0         4   ...      45020  128920  117410   381329

[4 rows x 147 columns]
pandas ile Kolaylaştırılmış Veri Alımı

Diğer Düz Dosyaları Yükleme

  • Farklı ayırıcıyı sep ile belirtin
  • us_tax_data_2016.tsv örneği
    STATEFIPS    STATE    zipcode    agi_stub    ...    N11901    A11901    N11902    A11902
    1    AL    0    1    ...    63420    51444    711580    1831661
    
import pandas as pd

tax_data = pd.read_csv("us_tax_data_2016.tsv", sep="\t")
tax_data.head(3)
   STATEFIPS STATE  zipcode  agi_stub   ...     N11901  A11901  N11902   A11902
0          1    AL        0         1   ...      63420   51444  711580  1831661
1          1    AL        0         2   ...      74090  110889  416090  1173463
2          1    AL        0         3   ...      64000  143060  195130   543284

[3 rows x 147 columns]
pandas ile Kolaylaştırılmış Veri Alımı

Hadi pratik yapalım!

pandas ile Kolaylaştırılmış Veri Alımı

Preparing Video For Download...