Introductie tot andere bestandstypen

Introductie tot data importeren in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Andere bestandstypen

  • Excel-spreadsheets
  • MATLAB-bestanden
  • SAS-bestanden
  • Stata-bestanden
  • HDF5-bestanden
Introductie tot data importeren in Python

Pickle-bestanden

  • Bestandstype eigen aan Python
  • Reden: veel datatypes die lastig op te slaan zijn
  • Pickle-bestanden zijn geserialiseerd
  • Serialiseren = object omzetten naar bytestream
Introductie tot data importeren in Python

Pickle-bestanden

import pickle
with open('pickled_fruit.pkl', 'rb') as file:
    data = pickle.load(file)    
print(data)
{'peaches': 13, 'apples': 4, 'oranges': 11}
Introductie tot data importeren in Python

Excel-spreadsheets importeren

import pandas as pd
file = 'urbanpop.xlsx'
data = pd.ExcelFile(file)
print(data.sheet_names)
['1960-1966', '1967-1974', '1975-2011']
df1 = data.parse('1960-1966') # sheet name, as a string
df2 = data.parse(0) # sheet index, as a float
Introductie tot data importeren in Python

Je leert:

  • Import aanpassen
  • Rijen overslaan
  • Bepaalde kolommen inladen
  • Kolomnamen wijzigen
Introductie tot data importeren in Python

Laten we oefenen!

Introductie tot data importeren in Python

Preparing Video For Download...