Einführung in andere Dateitypen

Einführung in das Importieren von Daten in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Andere Dateitypen

  • Excel-Tabellen
  • MATLAB-Dateien
  • SAS-Dateien
  • Stata-Dateien
  • HDF5-Dateien
Einführung in das Importieren von Daten in Python

Pickled-Dateien

  • Dateityp, der in Python nativ ist
  • Grund: Es gibt viele Datentypen, bei denen nicht klar ist, wie man sie speichern soll
  • Pickled-Dateien werden serialisiert
  • Serialisieren = Objekt in einen Byte-Stream umwandeln
Einführung in das Importieren von Daten in Python

Pickled-Dateien

import pickle
with open('pickled_fruit.pkl', 'rb') as file:
    data = pickle.load(file)    
print(data)
{'peaches': 13, 'apples': 4, 'oranges': 11}
Einführung in das Importieren von Daten in Python

Excel-Tabellen importieren

import pandas as pd
file = 'urbanpop.xlsx'
data = pd.ExcelFile(file)
print(data.sheet_names)
['1960-1966', '1967-1974', '1975-2011']
df1 = data.parse('1960-1966') # sheet name, as a string
df2 = data.parse(0) # sheet index, as a float
Einführung in das Importieren von Daten in Python

Du wirst Folgendes lernen:

  • So passt du deinen Import an
  • Zeilen überspringen
  • Bestimmte Spalten importieren
  • Spaltennamen ändern
Einführung in das Importieren von Daten in Python

Lass uns üben!

Einführung in das Importieren von Daten in Python

Preparing Video For Download...