Packages

Python voor gevorderde ontwikkelaars

Jasmin Ludolf

Senior Data Science Content Developer

Modules zijn Python-bestanden

  • Module = Python-bestand

  • Iedereen kan een Python-bestand maken!

Codebestand op een laptop

Python voor gevorderde ontwikkelaars

Packages

  • Een verzameling modules = package
    • Ook wel een library
  • Openbaar beschikbaar en gratis
  • Gedownload van PyPI
  • Daarna te importeren en te gebruiken zoals modules

Grote kartonnen doos

1 https://pypi.org/
Python voor gevorderde ontwikkelaars

Een package installeren

  • Terminal / Opdrachtprompt

    python3 -m pip install <package_name>
    
  • python3 - voert Python-code uit via de terminal

  • pip - voorkeursinstaller

Codeterminal

Python voor gevorderde ontwikkelaars

Een package installeren

 

python3 -m pip install pandas

Pandas-logo

$$

  • Package voor datamanipulatie en -analyse
Python voor gevorderde ontwikkelaars

Importeren met een alias

# Importeer pandas
import pandas
  • Gebruik een alias om de code te verkorten
# Importeer pandas met een alias
import pandas as pd
Python voor gevorderde ontwikkelaars

Een DataFrame maken

# Verkoop-dictionary
sales = {"user_id": ["KM37", "PR19", "YU88"],
         "order_value": [197.75, 208.21, 134.99]}

# Zet om naar een pandas DataFrame sales_df = pd.DataFrame(sales)
print(sales_df)
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
Python voor gevorderde ontwikkelaars

Een CSV-bestand inlezen

# Een CSV inlezen uit de huidige map
sales_df = pd.read_csv("sales.csv")

# Het datatype checken print(type(sales_df))
pandas.core.frame.DataFrame
Python voor gevorderde ontwikkelaars

Bestand snel bekijken

# DataFrame-methode om de eerste vijf rijen te zien
print(sales_df.head())
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
3    NT43       153.54        
4    IW06       379.47
Python voor gevorderde ontwikkelaars

Bestandsinfo checken

# Bestandsinfo opvragen
print(sales_df.info())
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
 #   Column       Non-Null Count  Dtype  
<hr />  ------       --------------  -----  
 0   user_id      3 non-null      object 
 1   order_value  3 non-null      float64
dtypes: float64(1), object(1)
memory usage: 180.0+ bytes
Python voor gevorderde ontwikkelaars

Functies versus methoden

# Dit is een ingebouwde functie
print(sum([1, 2 ,3, 4, 5]))
15
  • Functie = code om een taak uit te voeren
# Dit is een pandas-functie
sales_df = pd.DataFrame(sales)
  • .head() werkt alleen met pandas DataFrames
# Dit is een methode
print(sales_df.head())
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
3    NT43       153.54        
4    IW06       379.47
  • Methode = een functie die specifiek is voor een datatype
Python voor gevorderde ontwikkelaars

Laten we oefenen!

Python voor gevorderde ontwikkelaars

Preparing Video For Download...