DataFrames en hun methods

Python voor spreadsheetgebruikers

Chris Cardillo

Data Scientist

Waar we gebleven waren

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

print(fruit)

eenvoudige fruit dataset.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudige fruit dataset.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df kolommen.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df numerieke kolom.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df object-tekenkolom.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df rijen 1.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df rijen 2.png

Python voor spreadsheetgebruikers

Anatomie van een pandas DataFrame

eenvoudig fruit-df index.png

Python voor spreadsheetgebruikers

DataFrame-methods

  • .head()
  • .info()
  • .describe()
  • .sort_values()
Python voor spreadsheetgebruikers

De .head()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

print(fruit.head())

eenvoudig fruit-df head.png

Python voor spreadsheetgebruikers

De .head()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

print(fruit.head(2))

eenvoudig fruit-df head met arg.png

Python voor spreadsheetgebruikers

De .info()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

print(fruit.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 3 columns):
 #   Column     Non-Null Count  Dtype  
 --  ------     --------------  -----  
 0   name       8 non-null      object 
 1   color      8 non-null      object 
 2   price_usd  8 non-null      float64
dtypes: float64(1), object(2)
memory usage: 272.0+ bytes
Python voor spreadsheetgebruikers

De .describe()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

print(fruit.describe())

eenvoudig fruit-df describe-method.png

Python voor spreadsheetgebruikers

De .sort_values()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

fruit = fruit.sort_values('name')
fruit = fruit.reset_index(drop=True)

print(fruit)

eenvoudig fruit-df gesorteerd op naam oplopend.png

Python voor spreadsheetgebruikers

De .sort_values()-method

import pandas as pd

fruit = pd.read_excel('fruit.xlsx')

fruit = fruit.sort_values('price_usd', ascending=False)
fruit = fruit.reset_index(drop=True)

print(fruit.head(3))

eenvoudig fruit-df gesorteerd op prijs aflopend head 3.png

Python voor spreadsheetgebruikers

Jij bent aan de beurt!

Python voor spreadsheetgebruikers

Preparing Video For Download...