Tijdreeksen-imputaties visualiseren

Omgaan met ontbrekende gegevens in Python

Suraj Donthi

Deep Learning & Computer Vision Learning

Luchtkwaliteit-tijdreeksplot

airquality['Ozone'].plot(title='Ozone', marker='o', figsize=(30, 5))

Tijdreeksplot van luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Ffill-imputatie

ffill_imp['Ozone'].plot(color='red', marker='o', linestyle='dotted', figsize=(30, 5))

airquality['Ozone'].plot(title='Ozone', marker='o')

Tijdreeksplot van forward-filled luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Bfill-imputatie

bfill_imp['Ozone'].plot(color='red', marker='o', linestyle='dotted', figsize=(30, 5))
airquality['Ozone'].plot(title='Ozone', marker='o')

Tijdreeksplot van backward-filled luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Lineaire interpolatie

linear_interp['Ozone'].plot(color='red', marker='o', linestyle='dotted', figsize=(30, 5))
airquality['Ozone'].plot(title='Ozone', marker='o')

Tijdreeksplot van lineair geïnterpoleerde luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Kwadratische interpolatie

quadratic_interp['Ozone'].plot(color='red', marker='o', linestyle='dotted', figsize=(30, 5))
airquality['Ozone'].plot(title='Ozone', marker='o')

Tijdreeksplot van kwadratisch geïnterpoleerde luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Nearest-interpolatie

nearest_interp['Ozone'].plot(color='red', marker='o', linestyle='dotted', figsize=(30, 5))
airquality['Ozone'].plot(title='Ozone', marker='o')

Tijdreeksplot van nearest-geïnterpoleerde luchtkwaliteitsdataset

Omgaan met ontbrekende gegevens in Python

Vergelijking van interpolaties

# Create subplots
fig, axes = plt.subplots(3, 1, figsize=(30, 20))

# Create interpolations dictionary
interpolations = {'Linear Interpolation': linear_interp, 
                         'Quadratic Interpolation': quadratic_interp, 
                         'Nearest Interpolation': nearest_interp}

# Visualize each interpolation
for ax, df_key in zip(axes, interpolations):
            interpolations[df_key].Ozone.plot(color='red', marker='o', 
                                              linestyle='dotted', ax=ax)
            airquality.Ozone.plot(title=df_key + ' - Ozone', marker='o', ax=ax)
Omgaan met ontbrekende gegevens in Python

Vergelijking van interpolaties

Vergelijking van de geïnterpoleerde luchtkwaliteitsdataframes

Omgaan met ontbrekende gegevens in Python

Vergelijking van imputatietechnieken

Vergelijking van alle geïmputeerde luchtkwaliteitsdatasets

Omgaan met ontbrekende gegevens in Python

Samenvatting

  • Tijdreeksplot van geïmputeerde DataFrame
  • Vergelijking van imputaties
Omgaan met ontbrekende gegevens in Python

Laten we oefenen!

Omgaan met ontbrekende gegevens in Python

Preparing Video For Download...