Overzicht van competities

Een Kaggle-competitie winnen met Python

Yauhen Babakhin

Kaggle Grandmaster

Instructor

 

Yauhen Babakhin

  • Master in toegepaste data-analyse
  • 5 jaar werkervaring in data science
  • Kaggle Grandmaster
  • Gouden medailles in klassieke machine learning en deep learning

foto van de instructor

Een Kaggle-competitie winnen met Python

 

 

kaggle-logo

Een Kaggle-competitie winnen met Python

Voordelen van Kaggle

 

  1. Doe praktijkervaring op met echte data
  2. Bouw portfolio-projecten
  3. Ontmoet een top data science-community
  4. Probeer een nieuw domein of modeltype
  5. Blijf bij met de best presterende methoden
Een Kaggle-competitie winnen met Python

Competitieproces

 

 

kaggle-competitieproces

Een Kaggle-competitie winnen met Python

Competitieproces

 

 

kaggle-competitieproces

Een Kaggle-competitie winnen met Python

Competitieproces

 

 

kaggle-competitieproces

Een Kaggle-competitie winnen met Python

Meedoen: zo werkt het

 

  1. Ga naar http://kaggle.com en kies de competitie
  2. Download de data
  3. Begin met modellen bouwen!
Een Kaggle-competitie winnen met Python

New York City taxi-tariefvoorspelling

Pagina ‘New York City taxi fare prediction’

Een Kaggle-competitie winnen met Python

Train- en testdata

import pandas as pd

# Read train data
taxi_train = pd.read_csv('taxi_train.csv')
taxi_train.columns.to_list()
['key',
 'fare_amount',
 'pickup_datetime',
 'pickup_longitude',
 'pickup_latitude',
 'dropoff_longitude',
 'dropoff_latitude',
 'passenger_count']
# Read test data
taxi_test = pd.read_csv('taxi_test.csv')
taxi_test.columns.to_list()
['key',
 'pickup_datetime',
 'pickup_longitude',
 'pickup_latitude',
 'dropoff_longitude',
 'dropoff_latitude',
 'passenger_count']
Een Kaggle-competitie winnen met Python

Voorbeeldinzending

# Read sample submission
taxi_sample_sub = pd.read_csv('taxi_sample_submission.csv')
taxi_sample_sub.head()
                              key     fare_amount
0     2015-01-27 13:08:24.0000002     11.35
1     2015-01-27 13:08:24.0000003     11.35
2     2011-10-08 11:53:44.0000002     11.35
3     2012-12-01 21:12:12.0000002     11.35
4     2012-12-01 21:12:12.0000003     11.35
Een Kaggle-competitie winnen met Python

Laten we oefenen!

Een Kaggle-competitie winnen met Python

Preparing Video For Download...