Panoramica delle competizioni

Vincere una competizione Kaggle con Python

Yauhen Babakhin

Kaggle Grandmaster

Istruttore

 

Yauhen Babakhin

  • Laurea magistrale in Analisi dei dati applicata
  • 5 anni di esperienza in Data Science
  • Grandmaster nelle competizioni Kaggle
  • Medaglie d'oro in competizioni di Machine Learning classico e Deep Learning

foto dell'istruttore

Vincere una competizione Kaggle con Python

 

 

logo kaggle

Vincere una competizione Kaggle con Python

Vantaggi di Kaggle

 

  1. Fai pratica su dati reali
  2. Crea progetti per il portfolio
  3. Entra in una grande community di Data Science
  4. Prova un nuovo dominio o tipo di modello
  5. Resta aggiornato sui metodi migliori
Vincere una competizione Kaggle con Python

Processo della competizione

 

 

processo della competizione kaggle

Vincere una competizione Kaggle con Python

Processo della competizione

 

 

processo della competizione kaggle

Vincere una competizione Kaggle con Python

Processo della competizione

 

 

processo della competizione kaggle

Vincere una competizione Kaggle con Python

Come partecipare

 

  1. Vai su http://kaggle.com e scegli la competizione
  2. Scarica i dati
  3. Inizia a creare i modelli!
Vincere una competizione Kaggle con Python

Previsione tariffa taxi a New York

pagina di previsione tariffa taxi di New York

Vincere una competizione Kaggle con Python

Dati di train e test

import pandas as pd

# Read train data
taxi_train = pd.read_csv('taxi_train.csv')
taxi_train.columns.to_list()
['key',
 'fare_amount',
 'pickup_datetime',
 'pickup_longitude',
 'pickup_latitude',
 'dropoff_longitude',
 'dropoff_latitude',
 'passenger_count']
# Read test data
taxi_test = pd.read_csv('taxi_test.csv')
taxi_test.columns.to_list()
['key',
 'pickup_datetime',
 'pickup_longitude',
 'pickup_latitude',
 'dropoff_longitude',
 'dropoff_latitude',
 'passenger_count']
Vincere una competizione Kaggle con Python

Submission di esempio

# Read sample submission
taxi_sample_sub = pd.read_csv('taxi_sample_submission.csv')
taxi_sample_sub.head()
                              key     fare_amount
0     2015-01-27 13:08:24.0000002     11.35
1     2015-01-27 13:08:24.0000003     11.35
2     2011-10-08 11:53:44.0000002     11.35
3     2012-12-01 21:12:12.0000002     11.35
4     2012-12-01 21:12:12.0000003     11.35
Vincere una competizione Kaggle con Python

Passons à la pratique !

Vincere una competizione Kaggle con Python

Preparing Video For Download...