Capire il problema

Vincere una competizione Kaggle con Python

Yauhen Babakhin

Kaggle Grandmaster

Flusso di soluzione

 

 

flusso di soluzione

Vincere una competizione Kaggle con Python

Flusso di soluzione

 

 

flusso di soluzione

Vincere una competizione Kaggle con Python

Flusso di soluzione

 

 

flusso di soluzione

Vincere una competizione Kaggle con Python

Flusso di soluzione

 

 

flusso di soluzione

Vincere una competizione Kaggle con Python

Capire il problema

  • Tipo di dato: tabelle, serie temporali, immagini, testo, ecc.

tipi di dati

Vincere una competizione Kaggle con Python

Capire il problema

  • Tipo di dato: tabelle, serie temporali, immagini, testo, ecc.

tipi di dati

Vincere una competizione Kaggle con Python

Capire il problema

  • Tipo di dato: tabelle, serie temporali, immagini, testo, ecc.

tipi di dati

Vincere una competizione Kaggle con Python

Capire il problema

  • Tipo di dato: tabelle, serie temporali, immagini, testo, ecc.

tipi di dati

  • Tipo di problema: classificazione, regressione, ranking, ecc.
  • Metrica di valutazione: ROC AUC, F1-Score, MAE, MSE, ecc.
Vincere una competizione Kaggle con Python

Definizione della metrica

# Some classification and regression metrics
from sklearn.metrics import roc_auc_score, f1_score, mean_squared_error

$$RMSLE = \sqrt{\frac{1}{N}\sum_{i=1}^{N}{(\log(y_i+1) - \log(\hat{y}_i+1))^2}}$$

import numpy as np

def rmsle(y_true, y_pred):
    diffs = np.log(y_true + 1) - np.log(y_pred + 1)
    squares = np.power(diffs, 2)

err = np.sqrt(np.mean(squares)) return err
Vincere una competizione Kaggle con Python

Vamos praticar!

Vincere una competizione Kaggle con Python

Preparing Video For Download...