Begrijp het probleem

Een Kaggle-competitie winnen met Python

Yauhen Babakhin

Kaggle Grandmaster

Oplossingsworkflow

 

 

oplossingsworkflow

Een Kaggle-competitie winnen met Python

Oplossingsworkflow

 

 

oplossingsworkflow

Een Kaggle-competitie winnen met Python

Oplossingsworkflow

 

 

oplossingsworkflow

Een Kaggle-competitie winnen met Python

Oplossingsworkflow

 

 

oplossingsworkflow

Een Kaggle-competitie winnen met Python

Begrijp het probleem

  • Datatype: tabeldata, tijdreeksen, afbeeldingen, tekst, enz.

datatypen

Een Kaggle-competitie winnen met Python

Begrijp het probleem

  • Datatype: tabeldata, tijdreeksen, afbeeldingen, tekst, enz.

datatypen

Een Kaggle-competitie winnen met Python

Begrijp het probleem

  • Datatype: tabeldata, tijdreeksen, afbeeldingen, tekst, enz.

datatypen

Een Kaggle-competitie winnen met Python

Begrijp het probleem

  • Datatype: tabeldata, tijdreeksen, afbeeldingen, tekst, enz.

datatypen

  • Probleemtype: classificatie, regressie, ranking, enz.
  • Evaluatiemetric: ROC AUC, F1-score, MAE, MSE, enz.
Een Kaggle-competitie winnen met Python

Definitie van metric

# Some classification and regression metrics
from sklearn.metrics import roc_auc_score, f1_score, mean_squared_error

$$RMSLE = \sqrt{\frac{1}{N}\sum_{i=1}^{N}{(\log(y_i+1) - \log(\hat{y}_i+1))^2}}$$

import numpy as np

def rmsle(y_true, y_pred):
    diffs = np.log(y_true + 1) - np.log(y_pred + 1)
    squares = np.power(diffs, 2)

err = np.sqrt(np.mean(squares)) return err
Een Kaggle-competitie winnen met Python

Laten we oefenen!

Een Kaggle-competitie winnen met Python

Preparing Video For Download...