Avaliação de desempenho

Entendendo Machine Learning

Hadrien Lacroix

Content Developer at DataCamp

Etapa de avaliação

Entendendo Machine Learning

Ajuste excessivo

  • Tem ótimo desempenho em dados de treinamento
  • Tem baixo desempenho em dados de teste
  • O modelo memorizou os dados de treinamento e não generaliza o aprendizado para novos dados
  • Usa conjunto de testes para verificar o desempenho do modelo
Entendendo Machine Learning

Ilustração de ajuste excessivo

ajuste excessivo

Entendendo Machine Learning

Precisão

  • Precisão = observações classificadas corretamente / todas as observações
  • 48 / 50 = 96%

classificador linear da primeira lição

Entendendo Machine Learning

Limites de precisão: exemplo de fraude

$$

Precisão desse modelo:

$$\frac{28\ corretamente\ classificado}{30\ total\ pontos}=93,33%$$

  • Não detecta a maioria das transações fraudulentas
  • Precisa de uma métrica melhor
Entendendo Machine Learning

Matriz de confusão

matriz de confusão

Entendendo Machine Learning

Verdadeiros positivos

Entendendo Machine Learning

Verdadeiros positivos

Entendendo Machine Learning

Falsos negativos

Entendendo Machine Learning

Falsos negativos

Entendendo Machine Learning

Lembrando de falsos negativos

fp.jpg

Entendendo Machine Learning

Preencha o restante...

Entendendo Machine Learning

Falsos positivos, verdadeiros negativos

Entendendo Machine Learning

Lembrando de falsos positivos

fn2.jpg

Entendendo Machine Learning

Sensibilidade

Quantas transações fraudulentas foram classificadas corretamente?

$$Sensitivity = \frac{true\ positives}{true\ positives + false\ negatives} =1/3=33.33\% $$

  • É melhor marcar transações legítimas como suspeitas do que autorizar transações fraudulentas
Entendendo Machine Learning

Especificidade

$$Specificity = \frac{true\ negatives}{true\ negatives + false\ positives}$$

Filtro de spam:

  • É melhor enviar spam para a caixa de entrada do que enviar e-mails reais para o spam
Entendendo Machine Learning

Avaliação da regressão

Entendendo Machine Learning

Avaliação da regressão

  • Erro = distância entre o ponto (valor real) e a linha (valor previsto)
  • Você pode calcular isso de várias maneiras, por exemplo, com a raiz do erro quadrático médio
Entendendo Machine Learning

Aprendizado não supervisionado

1 https://www.flickr.com/photos/micahdowty/8540188997
Entendendo Machine Learning

Vamos praticar!

Entendendo Machine Learning

Preparing Video For Download...