Avaliação de desempenho

Introdução ao aprendizado de máquina

Hadrien Lacroix

Content Developer at DataCamp

Etapa de avaliação

Introdução ao aprendizado de máquina

Ajuste excessivo

  • Tem ótimo desempenho em dados de treinamento
  • Tem baixo desempenho em dados de teste
  • O modelo memorizou os dados de treinamento e não generaliza o aprendizado para novos dados
  • Usa conjunto de testes para verificar o desempenho do modelo
Introdução ao aprendizado de máquina

Ilustração de ajuste excessivo

ajuste excessivo

Introdução ao aprendizado de máquina

Precisão

  • Precisão = observações classificadas corretamente / todas as observações
  • 48 / 50 = 96%

classificador linear da primeira lição

Introdução ao aprendizado de máquina

Limites de precisão: exemplo de fraude

$$

Precisão desse modelo:

$$\frac{28\ corretamente\ classificado}{30\ total\ pontos}=93,33%$$

  • Não detecta a maioria das transações fraudulentas
  • Precisa de uma métrica melhor
Introdução ao aprendizado de máquina

Matriz de confusão

matriz de confusão

Introdução ao aprendizado de máquina

Verdadeiros positivos

Introdução ao aprendizado de máquina

Verdadeiros positivos

Introdução ao aprendizado de máquina

Falsos negativos

Introdução ao aprendizado de máquina

Falsos negativos

Introdução ao aprendizado de máquina

Lembrando de falsos negativos

fp.jpg

Introdução ao aprendizado de máquina

Preencha o restante...

Introdução ao aprendizado de máquina

Falsos positivos, verdadeiros negativos

Introdução ao aprendizado de máquina

Lembrando de falsos positivos

fn2.jpg

Introdução ao aprendizado de máquina

Sensibilidade

Quantas transações fraudulentas foram classificadas corretamente?

$$Sensitivity = \frac{true\ positives}{true\ positives + false\ negatives} =1/3=33.33\% $$

  • É melhor marcar transações legítimas como suspeitas do que autorizar transações fraudulentas
Introdução ao aprendizado de máquina

Especificidade

$$Specificity = \frac{true\ negatives}{true\ negatives + false\ positives}$$

Filtro de spam:

  • É melhor enviar spam para a caixa de entrada do que enviar e-mails reais para o spam
Introdução ao aprendizado de máquina

Avaliação da regressão

Introdução ao aprendizado de máquina

Avaliação da regressão

  • Erro = distância entre o ponto (valor real) e a linha (valor previsto)
  • Você pode calcular isso de várias maneiras, por exemplo, com a raiz do erro quadrático médio
Introdução ao aprendizado de máquina

Aprendizado não supervisionado

1 https://www.flickr.com/photos/micahdowty/8540188997
Introdução ao aprendizado de máquina

Vamos praticar!

Introdução ao aprendizado de máquina

Preparing Video For Download...