Aprendizado de máquina com o scikit-learn

Aprendizado Supervisionado com o scikit-learn

George Boorman

Core Curriculum Manager, DataCamp

O que é aprendizado de máquina?

  • O aprendizado de máquina é o processo em que:
    • Os computadores adquirem a capacidade de aprender a tomar decisões com base em dados
    • sem serem formalmente programados!
Aprendizado Supervisionado com o scikit-learn

Exemplos de aprendizado de máquina

ícone de e-mail

livros

Aprendizado Supervisionado com o scikit-learn

Aprendizado não supervisionado

  • Revelar padrões ocultos em dados não rotulados

  • Exemplo:

    • Agrupamento de clientes em categorias distintas (clustering)

análise de agrupamentos

Aprendizado Supervisionado com o scikit-learn

Aprendizado supervisionado

  • Os valores previstos são conhecidos

  • Objetivo: prever as variáveis dependentes de dados não vistos, considerando as variáveis independentes

 

variáveis independentes e variável dependente

Aprendizado Supervisionado com o scikit-learn

Tipos de aprendizado supervisionado

  • Classificação: a variável dependente consiste em categorias

caixa eletrônico

  • Regressão: a variável dependente é contínua

 

imóveis

Aprendizado Supervisionado com o scikit-learn

Convenções de nomenclatura

  • Feature = variável preditora = variável independente

  • Variável-alvo = variável dependente = variável de resposta

 

variáveis independentes e variável dependente

Aprendizado Supervisionado com o scikit-learn

Antes de usar o aprendizado supervisionado

  • Requisitos:
    • Não há valores faltantes
    • Dados em formato numérico
    • Dados armazenados em um DataFrame do pandas ou em uma matriz do NumPy

 

  • Primeiro faça a análise exploratória de dados (AED)
Aprendizado Supervisionado com o scikit-learn

Sintaxe do scikit-learn

from sklearn.module import Model

model = Model()
model.fit(X, y)
predictions = model.predict(X_new)
print(predictions)
array([0, 0, 0, 0, 1, 0])
Aprendizado Supervisionado com o scikit-learn

Vamos praticar!

Aprendizado Supervisionado com o scikit-learn

Preparing Video For Download...