Engenharia de features

Conceitos de MLOps

Folkert Stijnman

ML Engineer

Engenharia de features

Fases de MLOps engenharia de features

Conceitos de MLOps

Engenharia de features

... é o processo de selecionar, manipular e transformar dados brutos em features.

  • Uma feature é uma variável, como a coluna de uma tabela
  • Podemos usar dados brutos ou criar nossas próprias
Conceitos de MLOps

Dados de clientes

Exemplo de dados de clientes

Conceitos de MLOps

Dados de clientes

Exemplo de dados de clientes com nova feature

Conceitos de MLOps

Engenharia de features

  • Objetivo: melhorar o desempenho do modelo
  • Ferramentas e técnicas para processar, selecionar e manter features:
    • Seleção de features
    • Feature store
    • Controle de versão de dados
Conceitos de MLOps

Seleção de features

  • Conhecimento do domínio
  • Correlação
  • Importância das features
  • Outros métodos: seleção univariada, Análise de Componentes Principais (PCA), Eliminação Recursiva de Features (RFE)

gráfico de correlação

1 https://www.datacamp.com/tutorial/tutorial-datails-on-correlation
Conceitos de MLOps

Feature store

Feature store

Só relevante para times grandes trabalhando em vários projetos que usam as mesmas features

Conceitos de MLOps

Controle de versão de dados

  • Rastrear mudanças no dataset
  • Manter consistência em todo o ciclo de desenvolvimento

gráfico mostrando controle de versão de dados e git

1 https://www.datacamp.com/courses/cicd-for-machine-learning
Conceitos de MLOps

Vamos praticar!

Conceitos de MLOps

Preparing Video For Download...