Componentes de arquitectura en frameworks ML de extremo a extremo

Machine Learning de extremo a extremo

Joshua Stapleton

Machine Learning Engineer

Feature stores

Características

  • Selección de características
  • Ingeniería de características

Feature store

  • Repositorio central de características
  • Garantiza consistencia, reduce duplicados
  • Permite compartir y descubrir
  • Estandariza transformaciones y cálculos de características

Imagen del ciclo de vida de ML con feature store añadido

Machine Learning de extremo a extremo

Feast

Feast

  • Herramienta popular para implementar feature stores
  • Gestión, almacenamiento, serving y descubrimiento unificados de características de ML

Principios

  • Define y registra características con conjuntos de características
  • Conjuntos de características: agrupación de características relacionadas + metadatos

Ejemplo: características de cardiopatía

  • Entidad paciente
  • Características asociadas (colesterol, edad, sexo)
Machine Learning de extremo a extremo

Feature stores en Feast (1)

from feast import Field, Entity, ValueType, FeatureStore
from feast.data_source import FileSource

# Define the entity, which in this case is a patient, and features patient = Entity(name="patient", join_keys=["patient_id"])
chol = Field(name="chol", dtype=Float32) age = Field(name="age", dtype=Int32) ...
# Define the data source data_source = FileSource( path="/path_to_heart_disease_dataset.csv", event_timestamp_column="event_timestamp", created_timestamp_column="created")
Machine Learning de extremo a extremo

Feature stores en Feast (2)

# ... continued
# Create a feature view of the data
heart_disease_fv = FeatureView(name="heart_disease", entities=[patient],
    schema=[cholesterol, ...], ttl=timedelta(days=1), input=data_source,)

# Create a FeatureStore object store = FeatureStore(repo_path=".")
# Register the FeatureView store.apply([patient, heart_disease_fv])
Machine Learning de extremo a extremo

Registros de modelos

Registro de modelos

  • Sistemas de control de versiones
  • Seguimiento de versiones de modelos
  • Anotar modelos
  • Registrar rendimiento en el tiempo

Beneficios

  • Organización
  • Transparencia
  • Reproducibilidad

Imagen del ciclo de vida de ML con registro de modelos añadido

Machine Learning de extremo a extremo

¡Vamos a practicar!

Machine Learning de extremo a extremo

Preparing Video For Download...