Fundamentos del aprendizaje por refuerzo

Reinforcement Learning con Gymnasium en Python

Fouad Trad

Machine Learning Engineer

Aprendizaje por refuerzo

 

  • El agente aprende por prueba y error

 

Imagen con dos iconos: uno del agente y otro del entorno.

Reinforcement Learning con Gymnasium en Python

Aprendizaje por refuerzo

 

  • El agente aprende por prueba y error

 

Imagen que muestra que el entorno da observaciones al agente.

Reinforcement Learning con Gymnasium en Python

Aprendizaje por refuerzo

 

  • El agente aprende por prueba y error

 

Imagen que muestra que el entorno proporciona observaciones al agente y luego el agente actúa en consecuencia.

Reinforcement Learning con Gymnasium en Python

Aprendizaje por refuerzo

 

  • El agente aprende por prueba y error
  • El agente recibe:
    • Recompensas por buenas decisiones
    • Penalizaciones por malas decisiones
  • Objetivo: maximizar el feedback positivo en el tiempo

 

Imagen que muestra que el entorno proporciona observaciones al agente; luego el agente actúa y recibe recompensas o penalizaciones según sus acciones.

Reinforcement Learning con Gymnasium en Python

AR como entrenar a una mascota

Imagen de un hombre mayor (el entorno) entrenando a una mascota (el agente).

Reinforcement Learning con Gymnasium en Python

AR vs. otros tipos de ML

La imagen muestra una tabla titulada «Aprendizaje supervisado»: usa datos etiquetados, el objetivo es predecir resultados a partir de entradas, y sirve para clasificación y regresión.

Reinforcement Learning con Gymnasium en Python

AR vs. otros tipos de ML

La imagen muestra una tabla que compara aprendizaje supervisado y no supervisado. Supervisado: datos etiquetados, objetivo predecir resultados, útil para clasificación y regresión. No supervisado: datos sin etiquetar, objetivo descubrir patrones o asociaciones, útil para clustering y análisis de asociaciones.

Reinforcement Learning con Gymnasium en Python

AR vs. otros tipos de ML

La imagen muestra una tabla que añade AR junto a supervisado y no supervisado. Supervisado: datos etiquetados para predecir, útil para clasificación y regresión. No supervisado: datos sin etiquetar para descubrir patrones/asociaciones, útil para clustering y asociaciones. AR: no requiere datos de entrenamiento predefinidos; se centra en decidir para maximizar recompensas del entorno, útil para tareas de decisión.

Reinforcement Learning con Gymnasium en Python

¿Cuándo usar AR?

 

  • Toma de decisiones secuencial
    • Las decisiones afectan observaciones futuras
  • Aprendizaje con recompensas y penalizaciones
    • Sin supervisión directa

Icono de un robot

Reinforcement Learning con Gymnasium en Python

Apropiado para AR: jugar a videojuegos

  • El jugador toma decisiones secuenciales
  • Gana puntos y pierde vidas según sus acciones

Imagen de un videojuego donde el agente toma una decisión.

Reinforcement Learning con Gymnasium en Python

Inapropiado para AR: reconocimiento de objetos en juego

  • No hay decisiones secuenciales
  • No hay interacción con un entorno

Imagen de un fotograma de videojuego donde el objetivo es reconocer distintos pokémon.

Reinforcement Learning con Gymnasium en Python

Aplicaciones de AR

Robótica
  • Caminar del robot
  • Manipulación de objetos

Imagen de una mano robótica.

Reinforcement Learning con Gymnasium en Python

Aplicaciones de AR

Robótica
  • Caminar del robot
  • Manipulación de objetos

Imagen de una mano robótica.

Finanzas
  • Optimizar trading e inversión
  • Maximizar beneficio

Imagen de mucho dinero saliendo de un maletín abierto sobre fondo azul, simbolizando éxito financiero.

Reinforcement Learning con Gymnasium en Python

Aplicaciones de AR

Vehículos autónomos
  • Mejorar seguridad y eficiencia
  • Minimizar riesgos de accidente

Imagen de varios vehículos autónomos circulando por la carretera.

Reinforcement Learning con Gymnasium en Python

Aplicaciones de AR

Vehículos autónomos
  • Mejorar seguridad y eficiencia
  • Minimizar riesgos de accidente

Imagen de varios vehículos autónomos circulando por la carretera.

Desarrollo de chatbots
  • Mejorar habilidades conversacionales
  • Mejorar la experiencia de usuario

Imagen de un chatbot conversacional.

Reinforcement Learning con Gymnasium en Python

¿Qué sigue?

En este curso:

  • Entenderás bases y principios de AR
  • Identificar, plantear y resolver problemas de AR
  • Aplicación con Gymnasium

Imagen del logo de Gymnasium.

Reinforcement Learning con Gymnasium en Python

¡Vamos a practicar!

Reinforcement Learning con Gymnasium en Python

Preparing Video For Download...