Fundamentos del aprendizaje por refuerzo
Reinforcement Learning con Gymnasium en Python
Fouad Trad
Machine Learning Engineer
Aprendizaje por refuerzo
El agente aprende por prueba y error
Aprendizaje por refuerzo
El agente aprende por prueba y error
Aprendizaje por refuerzo
El agente aprende por prueba y error
Aprendizaje por refuerzo
El agente aprende por prueba y error
El agente recibe:
Recompensas por buenas decisiones
Penalizaciones por malas decisiones
Objetivo: maximizar el feedback positivo en el tiempo
AR como entrenar a una mascota
AR vs. otros tipos de ML
AR vs. otros tipos de ML
AR vs. otros tipos de ML
¿Cuándo usar AR?
Toma de decisiones secuencial
Las decisiones afectan observaciones futuras
Aprendizaje con recompensas y penalizaciones
Sin supervisión directa
Apropiado para AR: jugar a videojuegos
El jugador toma decisiones secuenciales
Gana puntos y pierde vidas según sus acciones
Inapropiado para AR: reconocimiento de objetos en juego
No hay decisiones secuenciales
No hay interacción con un entorno
Aplicaciones de AR
Robótica
Caminar del robot
Manipulación de objetos
Aplicaciones de AR
Robótica
Caminar del robot
Manipulación de objetos
Finanzas
Optimizar trading e inversión
Maximizar beneficio
Aplicaciones de AR
Vehículos autónomos
Mejorar seguridad y eficiencia
Minimizar riesgos de accidente
Aplicaciones de AR
Vehículos autónomos
Mejorar seguridad y eficiencia
Minimizar riesgos de accidente
Desarrollo de chatbots
Mejorar habilidades conversacionales
Mejorar la experiencia de usuario
¿Qué sigue?
En este curso:
Entenderás bases y principios de AR
Identificar, plantear y resolver problemas de AR
Aplicación con Gymnasium
¡Vamos a practicar!
Reinforcement Learning con Gymnasium en Python
Preparing Video For Download...