¿Piensan los agentes en ovejas eléctricas? El marco ReAct

Introducción a los agentes de IA

Adel Nehme

VP of AI Curriculum, DataCamp

Los diferentes tipos de pensamientos de los modelos

1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Planificación "Para ayudar con la mudanza, tendré que buscar empresas de mudanzas, comparar precios y comprobar la disponibilidad para la fecha"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Planificación "Para ayudar con la mudanza, tendré que buscar empresas de mudanzas, comparar precios y comprobar la disponibilidad para la fecha"
Análisis "Al observar sus patrones de gasto, veo que pagan demasiado por suscripciones que apenas utilizan"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Planificación "Para ayudar con la mudanza, tendré que buscar empresas de mudanzas, comparar precios y comprobar la disponibilidad para la fecha"
Análisis "Al observar sus patrones de gasto, veo que pagan demasiado por suscripciones que apenas utilizan"
Toma de decisiones "Como lo necesitan para mañana, sugeriría el envío urgente a pesar del coste adicional"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Planificación "Para ayudar con la mudanza, tendré que buscar empresas de mudanzas, comparar precios y comprobar la disponibilidad para la fecha"
Análisis "Al observar sus patrones de gasto, veo que pagan demasiado por suscripciones que apenas utilizan"
Toma de decisiones "Como lo necesitan para mañana, sugeriría el envío urgente a pesar del coste adicional"
Solución de problemas "Para optimizar este código, primero debería hacer un perfil de él para identificar los cuellos de botella"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Integración de memoria "La semana pasada mencionaron que eran intolerantes a la lactosa, así que excluiré los lácteos de estas sugerencias de recetas"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Integración de memoria "La semana pasada mencionaron que eran intolerantes a la lactosa, así que excluiré los lácteos de estas sugerencias de recetas"
Autorreflexión "Mi explicación ha sido demasiado técnica: la simplificaré utilizando analogías habituales"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Integración de memoria "La semana pasada mencionaron que eran intolerantes a la lactosa, así que excluiré los lácteos de estas sugerencias de recetas"
Autorreflexión "Mi explicación ha sido demasiado técnica: la simplificaré utilizando analogías habituales"
Establecimiento de objetivos "Antes de planificar su entrenamiento, debo conocer su forma física y el tiempo disponible"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

Los diferentes tipos de pensamientos de los modelos

Pensamiento Ejemplo
Integración de memoria "La semana pasada mencionaron que eran intolerantes a la lactosa, así que excluiré los lácteos de estas sugerencias de recetas"
Autorreflexión "Mi explicación ha sido demasiado técnica: la simplificaré utilizando analogías habituales"
Establecimiento de objetivos "Antes de planificar su entrenamiento, debo conocer su forma física y el tiempo disponible"
Priorización "Deben reservar los vuelos antes que el hotel, ya que los precios de los vuelos suben más rápidamente"
1 El curso de agentes de Hugging Face: https://github.com/huggingface/agents-course
Introducción a los agentes de IA

El marco ReAct: de dónde vienen los pensamientos

react

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K. y Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Introducción a los agentes de IA

El marco ReAct: razonamiento y actuación

Razonamiento

Actuación

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K. y Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Introducción a los agentes de IA

El marco ReAct: razonamiento y actuación

Razonamiento

Prompts de tipo cadena de pensamiento

[Prompt...]. Pensar paso a paso.

Actuación

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K. y Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Introducción a los agentes de IA

El marco ReAct: razonamiento y actuación

Razonamiento

Prompts de tipo cadena de pensamiento

[Prompt...]. Pensar paso a paso.

Actuación

Ejemplos de Pensamiento > Acción > Observación

[Prompt...]. Sigue este formato:

  • Pensamiento: [Piensa qué calcular primero]
  • Acción: [Realizar cálculo]
  • Observación: [Resultado del cálculo]
  • ... repite tantas veces como sea necesario...
  • Respuesta final: [Solución completa]
1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K. y Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Introducción a los agentes de IA

ReAct en acción: aritmética sencilla

gpt-4o

Introducción a los agentes de IA

ReAct en acción: aritmética sencilla

$$

La pregunta

Calcula el coste total si compro 3 portátiles a $899 cada uno con un 15 % de descuento y un impuesto sobre las ventas del 8 %

$$

La respuesta correcta

$2475.85

Introducción a los agentes de IA

ReAct en acción: aritmética sencilla

incorrecto

Prompt utilizado

Calcula el coste total si compro 3 portátiles a $899 cada uno con un 15 % de descuento y un impuesto sobre las ventas del 8 %. Devuelve solo la respuesta.

Introducción a los agentes de IA

ReAct en acción: aritmética sencilla

correcto

Prompt utilizado

Calculate the total cost if I buy 3 laptops at $899 
each with a 15% discount and 8% sales tax. Think step by step.

Follow this format:

Thought: [Think about what to calculate first]
Action: [Perform calculation]
Observation: [Result of calculation]
...repeat as needed...
Final Answer: [Complete solution]

Example:

Thought: Calculate base cost first
Action: 2 × $50 = $100
Thought: Apply 10% discount
Action: $100 - ($100 × 0.10) = $90
Final Answer: Total is $90
Introducción a los agentes de IA

Sin prompts de ReAct

incorrect_answer

La respuesta correcta $2475.85

Respuesta de ChatGPT: $2,776.63

Introducción a los agentes de IA

Con prompts de ReAct

correct_answer

La respuesta correcta $2475.85

Respuesta de ChatGPT: $2475.85

Introducción a los agentes de IA

ReAct como forma de pensar

ReAct forma parte del prompt del sistema del modelo

El prompt del sistema son instrucciones ocultas que le dicen al modelo cómo comportarse en todas las conversaciones.

1 Imagen generada con GPT-4o
Introducción a los agentes de IA

Modelos que razonan y ReAct

$$

  • ReAct es especialmente útil en modelos de lenguaje "tradicionales" como la serie de modelos GPT
  • Los modelos de nueva generación que razonan se han entrenado explícitamente para pensar paso a paso y no necesitan prompts de ReAct

$$ Ejemplo de modelos de razonamiento

  • Serie de modelos OpenAI o
  • Serie de modelos DeepSeek R
  • Modelos de pensamiento de Gemini
Introducción a los agentes de IA

Cómo identificar un modelo que razona

thinking_models

Introducción a los agentes de IA

¡Practiquemos!

Introducción a los agentes de IA

Preparing Video For Download...