Denken agents aan elektrische schapen? Het ReAct-framework

Inleiding tot AI-agents

Adel Nehme

VP of AI Curriculum, DataCamp

De verschillende soorten modelgedachten

1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Planning "Om ze te helpen met verhuizen, moet ik verhuisbedrijven zoeken, prijzen vergelijken en kijken of ze beschikbaar zijn op de verhuisdatum."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Planning "Om ze te helpen met verhuizen, moet ik verhuisbedrijven zoeken, prijzen vergelijken en kijken of ze beschikbaar zijn op de verhuisdatum."
Analyse "Uit hun uitgavenpatroon blijkt dat ze te veel betalen voor abonnementen die ze zelden gebruiken."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Planning "Om ze te helpen met verhuizen, moet ik verhuisbedrijven zoeken, prijzen vergelijken en kijken of ze beschikbaar zijn op de verhuisdatum."
Analyse "Uit hun uitgavenpatroon blijkt dat ze te veel betalen voor abonnementen die ze zelden gebruiken."
Besluitvorming "Omdat ze het morgen nodig hebben, stel ik spoedbezorging voor, ook al kost dat wat extra."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Planning "Om ze te helpen met verhuizen, moet ik verhuisbedrijven zoeken, prijzen vergelijken en kijken of ze beschikbaar zijn op de verhuisdatum."
Analyse "Uit hun uitgavenpatroon blijkt dat ze te veel betalen voor abonnementen die ze zelden gebruiken."
Besluitvorming "Omdat ze het morgen nodig hebben, stel ik spoedbezorging voor, ook al kost dat wat extra."
Probleemoplossing "Om deze code te verbeteren, moet ik hem eerst profileren om te zien waar het knelpunt zit."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Geheugenintegratie "Vorige week zeiden ze dat ze lactose-intolerant zijn, dus ik laat zuivelproducten weg uit deze receptsuggesties."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Geheugenintegratie "Vorige week zeiden ze dat ze lactose-intolerant zijn, dus ik laat zuivelproducten weg uit deze receptsuggesties."
Zelfreflectie "Mijn uitleg was te technisch, ik zal het vereenvoudigen met een alledaags voorbeeld."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Geheugenintegratie "Vorige week zeiden ze dat ze lactose-intolerant zijn, dus ik laat zuivelproducten weg uit deze receptsuggesties."
Zelfreflectie "Mijn uitleg was te technisch, ik zal het vereenvoudigen met een alledaags voorbeeld."
Doelen stellen "Voordat ik hun trainingsschema plan, moet ik weten hoe fit ze zijn en hoeveel tijd ze hebben."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

De verschillende soorten modelgedachten

Denken Voorbeeld
Geheugenintegratie "Vorige week zeiden ze dat ze lactose-intolerant zijn, dus ik laat zuivelproducten weg uit deze receptsuggesties."
Zelfreflectie "Mijn uitleg was te technisch, ik zal het vereenvoudigen met een alledaags voorbeeld."
Doelen stellen "Voordat ik hun trainingsschema plan, moet ik weten hoe fit ze zijn en hoeveel tijd ze hebben."
Prioriteiten stellen "Ze moeten eerst de vluchten boeken en dan pas het hotel, want de vluchtprijzen stijgen sneller."
1 De Hugging Face Agents-cursus: https://github.com/huggingface/agents-course
Inleiding tot AI-agents

Het ReAct-framework: waar gedachten vandaan komen

react

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Inleiding tot AI-agents

Het ReAct-framework: Redeneren en handelen

Redenering

Handeling

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Inleiding tot AI-agents

Het ReAct-framework: Redeneren en handelen

Redenering

Chain-of-thought-prompting

[Prompt...]. Denk stap voor stap.

Handeling

1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Inleiding tot AI-agents

Het ReAct-framework: Redeneren en handelen

Redenering

Chain-of-thought-prompting

[Prompt...]. Denk stap voor stap.

Handeling

Voorbeelden van denken > handelen > observeren

[Prompt...]. Gebruik deze indeling:

  • Denken: [Bedenk wat je wilt berekenen]
  • Handelen: [Reken het uit]
  • Observeren: [Resultaat]
  • ...herhaal indien nodig...
  • Definitief antwoord: [Volledige oplossing]
1 Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., Cao, Y. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv preprint arXiv:2210.03629.
Inleiding tot AI-agents

ReAct in actie: eenvoudige rekenkunde

gpt-4o

Inleiding tot AI-agents

ReAct in actie: eenvoudige rekenkunde

$$

De vraag

Reken uit wat het in totaal kost als ik 3 laptops koop voor $ 899 per stuk, met 15% korting en 8% btw.

$$

Het juiste antwoord

$ 2475,85

Inleiding tot AI-agents

ReAct in actie: eenvoudige rekenkunde

onjuist

Gebruikte prompt

Reken uit wat het in totaal kost als ik 3 laptops koop voor $ 899 per stuk, met 15% korting en 8% btw. Geef alleen het antwoord.

Inleiding tot AI-agents

ReAct in actie: eenvoudige rekenkunde

correct

Gebruikte prompt

Calculate the total cost if I buy 3 laptops at $899 
each with a 15% discount and 8% sales tax. Think step by step.

Follow this format:

Thought: [Think about what to calculate first]
Action: [Perform calculation]
Observation: [Result of calculation]
...repeat as needed...
Final Answer: [Complete solution]

Example:

Thought: Calculate base cost first
Action: 2 × $50 = $100
Thought: Apply 10% discount
Action: $100 - ($100 × 0.10) = $90
Final Answer: Total is $90
Inleiding tot AI-agents

Zonder ReAct-prompt

onjuist_antwoord

Het juiste antwoord $ 2475,85

Antwoord van ChatGPT: $ 2.776,63

Inleiding tot AI-agents

Met ReAct-prompt

correct_answer

Het juiste antwoord $ 2475,85

Antwoord van ChatGPT: $ 2475,85

Inleiding tot AI-agents

ReAct als manier van denken

ReAct maakt deel uit van de systeemprompt van het model

Systeemprompts zijn verborgen instructies die het model vertellen hoe het zich tijdens alle gesprekken moet gedragen.

1 Afbeelding gegenereerd met GPT-4o
Inleiding tot AI-agents

Redeneringsmodellen en ReAct

$$

  • ReAct is vooral handig voor 'traditionele' taalmodellen, zoals de modellen van de GPT-serie
  • De nieuwere modellen zijn specifiek getraind om stap voor stap te denken en hebben geen ReAct-prompts nodig

$$ Voorbeeld van redeneringsmodellen

  • OpenAI o-serie-modellen
  • DeepSeek R-serie-modellen
  • Gemini-denkmodellen
Inleiding tot AI-agents

Hoe je een redeneringsmodel herkent

denk_modellen

Inleiding tot AI-agents

Laten we oefenen!

Inleiding tot AI-agents

Preparing Video For Download...