Agenten-Antwortvalidierung

AI-Agents mit Hugging Face smolagents

Adel Nehme

VP of AI Curriculum, DataCamp

Warum Validierung wichtig ist

  • Antwort des Agenten war nicht hilfreich
  • Kundenerlebnis ging verloren

Um dies zu vermeiden, lässt smolagents dich die finalen Antworten validieren!

AI-Agents mit Hugging Face smolagents

Agenten-Antworten validieren

def check_answer_length(final_answer, agent_memory):
    # Check if the answer is substantial enough
    if len(final_answer) < 200:
        raise Exception("Car recommendation is too brief")
    return True
  • Wenn final_answer die Regel nicht erfüllt, wird eine Ausnahme ausgelöst. Andernfalls wird True zurückgegeben.
AI-Agents mit Hugging Face smolagents

Ausgabevalidierung im Agenten nutzen

car_advisor = CodeAgent(
    tools=[WebSearchTool()],
    model=InferenceClientModel(),
    final_answer_checks=[check_answer_length],
    verbosity_level=0
)
  • check_answer_length-Validierung vor der Antwort ausführen.
  • Automatisch basierend auf der in der Funktion definierten Ausnahme-Nachricht erneut versuchen.
AI-Agents mit Hugging Face smolagents

Meta-Evaluation: KI zur Validierung von KI nutzen

validation_prompt = """
Reasoning process: {}

Agent's final answer: {}

Does the final answer logically follow
from the reasoning and solve the user's 
question? 

Respond only TRUE or FALSE. 
No other text.
"""
AI-Agents mit Hugging Face smolagents

Logik mit Meta-Evaluator prüfen

def check_reasoning_accuracy(final_answer, agent_memory):
    evaluator_model = InferenceClientModel()
    reasoning_steps = agent_memory.get_succinct_steps()
    final_prompt = validation_prompt.format(reasoning_steps, final_answer)

    message = ChatMessage(role='user', content=final_prompt)
    evaluation = evaluator_model([message])

    if evaluation.content == "FALSE":
        raise Exception("The agent's reasoning process contains logical errors")
    else:
        return True
AI-Agents mit Hugging Face smolagents

Mehrfache Validierungen kombinieren

car_advisor = CodeAgent(
    tools=[WebSearchTool()],
    model=InferenceClientModel(),
    final_answer_checks=[check_answer_length, check_reasoning_accuracy],
    verbosity_level=0
)

Fehler werden eher erkannt und korrigiert, bevor der Nutzer sie sieht!

AI-Agents mit Hugging Face smolagents

Intelligente Systeme entwerfen

AI-Agents mit Hugging Face smolagents

Lass uns üben!

AI-Agents mit Hugging Face smolagents

Preparing Video For Download...