Agenten-Antwortvalidierung

AI-Agents mit Hugging Face smolagents

Adel Nehme

VP of AI Curriculum, DataCamp

Warum Validierung wichtig ist

Antwort des Agenten war nicht hilfreich
Kundenerlebnis ging verloren

Um dies zu vermeiden, lässt smolagents dich die finalen Antworten validieren!

Agenten-Antworten validieren

def check_answer_length(final_answer, agent_memory):
    # Check if the answer is substantial enough
    if len(final_answer) < 200:
        raise Exception("Car recommendation is too brief")
    return True

Wenn final_answer die Regel nicht erfüllt, wird eine Ausnahme ausgelöst. Andernfalls wird True zurückgegeben.

Ausgabevalidierung im Agenten nutzen

car_advisor = CodeAgent(
    tools=[WebSearchTool()],
    model=InferenceClientModel(),
    final_answer_checks=[check_answer_length],
    verbosity_level=0
)

check_answer_length-Validierung vor der Antwort ausführen.
Automatisch basierend auf der in der Funktion definierten Ausnahme-Nachricht erneut versuchen.

Meta-Evaluation: KI zur Validierung von KI nutzen

validation_prompt = """
Reasoning process: {}

Agent's final answer: {}

Does the final answer logically follow
from the reasoning and solve the user's 
question? 

Respond only TRUE or FALSE. 
No other text.
"""

Logik mit Meta-Evaluator prüfen

def check_reasoning_accuracy(final_answer, agent_memory):
    evaluator_model = InferenceClientModel()
    reasoning_steps = agent_memory.get_succinct_steps()
    final_prompt = validation_prompt.format(reasoning_steps, final_answer)

    message = ChatMessage(role='user', content=final_prompt)
    evaluation = evaluator_model([message])

    if evaluation.content == "FALSE":
        raise Exception("The agent's reasoning process contains logical errors")
    else:
        return True

Mehrfache Validierungen kombinieren

car_advisor = CodeAgent(
    tools=[WebSearchTool()],
    model=InferenceClientModel(),
    final_answer_checks=[check_answer_length, check_reasoning_accuracy],
    verbosity_level=0
)

Fehler werden eher erkannt und korrigiert, bevor der Nutzer sie sieht!

Intelligente Systeme entwerfen

Lass uns üben!

AI-Agents mit Hugging Face smolagents