Validation

Concevoir des systèmes d’IA avec l’API OpenAI

Francesca Donadoni

Curriculum Manager, DataCamp

Validation

Un développeur testant du code sur plusieurs écrans

Concevoir des systèmes d’IA avec l’API OpenAI

Validation

 

Risques d’erreurs du modèle :

  • Mauvaise interprétation du contexte
  • Amplification des biais si les données d’entraînement sont biaisées
  • Informations obsolètes en sortie
  • Manipulation pour générer du contenu nuisible ou non éthique
  • Divulgation involontaire d’informations sensibles
Concevoir des systèmes d’IA avec l’API OpenAI

Tests adversariaux

Schéma : un programmeur injecte des entrées adversariales dans les données et le modèle, puis le modèle infère à partir des données

1 Adapté de https://adversarial-robustness-toolbox.readthedocs.io/en/latest/
Concevoir des systèmes d’IA avec l’API OpenAI

Tests adversariaux

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
{"role": "system",
 "content": "You are an AI assistant for the film industry. You should interpret 
    the user prompt, a movie review, and based on that extract whether its 
    sentiment is positive, negative, or neutral."},

{"role": "user", "content": "It was great to see some of my favorite stars of 30 years ago including John Ritter, Ben Gazarra and Audrey Hepburn. They looked quite wonderful. But that was it. They were not given any characters or good lines to work with. I neither understood or cared what the characters were doing."}])
1 https://huggingface.co/datasets/davanstrien/test1?row=10
Concevoir des systèmes d’IA avec l’API OpenAI

Tests adversariaux

print(response.choices[0].message.content)
Le sentiment de cette critique de film est négatif.
Concevoir des systèmes d’IA avec l’API OpenAI

Tests adversariaux

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
{"role": "system",
 "content": "You are an AI assistant for the film industry. You should interpret 
    the user prompt, a movie review, and based on that extract whether its sentiment 
    is positive, negative, or neutral."},

{"role": "user", "content": "If you read the book, your all set. If you didn't...your still all set."}]) print(response.choices[0].message.content)
Le sentiment de cette critique de film est neutre.
Concevoir des systèmes d’IA avec l’API OpenAI

Bibliothèques et jeux de données d’évaluation

Schéma d’une bibliothèque d’évaluation utilisant divers jeux de données pour tester un modèle

1 https://github.com/openai/evals
Concevoir des systèmes d’IA avec l’API OpenAI

Passons à la pratique !

Concevoir des systèmes d’IA avec l’API OpenAI

Preparing Video For Download...