Traitement par lots

Concevoir des systèmes d’IA avec l’API OpenAI

Francesca Donadoni

Curriculum Manager, DataCamp

Que sont les limites de débit

Une personne au volant, arrêtée par un policier

Comment surviennent les limites de débit

Trop de requêtes

Trop de texte dans la requête

Éviter les limites de débit

Réessayer
- Courte pause entre les requêtes

Traitement par lots
- Traiter plusieurs messages en une requête

Réduire les tokens
- Compter et réduire le nombre de tokens

Réessaies

from tenacity import (
    retry,
    stop_after_attempt,
    wait_random_exponential
)

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))

Réessaies

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))

def get_response(model, message):
    response = client.chat.completions.create(
      model=model,
      messages=[message],
      response_format={"type": "json_object"}
    )
    return response.choices[0].message.content

Traitement par lots

countries = ["United States", "Ireland", "India"]

message=[
    {
    "role": "system",
    "content": """You are given a series of countries and are asked to return the 
    country and capital city. Provide each of the questions with an answer in the 
    response as separate content.""",
    }]


[message.append({"role": "user", "content": i }) for i in countries]

Traitement par lots

response = client.chat.completions.create(
      model="gpt-4o-mini",
      messages=message
    )

print(response.choices[0].message.content)

United States: Washington D.C.
Ireland: Dublin
India: New Delhi

Réduire les tokens

import tiktoken


encoding = tiktoken.encoding_for_model("gpt-4o-mini")

prompt = "Tokens can be full words, or groups of characters commonly grouped 
          together: tokenization."


num_tokens = len(encoding.encode(prompt))

print("Number of tokens in prompt:", num_tokens)

Number of tokens in prompt: 17

Passons à la pratique !

Concevoir des systèmes d’IA avec l’API OpenAI

Traitement par lots

Que sont les limites de débit

Comment surviennent les limites de débit

Trop de requêtes

Trop de texte dans la requête

Éviter les limites de débit

Réessaies

Réessaies

Traitement par lots

Traitement par lots

Réduire les tokens

Passons à la pratique !