Batchverwerking

AI-systemen ontwikkelen met de OpenAI API

Francesca Donadoni

Curriculum Manager, DataCamp

Wat zijn rate limits

Iemand die auto rijdt, aangehouden door een politieagent

AI-systemen ontwikkelen met de OpenAI API

Hoe rate limits ontstaan

 

  • Te veel verzoeken

    Veel spraakballonnen samen die meerdere berichten voorstellen

 

  • Te veel tekst in het verzoek

    Een grote spraakballon met puntjes op witte achtergrond die een lang bericht voorstelt
AI-systemen ontwikkelen met de OpenAI API

Rate limits voorkomen

 

  • Opnieuw proberen
    • Korte wachttijd tussen verzoeken

 

  • Batchverwerking
    • Meerdere berichten in één verzoek verwerken

 

  • Tokens verminderen
    • Aantal tokens meten en verlagen
AI-systemen ontwikkelen met de OpenAI API

Opnieuw proberen

 

from tenacity import (
    retry,
    stop_after_attempt,
    wait_random_exponential
)

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))
AI-systemen ontwikkelen met de OpenAI API

Opnieuw proberen

 

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))

def get_response(model, message): response = client.chat.completions.create( model=model, messages=[message], response_format={"type": "json_object"} ) return response.choices[0].message.content
AI-systemen ontwikkelen met de OpenAI API

Batchverwerking

countries = ["United States", "Ireland", "India"]

message=[
    {
    "role": "system",
    "content": """You are given a series of countries and are asked to return the 
    country and capital city. Provide each of the questions with an answer in the 
    response as separate content.""",
    }]


[message.append({"role": "user", "content": i }) for i in countries]
AI-systemen ontwikkelen met de OpenAI API

Batchverwerking

response = client.chat.completions.create(
      model="gpt-4o-mini",
      messages=message
    )

print(response.choices[0].message.content)
United States: Washington D.C.
Ireland: Dublin
India: New Delhi
AI-systemen ontwikkelen met de OpenAI API

Tokens verminderen

 

import tiktoken


encoding = tiktoken.encoding_for_model("gpt-4o-mini")
prompt = "Tokens can be full words, or groups of characters commonly grouped together: tokenization."
num_tokens = len(encoding.encode(prompt))
print("Number of tokens in prompt:", num_tokens)
Number of tokens in prompt: 17
AI-systemen ontwikkelen met de OpenAI API

Laten we oefenen!

AI-systemen ontwikkelen met de OpenAI API

Preparing Video For Download...