Batchverwerking

AI-systemen ontwikkelen met de OpenAI API

Francesca Donadoni

Curriculum Manager, DataCamp

Wat zijn rate limits

Iemand die auto rijdt, aangehouden door een politieagent

Hoe rate limits ontstaan

Te veel verzoeken

Te veel tekst in het verzoek

Rate limits voorkomen

Opnieuw proberen
- Korte wachttijd tussen verzoeken

Batchverwerking
- Meerdere berichten in één verzoek verwerken

Tokens verminderen
- Aantal tokens meten en verlagen

Opnieuw proberen

from tenacity import (
    retry,
    stop_after_attempt,
    wait_random_exponential
)

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))

Opnieuw proberen

@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))

def get_response(model, message):
    response = client.chat.completions.create(
      model=model,
      messages=[message],
      response_format={"type": "json_object"}
    )
    return response.choices[0].message.content

Batchverwerking

countries = ["United States", "Ireland", "India"]

message=[
    {
    "role": "system",
    "content": """You are given a series of countries and are asked to return the 
    country and capital city. Provide each of the questions with an answer in the 
    response as separate content.""",
    }]


[message.append({"role": "user", "content": i }) for i in countries]

Batchverwerking

response = client.chat.completions.create(
      model="gpt-4o-mini",
      messages=message
    )

print(response.choices[0].message.content)

United States: Washington D.C.
Ireland: Dublin
India: New Delhi

Tokens verminderen

import tiktoken


encoding = tiktoken.encoding_for_model("gpt-4o-mini")

prompt = "Tokens can be full words, or groups of characters commonly grouped 
          together: tokenization."


num_tokens = len(encoding.encode(prompt))

print("Number of tokens in prompt:", num_tokens)

Number of tokens in prompt: 17

Laten we oefenen!

AI-systemen ontwikkelen met de OpenAI API

Batchverwerking

Wat zijn rate limits

Hoe rate limits ontstaan

Te veel verzoeken

Te veel tekst in het verzoek

Rate limits voorkomen

Opnieuw proberen

Opnieuw proberen

Batchverwerking

Batchverwerking

Tokens verminderen

Laten we oefenen!