Dominando parâmetros de resposta

Trabalhando com a OpenAI Responses API

James Chapman

AI Curriculum Manager, DataCamp

Seleção de modelo

response = client.responses.create(
    model="gpt-5-mini",
    input="What is recursion?",
)
1 https://platform.openai.com/docs/models
Trabalhando com a OpenAI Responses API

Seleção de modelo

response = client.responses.create(
    model="gpt-5-mini",
    input="What is recursion?",
)
  • Regra prática: use o modelo mais barato que atenda aos outros requisitos
Modelo Velocidade Custo Melhor para
gpt-5-nano Rápido Ultrabaixo Apps de baixa latência
gpt-5-mini Veloz Baixo Tarefas simples, perguntas e respostas
gpt-5 Moderada Maior Raciocínio complexo
1 https://platform.openai.com/docs/models
Trabalhando com a OpenAI Responses API

LLMs e tokens

  • Tokens: unidades de texto que ajudam a IA a entender e interpretar o texto

$$

A frase "How can the OpenAI API deliver business value?", com cada token em uma cor diferente.

1 https://platform.openai.com/tokenizer
Trabalhando com a OpenAI Responses API

LLMs e tokens

 

  • LLMs sem raciocínio: geram os tokens com maior probabilidade após o prompt

saída sem raciocínio.gif

Trabalhando com a OpenAI Responses API

LLMs e tokens

saída com raciocínio.gif

Trabalhando com a OpenAI Responses API

Esforço de raciocínio

response = client.responses.create(
    model="gpt-5-mini",
    input="Explain LLMs to a 6yr old.",

reasoning={"effort": "minimal"}
)
Trabalhando com a OpenAI Responses API

Esforço de raciocínio

response = client.responses.create(
    model="gpt-5-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={"effort": "minimal"}
)
Esforço Melhor para
minimal Tarefas triviais ou mecânicas.
low Tarefas simples priorizando velocidade e custo.
medium Padrão: equilíbrio entre raciocínio e eficiência.
high Tarefas complexas, em várias etapas ou com muita lógica.
Trabalhando com a OpenAI Responses API

Resumos de raciocínio

response = client.responses.create(
    model="gpt-5-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={
        "effort": "medium",

"summary": "auto"
} )
Trabalhando com a OpenAI Responses API

Limitando tokens de saída

response = client.responses.create(
    model="gpt-5-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={"effort": "minimal"},

max_output_tokens=500
)
  • max_output_tokens inclui os tokens de raciocínio
Trabalhando com a OpenAI Responses API

Resumo

  • Tarefas simples → comece com modelos pequenos, raciocínio mínimo e poucos tokens
  • Tarefas complexas → comece com modelos e raciocínio médios, depois ajuste fino

link de parâmetros.jpg

Trabalhando com a OpenAI Responses API

Vamos praticar!

Trabalhando com a OpenAI Responses API

Preparing Video For Download...