Dominando os parâmetros de resposta

Trabalhando com a OpenAI Responses API

James Chapman

AI Curriculum Manager, DataCamp

Seleção de modelo

response = client.responses.create(
    model="gpt-5.4-mini",
    input="What is recursion?",
)

¹ https://platform.openai.com/docs/models

Seleção de modelo

response = client.responses.create(
    model="gpt-5.4-mini",
    input="What is recursion?",
)

Regra prática: usa o modelo mais barato que atenda aos outros requisitos

Modelo	Velocidade	Custo	Melhor para
gpt-5.4-mini	Rápido	Baixo	Tarefas simples, perguntas e respostas
gpt-5.5	Moderada	Maior	Raciocínio complexo

¹ https://platform.openai.com/docs/models

LLMs e tokens

Tokens: unidades de texto que ajudam a IA a entender e interpretar o texto

A frase "How can the OpenAI API deliver business value?", com cada token em uma cor diferente.

¹ https://platform.openai.com/tokenizer

LLMs e tokens

LLMs sem raciocínio: geram os tokens com maior probabilidade após o prompt

Saída sem raciocínio

LLMs e tokens

Saída com raciocínio

Esforço de raciocínio

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Explain LLMs to a 6yr old.",

    reasoning={"effort": "none"}

)

Esforço de raciocínio

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={"effort": "none"}
)

Esforço	Melhor para
none	Tarefas triviais ou mecânicas.
low	Tarefas simples priorizando velocidade e custo.
medium	Padrão: equilíbrio entre raciocínio e eficiência.
high	Tarefas complexas, em várias etapas ou com muita lógica.
xhigh	As mais difíceis, no limite do possível.

Sumários de raciocínio

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={
        "effort": "medium",

        "summary": "auto"

    }
)

Limitando tokens de saída

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Explain LLMs to a 6yr old.",
    reasoning={"effort": "none"},

    max_output_tokens=500

)

max_output_tokens inclui os tokens de raciocínio

Resumo

Tarefas simples → comece com modelos pequenos, sem raciocínio e poucos tokens
Tarefas complexas → comece com modelos médios e raciocínio; depois ajuste

Link de parâmetros

Vamos praticar!

Trabalhando com a OpenAI Responses API