Introduzione ad Amazon Bedrock
Nikhil Rangarajan
Data Scientist
I modelli hanno parametri per controllarne il comportamento
temperature: controlla la casualità delle previsioni
top_p: controlla la diversità includendo i token più probabilimax_tokens: imposta la lunghezza massima dell’output
Casualità e creatività della risposta
Bassa temperatura (vicina a 0): risposte più focalizzate e deterministiche
Alta temperatura (vicina a 1): output più vari e creativi
La maggior parte dei modelli Bedrock predefinisce 0,7
prompt = "Write a headline for a
tech article"
request = {
"temperature": 0.2,
"messages": [
{
"role": "user",
"content": [{"type": "text",
"text": prompt}],
}
],
...
}
La temperatura è la “propensione al rischio” del modello
Bassa temperatura: come un decisore prudente
Alta temperatura: come un pensatore creativo disposto a rischiare

prompt = "Explain quantum computing"
# Focused response
request["top_p"] = 0.1
# Diverse response
request["top_p"] = 0.9
Max_tokens limita la lunghezza della risposta:

prompt = "Explain quantum computing"
# Focused shorter response
request["top_p"] = 0.1
request["max_tokens"] = 100
# Diverse longer response
request["top_p"] = 0.9
request["max_tokens"] = 500

Introduzione ad Amazon Bedrock