Creare una risposta vocale per i clienti

Sistemi multimodali con l'API di OpenAI

James Chapman

Curriculum Manager, DataCamp

Piano del caso di studio

Traduzione della risposta

Convertire testo in audio

Piano del caso di studio

Variabili da usare

Lingua rilevata

print(language)

uk

Risposta generata

print(chatbot_reply)

Risposta del chatbot

Traduzione della risposta

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": f"""Translate the following text 
        from English to country code {language}. Only return the translated text!"""},
        {"role": "user", "content": chatbot_reply}
             ],
    max_completion_tokens=500)

Traduzione della risposta

# Extract and print the translated response
translated_reply = response.choices[0].message.content
print(translated_reply)

Output tradotto

Sintesi vocale (TTS)

response = client.audio.speech.create(
    model="gpt-4o-mini-tts",
    voice="onyx",
    input=translated_reply)


response.stream_to_file("audio_reply.mp3")

La voce Onyx raffigurata come assistente virtuale.

Riepilogo del caso di studio

Caso di studio - completo

Prossimi passi

Aggiungere memoria al chatbot

Let's practice!

Sistemi multimodali con l'API di OpenAI