Creare una risposta vocale per i clienti

Sistemi multimodali con l'API di OpenAI

James Chapman

Curriculum Manager, DataCamp

Piano del caso di studio

$$

$$

  • Traduzione della risposta

$$

  • Convertire testo in audio

$$

Piano del caso di studio

Sistemi multimodali con l'API di OpenAI

Variabili da usare

$$

Lingua rilevata
print(language)
uk

$$

Risposta generata
print(chatbot_reply)

Risposta del chatbot

Sistemi multimodali con l'API di OpenAI

Traduzione della risposta

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": f"""Translate the following text 
        from English to country code {language}. Only return the translated text!"""},
        {"role": "user", "content": chatbot_reply}
             ],
    max_completion_tokens=500)
Sistemi multimodali con l'API di OpenAI

Traduzione della risposta

# Extract and print the translated response
translated_reply = response.choices[0].message.content
print(translated_reply)

Output tradotto

Sistemi multimodali con l'API di OpenAI

Sintesi vocale (TTS)

response = client.audio.speech.create(
    model="gpt-4o-mini-tts",
    voice="onyx",
    input=translated_reply)

response.stream_to_file("audio_reply.mp3")

La voce Onyx raffigurata come assistente virtuale.

Sistemi multimodali con l'API di OpenAI

Riepilogo del caso di studio

Caso di studio - completo

Sistemi multimodali con l'API di OpenAI

Prossimi passi

Aggiungere memoria al chatbot

Sistemi multimodali con l'API di OpenAI

Let's practice!

Sistemi multimodali con l'API di OpenAI

Preparing Video For Download...