Transcripties van klantgesprekken maken

Multimodale systemen met de OpenAI API

James Chapman

Curriculum Manager, DataCamp

Introductie casus

Een afbeelding van chatbot

$$

  • AI-engineer bij DataCamp
  • Verwerkt spraakberichten
  • Spraak-klantenservicechatbot

$$

$$

Klantenserviceteam bij DataCamp

Multimodale systemen met de OpenAI API

Introductie casus

Een afbeelding van chatbot

Multimodale systemen met de OpenAI API

Introductie casus

Stap: audio transcriberen

Multimodale systemen met de OpenAI API

Introductie casus

Stap: taal detecteren

Multimodale systemen met de OpenAI API

Introductie casus

Stap: vertalen naar Engels

Multimodale systemen met de OpenAI API

Introductie casus

Stap: genereer een antwoord

Multimodale systemen met de OpenAI API

Introductie casus

Stap: antwoord in brontaal

Multimodale systemen met de OpenAI API

Introductie casus

Stap: moderatie

Multimodale systemen met de OpenAI API

Plan van de casus

$$

$$

  1. Zet audio om naar tekst
  2. Detecteer de taal
  3. Vertaal naar Engels
  4. Verfijn de tekst

$$

Stap: vertalen naar Engels

Multimodale systemen met de OpenAI API

Stap 1: audio transcriberen

from openai import OpenAI

client = OpenAI(api_key="ENTER YOUR KEY HERE")

# Open the mp3 file
audio_file = open("recording.mp3", "rb")

# Create a transcript
response = client.audio.transcriptions.create(
                  model="whisper-1", 
                  file=audio_file)
Multimodale systemen met de OpenAI API

Stap 1: audio transcriberen

# Extract and print the transcript
transcript = response.text
print(transcript)

$$

Transcript in het Oekraïens

Multimodale systemen met de OpenAI API

Stap 2: taal detecteren

response = client.chat.completions.create(
    model="gpt-4o-mini",
    max_completion_tokens=5,

messages=[{"role": "user", "content": f"""Identify the language of the following text and respond only with the country code (e.g., 'en', 'uk', 'fr'): {transcript}"""}])
# Extract detected language language = response.choices[0].message.content print(language)
uk
Multimodale systemen met de OpenAI API

Stap 3: naar Engels vertalen

response = client.chat.completions.create(
    model="gpt-4o-mini",
    max_completion_tokens=300,
    messages=[
        {"role": "user", "content": f"""Translate this customer transcript
        from country code {language} to English: {transcript}"""}])

# Extract translated text
translated_text = response.choices[0].message.content
Multimodale systemen met de OpenAI API

Stap 3: naar Engels vertalen

print(translated_text)

Vertaalded tekst - rauw

Multimodale systemen met de OpenAI API

Stap 3: naar Engels vertalen

print(translated_text)

Vertaalded tekst (gemarkeerd) - rauw

Multimodale systemen met de OpenAI API

Stap 4: tekst verfijnen

response = client.chat.completions.create(
    model="gpt-4o-mini",
    max_completion_tokens=300,
    messages=[
    {"role": "user", 
     "content": f"""You are an AI assistant that corrects transcripts by fixing 
     misinterpretations, names, and terminology. Please refine the following
     transcript:\n\n{translated_text}"""}])

# Extract corrected text
corrected_text = response.choices[0].message.content
Multimodale systemen met de OpenAI API

Stap 4: tekst verfijnen

print(corrected_text)

Gecorrigeerde tekst (gemarkeerd)

Multimodale systemen met de OpenAI API

Samenvatting

$$

  • Audio getranscribeerd
  • Taal gedetecteerd en vertaald
  • Tekst verfijnd

$$

  • Vier keer OpenAI API aangeroepen ⭐

Transcript in het Oekraïens

Vertaalded tekst (gemarkeerd) - rauw

Gecorrigeerde tekst (gemarkeerd)

Multimodale systemen met de OpenAI API

Tijd om te oefenen!

Multimodale systemen met de OpenAI API

Preparing Video For Download...