Metinden konuşmaya (TTS)

OpenAI API ile Çok Modlu Sistemler

James Chapman

Curriculum Manager, DataCamp

Metinden konuşma

 

  • İnternet tarayıcıları, mobil uygulamalar, erişilebilirlik
  • Metin → gerçekçi insan sesi
  • Erişilebilirliği artırır

Bir mobil uygulamada metinden konuşma.

OpenAI API ile Çok Modlu Sistemler

OpenAI ile metinden konuşma

  • Audio uç noktası → .speech.create()
response = client.audio.speech.create(

model="gpt-4o-mini-tts",
voice="onyx",
input="Creating human-like speech is now possible with just a few lines of code. Pretty neat, right?"
)
response.stream_to_file("output.mp3")
  • response_format: "mp3", "opus", "aac", "flac", "wav" ve "pcm"
1 https://www.openai.fm/
OpenAI API ile Çok Modlu Sistemler

Onyx

Sanal asistan olarak tasvir edilen Onyx sesi.

OpenAI API ile Çok Modlu Sistemler

OpenAI TTS

  • İngilizce için optimize edilmiştir

Sanal asistan olarak tasvir edilen Onyx sesi.

Bir ses kaydı ve metin bloğu simgesi.

OpenAI API ile Çok Modlu Sistemler

Hadi pratik yapalım!

OpenAI API ile Çok Modlu Sistemler

Preparing Video For Download...