Python’da ses verisine giriş

Python ile Konuşma Dili İşleme

Daniel Bourke

Machine Learning Engineer/YouTube Creator

Python’da ses dosyalarıyla çalışmak

  • Ses dosyası türleri

    • mp3
    • wav
    • m4a
    • flac
  • Dijital ses frekansla (kHz) ölçülür

    • 1 kHz = saniyede 1000 bilgi örneği
Python ile Konuşma Dili İşleme

Frekans örnekleri

  • Akış müzikleri 32 kHz’dir
  • Sesli kitaplar/konuşma 8–16 kHz arasındadır

  • Ses dosyaları görünmez; önce dönüştürmek gerekir

import wave
Python ile Konuşma Dili İşleme

Python’da ses dosyası açma

  • good-morning.wav olarak kaydedilmiş ses dosyası
    # Ses dosyasını wave nesnesi olarak içe aktarın
    good_morning = wave.open("good-morning.wav", "r")
    
# wave nesnesini baytlara dönüştürün
good_morning_soundwave = good_morning.readframes(-1)
# wav dosyasını bayt biçiminde görüntüleyin
good_morning_soundwave
b'\xfd\xff\xfb\xff\xf8\xff\xf8\xff\xf7\...
Python ile Konuşma Dili İşleme

Sesle çalışmak farklıdır

  • Sesi işe yarar bir biçime dönüştürmek gerekir
  • Küçük bir ses örneği = çok fazla bilgi
Python ile Konuşma Dili İşleme

Hadi pratik yapalım!

Python ile Konuşma Dili İşleme

Preparing Video For Download...