Ses dalgası baytlarını tamsayıya dönüştürme

Python ile Konuşma Dili İşleme

Daniel Bourke

Machine Learning Engineer/YouTube Creator

Baytları tamsayıya dönüştürme

  • Baytlar kullanılamaz
  • Numpy ile baytları tamsayıya dönüştürün
import numpy as np

# soundwave_gm'i bayttan tamsayıya dönüştürün signal_gm = np.frombuffer(soundwave_gm, dtype='int16')
# İlk 10 öğeyi gösterin signal_gm[:10]
array([ -3,  -5,  -8,  -8,  -9, -13,  -8, -10,  -9, -11], dtype=int16)
Python ile Konuşma Dili İşleme

Kare hızını bulma

  • Frekans (Hz) = dalga nesnesi dizisinin uzunluğu / ses dosyası süresi (sn)
# Kare hızını alın
framerate_gm = good_morning.getframerate()

# Kare hızını gösterin framerate_gm
48,000
  • Ses dosyası süresi (sn) = dalga nesnesi dizisinin uzunluğu / frekans (Hz)
Python ile Konuşma Dili İşleme

Ses dalgası zaman damgalarını bulma

# Başlangıç ve bitiş arasında eşit aralıklı değerler döndürür
np.linspace(start=1, stop=10, num=10)
array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])
# Good morning ses dalgasının zaman damgalarını alın
time_gm = np.linspace(start=0, 
                      stop=len(soundwave_gm)/framerate_gm,
                      num=len(soundwave_gm))
Python ile Konuşma Dili İşleme

Ses dalgası zaman damgalarını bulma

# Good morning ses dalgasının ilk 10 zaman damgasını görüntüleyin
time_gm[:10]
array([0.00000000e+00, 2.08334167e-05, 4.16668333e-05, 6.25002500e-05,
       8.33336667e-05, 1.04167083e-04, 1.25000500e-04, 1.45833917e-04,
       1.66667333e-04, 1.87500750e-04])
Python ile Konuşma Dili İşleme

Hadi pratik yapalım!

Python ile Konuşma Dili İşleme

Preparing Video For Download...