Bytes van geluidsgolven omzetten naar integers

Spoken Language Processing in Python

Daniel Bourke

Machine Learning Engineer/YouTube Creator

Bytes omzetten naar integers

  • Bytes werken niet
  • Zet bytes om naar integers met numpy
import numpy as np

# Zet soundwave_gm van bytes naar integers signal_gm = np.frombuffer(soundwave_gm, dtype='int16')
# Toon de eerste 10 items signal_gm[:10]
array([ -3,  -5,  -8,  -8,  -9, -13,  -8, -10,  -9, -11], dtype=int16)
Spoken Language Processing in Python

De framerate bepalen

  • Frequentie (Hz) = lengte van de array van het wave‑object / duur van audiobestand (s)
# Haal de framerate op
framerate_gm = good_morning.getframerate()

# Toon de framerate framerate_gm
48,000
  • Duur van audiobestand (s) = lengte van de array van het wave‑object / frequentie (Hz)
Spoken Language Processing in Python

Tijdstempels van de geluidsgolf bepalen

# Geef gelijkmatig verdeelde waarden tussen start en stop
np.linspace(start=1, stop=10, num=10)
array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])
# Haal de tijdstempels van de good morning‑geluidsgolf op
time_gm = np.linspace(start=0, 
                      stop=len(soundwave_gm)/framerate_gm,
                      num=len(soundwave_gm))
Spoken Language Processing in Python

Tijdstempels van de geluidsgolf bepalen

# Bekijk de eerste 10 tijdstempels van de good morning‑geluidsgolf
time_gm[:10]
array([0.00000000e+00, 2.08334167e-05, 4.16668333e-05, 6.25002500e-05,
       8.33336667e-05, 1.04167083e-04, 1.25000500e-04, 1.45833917e-04,
       1.66667333e-04, 1.87500750e-04])
Spoken Language Processing in Python

Laten we oefenen!

Spoken Language Processing in Python

Preparing Video For Download...