Bytes van geluidsgolven omzetten naar integers

Spoken Language Processing in Python

Daniel Bourke

Machine Learning Engineer/YouTube Creator

Bytes omzetten naar integers

Bytes werken niet
Zet bytes om naar integers met numpy

import numpy as np

# Zet soundwave_gm van bytes naar integers
signal_gm = np.frombuffer(soundwave_gm, dtype='int16')

# Toon de eerste 10 items
signal_gm[:10]

array([ -3,  -5,  -8,  -8,  -9, -13,  -8, -10,  -9, -11], dtype=int16)

De framerate bepalen

Frequentie (Hz) = lengte van de array van het wave‑object / duur van audiobestand (s)

# Haal de framerate op
framerate_gm = good_morning.getframerate()

# Toon de framerate
framerate_gm

48,000

Duur van audiobestand (s) = lengte van de array van het wave‑object / frequentie (Hz)

Tijdstempels van de geluidsgolf bepalen

# Geef gelijkmatig verdeelde waarden tussen start en stop
np.linspace(start=1, stop=10, num=10)

array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

# Haal de tijdstempels van de good morning‑geluidsgolf op
time_gm = np.linspace(start=0, 
                      stop=len(soundwave_gm)/framerate_gm,
                      num=len(soundwave_gm))

Tijdstempels van de geluidsgolf bepalen

# Bekijk de eerste 10 tijdstempels van de good morning‑geluidsgolf
time_gm[:10]

array([0.00000000e+00, 2.08334167e-05, 4.16668333e-05, 6.25002500e-05,
       8.33336667e-05, 1.04167083e-04, 1.25000500e-04, 1.45833917e-04,
       1.66667333e-04, 1.87500750e-04])

Laten we oefenen!

Spoken Language Processing in Python