Pengantar data audio di Python

Pemrosesan Bahasa Lisan dengan Python

Daniel Bourke

Machine Learning Engineer/YouTube Creator

Mengelola berkas audio di Python

  • Jenis berkas audio

    • mp3
    • wav
    • m4a
    • flac
  • Suara digital diukur dalam frekuensi (kHz)

    • 1 kHz = 1000 potongan informasi per detik
Pemrosesan Bahasa Lisan dengan Python

Contoh frekuensi

  • Lagu streaming berfrekuensi 32 kHz
  • Buku audio dan ujaran berada di 8–16 kHz

  • Audio tidak terlihat, jadi perlu diubah dahulu

import wave
Pemrosesan Bahasa Lisan dengan Python

Membuka berkas audio di Python

  • Berkas audio disimpan sebagai good-morning.wav
    # Import audio file as wave object
    good_morning = wave.open("good-morning.wav", "r")
    
# Convert wave object to bytes
good_morning_soundwave = good_morning.readframes(-1)
# View the wav file in byte form
good_morning_soundwave
b'\xfd\xff\xfb\xff\xf8\xff\xf8\xff\xf7\...
Pemrosesan Bahasa Lisan dengan Python

Bekerja dengan audio itu berbeda

  • Harus mengonversi audio ke bentuk yang berguna
  • Cuplikan audio kecil = banyak informasi
Pemrosesan Bahasa Lisan dengan Python

Ayo berlatih!

Pemrosesan Bahasa Lisan dengan Python

Preparing Video For Download...