Rekayasa data dan big data

Memahami Rekayasa Data

Hadrien Lacroix

Content Developer at DataCamp

Tentang kursus ini

  • Kursus konseptual
  • Tanpa coding
  • Tujuan
    • Mampu berdiskusi dengan data engineer
    • Landasan kuat untuk belajar lanjut
Memahami Rekayasa Data

Bab 1

Apa itu rekayasa data?

  1. Rekayasa data dan big data
  2. Data engineer vs data scientist
  3. Data pipeline
Memahami Rekayasa Data

Bab 2

Cara kerja penyimpanan data

  1. Data terstruktur vs tidak terstruktur
  2. SQL
  3. Data warehouse dan data lake
Memahami Rekayasa Data

Bab 3

Cara memindahkan dan memroses data

  1. Pemrosesan data
  2. Penjadwalan data
  3. Komputasi paralel
  4. Komputasi awan
Memahami Rekayasa Data

$$

$$

$$

logo spotflix

Memahami Rekayasa Data

Alur kerja data

langkah pertama - pengumpulan dan penyimpanan data

Memahami Rekayasa Data

Alur kerja data

Langkah kedua - Persiapan data

Memahami Rekayasa Data

Alur kerja data

Langkah ketiga - eksplorasi dan visualisasi

Memahami Rekayasa Data

Alur kerja data

eksperimen dan prediksi

Memahami Rekayasa Data

Data engineer

pengumpulan dan penyimpanan data diberi lingkaran

Memahami Rekayasa Data

Data engineer

Data engineer memastikan:

  • data yang tepat
  • dalam format yang tepat
  • ke orang yang tepat
  • seefisien mungkin
Memahami Rekayasa Data

Tanggung jawab data engineer

  • Mengambil data dari berbagai sumber
  • Mengoptimalkan database untuk analisis
  • Menghapus data rusak
  • Mengembangkan, membangun, menguji, dan memelihara arsitektur data
Memahami Rekayasa Data

Data engineer dan big data

  • Big data menjadi standar =>
Memahami Rekayasa Data

Data engineer dan big data

  • Big data menjadi standar => kebutuhan data engineer makin tinggi
  • Big data:
    • Harus memikirkan cara menangani ukurannya
    • Begitu besar hingga metode tradisional tak lagi efektif
Memahami Rekayasa Data

Pertumbuhan big data

  • Sensor dan perangkat
  • Media sosial
  • Data perusahaan
  • VoIP (komunikasi suara, sesi multimedia)

grafik pertumbuhan big data

1 Data Age 2025, Seagate, November 2018
Memahami Rekayasa Data

Lima V

  • Volume (seberapa banyak?)
  • Variety (jenis apa?)
  • Velocity (seberapa cepat?)
  • Veracity (seberapa akurat?)
  • Value (seberapa bermanfaat?)
Memahami Rekayasa Data

Ringkasan

  • Apa yang akan dipelajari
  • Aliran data dalam organisasi
  • Kapan data engineer berperan
  • Tanggung jawab mereka
  • Kaitan rekayasa data dengan big data
Memahami Rekayasa Data

Ayo berlatih!

Memahami Rekayasa Data

Preparing Video For Download...