Apa itu statistika?

Pengantar Statistika di Python

Maggie Matsui

Content Developer, DataCamp

Apa itu statistika?

  • Bidang statistika - praktik dan kajian pengumpulan serta analisis data

  • Statistik ringkasan - fakta atau ringkasan tentang suatu data

Pengantar Statistika di Python

Apa yang dapat dilakukan statistika?

Apa itu statistika?

  • Bidang statistika - praktik dan kajian pengumpulan serta analisis data

  • Statistik ringkasan - fakta atau ringkasan tentang suatu data

Apa yang dapat dilakukan statistika?

  • Seberapa besar kemungkinan seseorang membeli produk? Apakah peluangnya naik jika tersedia metode pembayaran lain?
  • Berapa okupansi hotel Anda? Bagaimana cara mengoptimalkannya?
  • Berapa banyak ukuran jeans yang perlu dibuat agar pas untuk 95% populasi? Apakah jumlah tiap ukuran harus sama?
  • Uji A/B: Iklan mana yang lebih efektif mendorong pembelian?
Pengantar Statistika di Python

Apa yang tidak bisa dilakukan statistika?

  • Mengapa Game of Thrones begitu populer?

Sebagai gantinya...

  • Apakah serial dengan lebih banyak adegan kekerasan ditonton lebih banyak orang?

Namun...

  • Ini tetap tidak bisa memastikan apakah lebih banyak adegan kekerasan menyebabkan lebih banyak penonton
Pengantar Statistika di Python

Jenis statistika

Statistika deskriptif

  • Menggambarkan dan meringkas data

2 mobil, 1 bus, 1 sepeda

  • 50% teman naik mobil ke kantor
  • 25% naik bus
  • 25% bersepeda

Statistika inferensial

  • Gunakan sampel data untuk membuat inferensi tentang populasi yang lebih besar

2 mobil, 1 bus, 1 sepeda dikelilingi lebih banyak mobil, bus, dan sepeda

Berapa persen orang naik mobil ke kantor?

Pengantar Statistika di Python

Jenis data

Numerik (Kuantitatif)

  • Kontinu (Diukur)
    • Kecepatan pesawat
    • Waktu menunggu dalam antrean
  • Diskret (Dihitung)
    • Jumlah hewan peliharaan
    • Jumlah paket yang dikirim

Kategorikal (Kualitatif)

  • Nominal (Tidak berurutan)
    • Menikah/belum menikah
    • Negara tempat tinggal
  • Ordinal (Berurutan)

sangat tidak setuju/agak tidak setuju/netral/agak setuju/sangat setuju

Pengantar Statistika di Python

Data kategorikal dapat direpresentasikan sebagai angka

Nominal (Tidak berurutan)

  • Menikah/belum menikah (1/0)
  • Negara tempat tinggal (1, 2, ...)

Ordinal (Berurutan)

  • Sangat tidak setuju (1)
  • Agak tidak setuju (2)
  • Netral (3)
  • Agak setuju (4)
  • Sangat setuju (5)
Pengantar Statistika di Python

Mengapa tipe data penting?

Statistik ringkasan
import numpy as np
np.mean(car_speeds['speed_mph'])
40.09062
Plot

scatterplot kecepatan mobil vs berat mobil

Pengantar Statistika di Python

Mengapa tipe data penting?

Statistik ringkasan
demographics['marriage_status'].value_counts()
single      188
married     143
divorced    124
dtype: int64
Plot

diagram batang jumlah status pernikahan

Pengantar Statistika di Python

Ayo berlatih!

Pengantar Statistika di Python

Preparing Video For Download...