Menyusun hipotesis

Analisis Data Eksploratif di Python

George Boorman

Curriculum Manager, DataCamp

Apa yang kita ketahui?

Countplot jumlah penerbangan per maskapai di berbagai kategori harga; Jet Airways paling banyak untuk First Class

Analisis Data Eksploratif di Python

Apa yang kita ketahui?

sns.heatmap(planes.corr(numeric_only=True), annot=True)
plt.show()

Heatmap koefisien korelasi Pearson antar variabel pada dataset planes

Analisis Data Eksploratif di Python

Korelasi semu

sns.scatterplot(data=planes, x="Duration", y="Price", hue="Total_Stops")
plt.show()

Scatter plot Harga versus Durasi, dengan Total Stops

Analisis Data Eksploratif di Python

Bagaimana kita tahu?

Heatmap dengan skor koefisien korelasi untuk tiap jumlah pemberhentian

Analisis Data Eksploratif di Python

Mana yang benar?

Mesin tik menampilkan "Fake News"

  • Apakah data dari waktu lain memberi hasil yang sama?

  • Untuk mendeteksi hubungan, perbedaan, pola:

    • Kita gunakan Uji Hipotesis
  • Uji hipotesis memerlukan, sebelum pengumpulan data:

    • Menyusun hipotesis atau pertanyaan
    • Keputusan uji statistik yang dipakai
1 Kredit gambar: https://unsplash.com/@markuswinkler
Analisis Data Eksploratif di Python

Data snooping

 

kantor dengan pemandangan landasan bandara

Kaca pembesar melihat diagram batang

Analisis Data Eksploratif di Python

Menyusun hipotesis

sns.barplot(data=planes, x="Airline", y="Duration")
plt.show()

Plot batang durasi versus maskapai

Analisis Data Eksploratif di Python

Menyusun hipotesis

sns.barplot(data=planes, x="Destination", y="Price")
plt.show()

Plot batang menunjukkan rata-rata harga

Analisis Data Eksploratif di Python

Langkah berikutnya

  • Rancang eksperimen

  • Meliputi langkah-langkah:

    • Memilih sampel
    • Menghitung jumlah data yang dibutuhkan
    • Menentukan uji statistik yang digunakan
Analisis Data Eksploratif di Python

Ayo berlatih!

Analisis Data Eksploratif di Python

Preparing Video For Download...