Menghitung koefisien korelasi

Pengantar Python di Power BI

Jacob H. Marquez

Data Scientist

Apa itu koefisien korelasi?

Definisi: ukuran numerik dari jenis hubungan statistik antara dua variabel

Rentang: -1 hingga 1

Rentang

-1:

  • hubungan kuat, negatif
  • kenaikan variabel A terkait dengan penurunan variabel B

1:

  • hubungan kuat, positif
  • kenaikan variabel A terkait dengan kenaikan variabel B

0: tidak ada hubungan

Pengantar Python di Power BI

Contoh koefisien korelasi #1

Plot sebar dengan dua variabel ber-korelasi 0,8.

Pengantar Python di Power BI

Contoh koefisien korelasi #2

Plot sebar dengan dua variabel ber-korelasi -0,8.

Pengantar Python di Power BI

Contoh koefisien korelasi #3

Plot sebar dengan dua variabel ber-korelasi 0.

Pengantar Python di Power BI

Matriks korelasi

Tabel dengan variabel dataset sebagai baris dan kolom. Sel berisi koefisien korelasi antara dua variabel.

Pengantar Python di Power BI

Matriks korelasi

Tabel dengan variabel dataset sebagai baris dan kolom. Sel berisi koefisien korelasi antara dua variabel. Baris untuk Income disorot.

Pengantar Python di Power BI

Matriks korelasi

Tabel dengan variabel dataset sebagai baris dan kolom. Sel berisi koefisien korelasi antara dua variabel. Korelasi untuk Income vs. MntWines disorot.

Pengantar Python di Power BI

Heatmap korelasi

import seaborn as sns

corrMatrix = dataset.corr()

sns.heatmap(
    corrMatrix, 
    annot=True
    )

Contoh heatmap

Pengantar Python di Power BI

Contoh heatmap korelasi

Contoh heatmap

Pengantar Python di Power BI

Contoh heatmap korelasi

Contoh heatmap

Pengantar Python di Power BI

Korelasi bukan kausalitas

  • Hubungan korelatif kuat <> Bukan berarti sebab-akibat

  • Hubungan kausal biasanya butuh eksperimen

Kualitas musik rock vs produksi minyak AS

Pengantar Python di Power BI

Ayo berlatih!

Pengantar Python di Power BI

Preparing Video For Download...