Analisis Data Eksploratori di Power BI
Jacob H. Marquez
Data Scientist at Microsoft
Definisi: sekumpulan semua nilai yang mungkin dari variabel dan frekuensi terkait.
Kontinu
| Usia | Frekuensi |
|---|---|
| 18 | 7 |
| 19 | 11 |
| 20 | 13 |
| 21 | 19 |
| 22 | 12 |
Kontinu
| Usia | Frekuensi |
|---|---|
| 18 | 7 |
| 19 | 11 |
| 20 | 13 |
| 21 | 19 |
| 22 | 12 |
Kategorikal
| Warna Rambut | Frekuensi |
|---|---|
| Pirang | 30 |
| Cokelat | 50 |
| Hitam | 40 |
| Merah | 20 |
| Abu-abu | 20 |

Histogram dengan 100 bin

Histogram dengan 20 bin


Distribusi normal

Distribusi menceng ke kanan
Simpangan baku lebih besar

Simpangan baku lebih kecil





Menggunakan simpangan baku
$lower = -3 * SD$
$upper = 3 * SD$
$$
Pencilan jika
$value < lower$ ATAU $value > upper$
Rentang antar kuartil (IQR)
$lower = 25percentile-(1.5 * IQR)$
$upper = 75percentile+(1.5 * IQR)$
$$
Pencilan jika
$value < lower$ ATAU $value > upper$
Winsorizing
JIKA value < persentil ke-5 MAKA value = persentil ke-5
$$
JIKA value > persentil ke-95 MAKA value = persentil ke-95
Analisis Data Eksploratori di Power BI