Power BI ile Keşifsel Veri Analizi
Jacob H. Marquez
Data Scientist at Microsoft
Tanım: değişkenin tüm olası değerleri ve bunların sıklıkları kümesi.
Sürekli
| Yaş | Frekans |
|---|---|
| 18 | 7 |
| 19 | 11 |
| 20 | 13 |
| 21 | 19 |
| 22 | 12 |
Sürekli
| Yaş | Frekans |
|---|---|
| 18 | 7 |
| 19 | 11 |
| 20 | 13 |
| 21 | 19 |
| 22 | 12 |
Kategorik
| Saç Rengi | Frekans |
|---|---|
| Sarı | 30 |
| Kahverengi | 50 |
| Siyah | 40 |
| Kızıl | 20 |
| Gri | 20 |

100 bölmeli histogram

20 bölmeli histogram


Normal dağılım

Sağa çarpık dağılım
Daha büyük standart sapma

Daha küçük standart sapma





Standart sapma ile
$lower = -3 * SD$
$upper = 3 * SD$
$$
Aykırı değer durumu
$value < lower$ VEYA $value > upper$
Çeyrekler Arası Aralık (IQR)
$lower = 25percentile-(1.5 * IQR)$
$upper = 75percentile+(1.5 * IQR)$
$$
Aykırı değer durumu
$value < lower$ VEYA $value > upper$
Winsorizasyon
EĞER value < 5th percentile İSE value = 5th percentile
$$
EĞER value > 95th percentile İSE value = 95th percentile
Power BI ile Keşifsel Veri Analizi