Aykırı değerlere dayanıklı özellik ölçekleme

Python ile Anomali Tespiti

Bekhruz (Bex) Tuychiev

Kaggle Master, Data Science Content Creator

Öklid uzaklığı

A = np.array([9, 1, 6])
B = np.array([25, 44, 85])


diffs = (B - A) ** 2
dist_AB = np.sqrt(np.sum(diffs)) print(dist_AB)
91.35644476444998

Öklid uzaklığını hesaplama formülü ve bunu görselleştiren bir çizim.

Python ile Anomali Tespiti

SciPy'de Öklid

from scipy.spatial.distance import \
euclidean

dist_AB = euclidean(A, B)
dist_AB
91.35644476444998

Öklid uzaklığını hesaplama formülü ve bunu görselleştiren bir çizim.

Python ile Anomali Tespiti

Standardizasyon

  • Ortalama çıkarılır, STD'ye bölünür
  • Sonuç: sıfır ortalama ve 1 STD
Python ile Anomali Tespiti

StandardScaler

from sklearn.preprocessing import StandardScaler

ss = StandardScaler()

# Özellik ve hedefi çıkar X = males.drop("weightkg", axis=1) y = males[['weightkg']]
# Fit et ss.fit(X)
Python ile Anomali Tespiti

Dönüştürme

X_transformed = ss.transform(X)

X_transformed[:5]
array([[-1.05174523],
       [-0.29289108],
       [ 1.3446363 ],
       [-1.21654894],
       [0.056451235]])
Python ile Anomali Tespiti

fit_transform

ss = StandardScaler()

X_transformed = ss.fit_transform(X)
Python ile Anomali Tespiti

QuantileTransformer

from sklearn.preprocessing import QuantileTransformer


# Başlat qt = QuantileTransformer() X = males.drop("weightkg", axis=1) y = males[['weightkg']]
X_transformed = qt.fit_transform(X) X_transformed.shape
(4082, 94)
Python ile Anomali Tespiti

Sütun adlarını koruma

qt = QuantileTransformer()

X.loc[:, :] = qt.fit_transform(X)

X.head()

Ansur Males vücut ölçümleri veri setinin dönüştürülmüş sürümünden ilk beş satır.

Python ile Anomali Tespiti

Uniform histogram

plt.hist(X['footlength'], color='red')

plt.xlabel("Ayak uzunluğu")
plt.title("Ayak uzunluğu histogramı")

plt.show()

Tekdüze dağılım gösteren ayak uzunluğu sütununun histogramı

Python ile Anomali Tespiti

Normal histogram

qt = QuantileTransformer(
  output_distribution='normal')

# Geçersiz kılınan özellik dizisini yeniden oluştur
X = males.drop("weightkg", axis=1)
X.loc[:, :] = qt.fit_transform(X)

plt.hist(X['footlength'], color='r')
plt.xlabel("Ayak uzunluğu")
plt.title("Ayak uzunluğu histogramı")

plt.show()

Normale yakın dağılım gösteren ayak uzunluğu sütununun histogramı

Python ile Anomali Tespiti

Hadi pratik yapalım!

Python ile Anomali Tespiti

Preparing Video For Download...