Yenilik (novelty) tespiti

Python'da Machine Learning İş Akışları Tasarlama

Dr. Chris Anagnostopoulos

Honorary Associate Professor

Tek-sınıf sınıflandırma

Anomalisi olmayan eğitim verisi:

İki siyah nokta kümesi.

Anomalili gelecek/test verisi:

Bazı izole noktalarla iki siyah nokta kümesi.

Python'da Machine Learning İş Akışları Tasarlama

Novelty LoF

Geçici çözüm

preds = lof().fit_predict(
   np.concatenate([X_train, X_test]))

preds = preds[X_train.shape[0]:]

Bazı izole kırmızı noktalarla iki siyah nokta kümesi.

Novelty LoF

clf = lof(novelty=True)

clf.fit(X_train) y_pred = clf.predict(X_test)

Bazı izole kırmızı noktalarla iki siyah nokta kümesi.

Python'da Machine Learning İş Akışları Tasarlama

Tek-sınıf Destek Vektör Makineleri

clf = OneClassSVM()

clf.fit(X_train) y_pred = clf.predict(X_test)
y_pred[:4]
array([ 1,  1,  1, -1])

Bazı izole noktalarla iki nokta kümesi. Çoğu nokta kırmızı; kümelerin içindekiler ve izoleler.

Python'da Machine Learning İş Akışları Tasarlama

Tek-sınıf Destek Vektör Makineleri

clf = OneClassSVM()
clf.fit(X_train)
y_scores = clf.score_samples(X_test)

threshold = np.quantile(y_scores, 0.1)
y_pred = y_scores <= threshold

Bazı izole kırmızı noktalarla iki siyah nokta kümesi.

Python'da Machine Learning İş Akışları Tasarlama

Isolation Forests

clf = IsolationForest()
clf.fit(X_train)
y_scores = clf.score_samples(X_test)
clf = LocalOutlierFactor(novelty=True)
clf.fit(X_train)
y_scores = clf.score_samples(X_test)

Bazı izole kırmızı noktalarla iki siyah nokta kümesi.

Python'da Machine Learning İş Akışları Tasarlama
clf_lof = LocalOutlierFactor(novelty=True).fit(X_train)
clf_isf = IsolationForest().fit(X_train)
clf_svm = OneClassSVM().fit(X_train)
roc_auc_score(y_test, clf_lof.score_samples(X_test)
0.9897
roc_auc_score(y_test, clf_isf.score_samples(X_test))
0.9692
roc_auc_score(y_test, clf_svm.score_samples(X_test))
0.9948
Python'da Machine Learning İş Akışları Tasarlama
clf_lof = LocalOutlierFactor(novelty=True).fit(X_train)
clf_isf = IsolationForest().fit(X_train)
clf_svm = OneClassSVM().fit(X_train)
accuracy_score(y_test, clf_lof.predict(X_test))
0.9318
accuracy_score(y_test, clf_isf.predict(X_test))
0.9545
accuracy_score(y_test, clf_svm.predict(X_test))
0.5
Python'da Machine Learning İş Akışları Tasarlama

Ne yeni?

Python'da Machine Learning İş Akışları Tasarlama

Preparing Video For Download...