Tantangan klasifikasi

Supervised Learning dengan scikit-learn

George Boorman

Core Curriculum Manager, DataCamp

Mengklasifikasikan label data baru

  1. Bangun model
  2. Model belajar dari data berlabel yang kita berikan
  3. Masukkan data tanpa label ke model
  4. Model memprediksi label data yang belum terlihat

 

  • Data berlabel = data latih
Supervised Learning dengan scikit-learn

k-Nearest Neighbors

  • Prediksi label suatu titik data dengan

    • Melihat k titik data berlabel terdekat

    • Mengambil suara mayoritas

Supervised Learning dengan scikit-learn

k-Nearest Neighbors

scatter plot dengan titik biru dan merah, serta titik baru berwarna hitam

Supervised Learning dengan scikit-learn

k-Nearest Neighbors

radius di sekitar tiga titik terdekat dari titik hitam

Supervised Learning dengan scikit-learn

k-Nearest Neighbors

radius di sekitar lima titik terdekat dari titik hitam

Supervised Learning dengan scikit-learn

Intuisi KNN

scatterplot biaya malam total vs biaya siang total; titik biru = churn, merah = tidak churn

Supervised Learning dengan scikit-learn

Intuisi KNN

scatterplot churn dengan batas keputusan yang membagi titik menurut prediksi KNN: churn atau tidak

Supervised Learning dengan scikit-learn

Melatih classifier dengan scikit-learn

from sklearn.neighbors import KNeighborsClassifier

X = churn_df[["total_day_charge", "total_eve_charge"]].values y = churn_df["churn"].values
print(X.shape, y.shape)
(3333, 2), (3333,)
knn = KNeighborsClassifier(n_neighbors=15)

knn.fit(X, y)
Supervised Learning dengan scikit-learn

Memprediksi data tanpa label

X_new = np.array([[56.8, 17.5],
                  [24.4, 24.1],
                  [50.1, 10.9]])

print(X_new.shape)
(3, 2)
predictions = knn.predict(X_new)

print('Predictions: {}'.format(predictions))
Predictions: [1 0 0]
Supervised Learning dengan scikit-learn

Ayo berlatih!

Supervised Learning dengan scikit-learn

Preparing Video For Download...