Unsupervised Learning in Python
Benjamin Wilson
Director of Research at lateral.io

PCA(n_components=2)samples = Array mit Iris-Messungen (vier Merkmale)species = Liste der Iris-Artennummernfrom sklearn.decomposition import PCApca = PCA(n_components=2)pca.fit(samples)
PCA(n_components=2)
transformed = pca.transform(samples)
print(transformed.shape)
(150, 2)
import matplotlib.pyplot as plt
xs = transformed[:,0]
ys = transformed[:,1]
plt.scatter(xs, ys, c=species)
plt.show()


scipy.sparse.csr_matrix anstelle von NumPy-Arrays verwenden.csr_matrix merkt sich nur die Einträge, die nicht Null sind (spart Speicherplatz!)
PCA unterstützt csr_matrix nicht.TruncatedSVD aus scikit-learn.from sklearn.decomposition import TruncatedSVD
model = TruncatedSVD(n_components=3)
model.fit(documents) # documents is csr_matrix
transformed = model.transform(documents)
Unsupervised Learning in Python