Apprendimento non supervisionato: basi

Analisi di cluster in Python

Shaumik Daityari

Business Analyst

Esempio quotidiano: Google News

  • Come classifica gli articoli Google News?
  • Algoritmo di apprendimento non supervisionato: clustering
  • Confronta i termini frequenti negli articoli per trovare somiglianze

Analisi di cluster in Python

Dati etichettati e non etichettati

Dati senza etichette

  • Punto 1: (1, 2)
  • Punto 2: (2, 2)
  • Punto 3: (3, 1)

Dati con etichette

  • Punto 1: (1, 2), Etichetta: Zona pericolosa
  • Punto 2: (2, 2), Etichetta: Zona normale
  • Punto 3: (3, 1), Etichetta: Zona normale
Analisi di cluster in Python

Cos'è l'apprendimento non supervisionato?

  • Gruppo di algoritmi ML che trovano pattern nei dati
  • I dati non sono etichettati, classificati o caratterizzati
  • Obiettivo: interpretare qualsiasi struttura nei dati
  • Algoritmi comuni: clustering, reti neurali, rilevamento anomalie
Analisi di cluster in Python

Cos'è il clustering?

  • Processo di raggruppare elementi con caratteristiche simili
  • Elementi in un gruppo più simili tra loro che ad altri gruppi
  • Esempio: distanza tra punti in un piano 2D
Analisi di cluster in Python

Grafico dei dati per il clustering - Avvistamenti di Pokémon

from matplotlib import pyplot as plt
x_coordinates = [80, 93, 86, 98, 86, 9, 15, 3, 10, 20, 44, 56, 49, 62, 44]
y_coordinates = [87, 96, 95, 92, 92, 57, 49, 47, 59, 55, 25, 2, 10, 24, 10]
plt.scatter(x_coordinates, y_coordinates)
plt.show()
Analisi di cluster in Python

Analisi di cluster in Python

Analisi di cluster in Python

In arrivo: un po' di pratica

Analisi di cluster in Python

Preparing Video For Download...