Sviluppa una pipeline di machine learning

Analizzare i dati IoT in Python

Matthias Voppichler

IT Developer

Pipeline

  • Trasformazioni
    • Conversazioni
    • Scaling
  • Stimatore
    • Modello
Analizzare i dati IoT in Python

Crea una pipeline

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

# Inizializza gli oggetti sc = StandardScaler() logreg = LogisticRegression()
# Crea la pipeline pl = Pipeline([ ("scale", sc), ("logreg", logreg) ])
Analizzare i dati IoT in Python

Ispeziona la pipeline

pl
Pipeline(memory=None,
         steps=[('scale', StandardScaler(copy=True, with_mean=True, with_std=True)), 
                ('logreg', <class 'sklearn.linear_model.logistic.LogisticRegression'>)])
pl.fit(X_train, y_train)

print(pl.predict(X_test))
[0 0 1 1 0 1 1 0 0]
Analizzare i dati IoT in Python

Salva il modello

import pickle

with Path("pipeline_model.pkl").open("bw") as f: pickle.dump(pl, f)
Analizzare i dati IoT in Python

Carica il modello

import pickle
with Path("pipeline_model.pkl").open('br') as f:
    pl = pickle.load(f)

pl
Pipeline(memory=None,
     steps=[('scale', StandardScaler(copy=True, with_mean=True, with_std=True)), 
             ('logreg', LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
          intercept_scaling=1, max_iter=100, multi_class='warn', n_jobs=None, penalty='l2', 
          random_state=None, solver='warn', tol=0.0001, verbose=0, warm_start=False))])

Una nota di cautela

NON deserializzare file non affidabili: può eseguire codice dannoso.

Analizzare i dati IoT in Python

Passiamo alla pratica!

Analizzare i dati IoT in Python

Preparing Video For Download...