Programmazione parallela con Dask in Python
James Fulton
Climate Informatics Researcher
import dask_ml



# Importa il modello di regressione
from sklearn.linear_model import SGDRegressor
# Crea un'istanza del modello
model = SGDRegressor()
# Esegui il fit sui dati
model.fit(X, y)
# Genera predizioni
y_pred = model.predict(X)
# Importa il modello di regressione from sklearn.linear_model import SGDRegressor # Crea un'istanza del modello model = SGDRegressor()# Importa il wrapper Dask-ML per il modello from dask_ml.wrappers import Incremental# Wrappa il modello dask_model = Incremental(model, scoring='neg_mean_squared_error')# Esegui il fit su DataFrame o array Dask dask_model.fit(dask_X, dask_y) # non lazy

# Esegui più passaggi sui dati
for i in range(10):
dask_model.partial_fit(dask_X, dask_y) # non lazy
y_pred = dask_model.predict(dask_X)
print(y_pred)
dask.array<_predict, shape=(nan,), dtype=int64, chunksize=(nan,), chunktype=...>
print(y_pred.compute())
array([0.465557, 0.905675, 0.285214, ..., 0.249454, 0.559624, 0.823475])
Programmazione parallela con Dask in Python