DVC ile Veri Sürümlendirmeye Giriş
Ravi Bhadauria
Machine Learning Engineer
Tekrarlanabilir: farklı ortam ve zamanlarda aynı çıktıları üretir
Modüler: ayrı, bağımsız ve test edilebilir modüller halinde yazılır
Tutarlı: tüm parametreler için tek doğru kaynak

Dosyalar desteklenen biçimde olmalıdır
params.yamlYAML ile çalışacağız
.yaml veya .ymlParametreleri sözlükler olarak belirtin
: ile ayrılırYorumlar # ile başlar
Veri tipleri:
Veri yapıları:
Girinti önemlidir
# Anahtar-değer çiftleri
a: 1
b: 1.2
c: "String value"
# Diziler
a: [1, 2.2, 3, 4.8]
b:
- 5
- "String value"
# İç içe sözlükler
a:
b: "Some value"
c: "Some other value"
# Veri ön işleme parametreleri preprocess: ... target_column: RainTomorrow categorical_features: - Location - WindGustDir - ...# Model eğitimi/değerlendirme parametreleri train_and_evaluate: rfc_params: n_estimators: 2 ...
# model.py içinde
def evaluate_model(model, X_test, y_test):
"""Bir modeli test setinde değerlendirip metrikleri döndürür."""
y_pred = model.predict(X_test)
precision = precision_score(y_test, y_pred)
...
return { "accuracy": accuracy, "precision": precision,
"recall": recall, "f1_score": f1 }
# Giriş noktası kodunda (train_and_evaluate.py)
from model import evaluate_model
metrics = evaluate_model(model, X_test, y_test)

DVC ile Veri Sürümlendirmeye Giriş