DVC ile Veri Sürümlendirmeye Giriş
Ravi Bhadauria
Machine Learning Engineer
stages:
preprocess:
cmd: python3 preprocess.py
params:
- preprocess
deps:
- preprocess.py
- raw_data.csv
outs:
- processed_data.csv
stages:
train_and_evaluate:
cmd: python3 train_and_evaluate.py
params:
- train_and_evaluate
deps:
- processed_data.csv
- train_and_evaluate.py
outs:
- plots.png
- metrics.json
dvc repro ile yeniden üretin$ dvc repro
Aşama 'preprocess' çalıştırılıyor: > python preprocess.pyAşama 'train_and_evaluate' çalıştırılıyor: > python train_and_evaluate.py 'dvc.lock' kilit dosyası güncelleniyor
dvc.lock oluşturulur.dvc dosyasına benzer, MD5 karmalarını yakalar$ git add dvc.lock && git commit -m "first pipeline run"
$ dvc repro
Aşama 'preprocess' değişmedi, atlanıyor
Aşama 'train_and_evaluate' şu komutla çalıştırılıyor: ...

--dry bayrağını kullanın; ardışık düzen çalıştırılmaz$ dvc repro --dry
Aşama 'preprocess' çalıştırılıyor:
> python3 preprocess_dataset.py
Aşama 'train_and_evaluate' çalıştırılıyor:
> python3 train_and_evaluate.py
dvc repro linear/dvc.yamldvc.yaml izinli değildirdvc repro <target_stage>dvc repro -fdvc repro --no-commitdvc commit kullanın
# A2 ve yukarı akış bağımlılıklarını çalıştır
$ dvc repro A2
# B2 ve yukarı akış bağımlılıklarını çalıştır
$ dvc repro B2
$ dvc repro train
Aşama 'A2' değişmedi, atlanıyor
Aşama 'B2' değişmedi, atlanıyor
Aşama 'train' şu komutla çalıştırılıyor: ...
DVC ile Veri Sürümlendirmeye Giriş