DVC ile Veri Sürümlendirmeye Giriş
Ravi Bhadauria
Machine Learning Engineer
Makine Öğrenimi iş akışını ve bağımlılıklarını tanımlayan aşama dizisi
dvc.yaml dosyasında tanımlıdır
deps)params)cmd)outs)metrics ve plotsdvc stage add ile aşamalar oluşturundvc stage add \
-n preprocess \
-p params.yaml:preprocess \
-d raw_data.csv \
-d preprocess.py \
-o processed_data.csv \
python3 preprocess.py
stages:
preprocess:
cmd: python3 preprocess.py
params:
# Keys from params.yaml
- params.yaml
- preprocess
deps:
- preprocess.py
- raw_data.csv
outs:
- processed_data.csv
dvc stage add \
-n train_and_evaluate \
-p train_and_evaluate \
-d train_and_evaluate.py \
-d processed_data.csv \
-o plots.png \
-o metrics.json \
python3 train_and_evaluate.py
stages:
train_and_evaluate:
cmd: python3 train_and_evaluate.py
params:
# Skip specifying parameter file
# Defaulted to params.yaml
- train_and_evaluate
deps:
- processed_data.csv
- train_and_evaluate.py
outs:
- plots.png
- metrics.json
dvc stage add komutunu birden çok kez çalıştırmaERROR: Stage 'train_and_evaluate'
zaten 'dvc.yaml' içinde mevcut.
Üzerine yazmak için '--force' kullanın.
dvc stage add --force kullanındvc stage add --force \
-n train_and_evaluate \
-p train_and_evaluate \
-d train_and_evaluate.py \
-d processed_data.csv \
-o plots.png \
-o metrics.json \
python3 train_and_evaluate.py
# DAG'ı terminalde yazdır
dvc dag
# Belirli bir adıma kadar DAG'ı göster
dvc dag <target>
+------------+
| preprocess |
+------------+
*
*
*
+--------------------+
| train_and_evaluate |
+--------------------+
# Adım çıktılarını düğüm olarak göster
dvc dag --outs
+-------------------------------+
| processed_dataset/weather.csv |
+-------------------------------+
*** ***
*** ***
** **
+--------------+ +-----------+
| metrics.json | | plots.png |
+--------------+ +-----------+
dvc dag --dot
strict digraph {
"preprocess";
"train_and_evaluate";
"preprocess" -> "train_and_evaluate";
}

DVC ile Veri Sürümlendirmeye Giriş