Pengantar Versioning Data dengan DVC
Ravi Bhadauria
Machine Learning Engineer
$ dvc push <target>$ dvc pull <target>
$ dvc push data.csv
$ dvc push
$ dvc fetch
-r$ dvc push -r aws_remote data.csv
dvc pull
Fungsi: Mengunduh data remote ke workspace DVC
Use case: Dataset besar atau artefak model
dvc push
Fungsi: Mengunggah data ke penyimpanan remote
Use case: Berbagi atau menyimpan artefak data
git pull
Fungsi: Fetch/Merge dari repo Git remote
Use case: Menyinkronkan branch lokal dengan remote
git push
Fungsi: Mengunggah perubahan lokal ke remote
Use case: Berbagi perubahan ke Git remote
.dvc dilacak oleh Git, bukan DVC
Manfaatkan ini untuk checkout versi spesifik file data
Checkout file .dvc
$ git checkout <commit_hash|tag|branch>
.dvc$ dvc checkout <target>
$ dvc add <target>
.dvc yang berubah ke Git$ git add <target>.dvc
$ git commit <target>.dvc \
-m "Dataset updates"
$ git push origin main
$ dvc push
Pengantar Versioning Data dengan DVC