Introductie tot dataversiebeheer met DVC
Ravi Bhadauria
Machine Learning Engineer
$ dvc push <target>$ dvc pull <target>
$ dvc push data.csv
$ dvc push
$ dvc fetch
-r$ dvc push -r aws_remote data.csv
dvc pull
Functie: downloadt remote data naar de DVC‑workspace
Gebruik: grote datasets of model‑artefacten
dvc push
Functie: uploadt data naar de remote opslag
Gebruik: data‑artefacten delen of opslaan
git pull
Functie: haalt binnen/merget van de remote Git‑repo
Gebruik: lokale branch in sync met remote
git push
Functie: uploadt lokale wijzigingen naar de remote
Gebruik: wijzigingen delen naar Git‑remote
.dvc wordt door Git getrackt, niet door DVC
Gebruik dit om een specifieke versie van een databestand te checkouten
Checkout het .dvc‑bestand
$ git checkout <commit_hash|tag|branch>
.dvc‑bestand$ dvc checkout <target>
$ dvc add <target>
.dvc‑bestand naar Git$ git add <target>.dvc
$ git commit <target>.dvc \
-m "Dataset updates"
$ git push origin main
$ dvc push
Introductie tot dataversiebeheer met DVC