Introductie tot dataversiebeheer met DVC
Ravi Bhadauria
Machine Learning Engineer
pip $ pip install dvc
$ dvc version
DVC versie: 3.40.1 (pip)Platform: Python 3.9.16 op macOS-14.2.1-arm64-arm-64bitConfig: Globaal: /Users/<username>/Library/Application Support/dvc Systeem: /Library/Application Support/dvcRepo: dvc, git
$ git init
Initialized empty Git repository in /path/to/repo/.git/
$ dvc init
Initialized DVC repository.
You can now commit the changes to git.
$ git status
Changes to be committed:
(use "git rm --cached <file>..." to unstage)
new file: .dvc/.gitignore
new file: .dvc/config
new file: .dvcignore
$ git commit -m "initialized dvc"
Vergelijkbaar met .gitignore
Handig bij veel data die je niet nodig hebt
# .dvcignore # Negeer alle bestanden in de map 'data' data/*# Maar negeer 'data/data.csv' niet !data/data.csv# Negeer alle .tmp-bestanden *.tmp
dvc check-ignore$ dvc check-ignore data/file.txt
data/file.txt
-d voor details$ dvc check-ignore -d data/file.txt
.dvcignore:3:data/* data/file.txt
pip install dvcdvc versiondvc init.dvcignore specificeert uit te sluiten bestanden.gitignore, zelfde syntaxdvc check-ignore <filename>Introductie tot dataversiebeheer met DVC