Pengantar Versioning Data dengan DVC
Ravi Bhadauria
Machine Learning Engineer
pip $ pip install dvc
$ dvc version
DVC version: 3.40.1 (pip)Platform: Python 3.9.16 on macOS-14.2.1-arm64-arm-64bitConfig: Global: /Users/<username>/Library/Application Support/dvc System: /Library/Application Support/dvcRepo: dvc, git
$ git init
Initialized empty Git repository in /path/to/repo/.git/
$ dvc init
Initialized DVC repository.
You can now commit the changes to git.
$ git status
Changes to be committed:
(use "git rm --cached <file>..." to unstage)
new file: .dvc/.gitignore
new file: .dvc/config
new file: .dvcignore
$ git commit -m "initialized dvc"
Mirip berkas .gitignore
Berguna saat banyak data tidak perlu dilacak
# .dvcignore # Abaikan semua berkas di direktori 'data' data/*# Tapi jangan abaikan 'data/data.csv' !data/data.csv# Abaikan semua berkas .tmp *.tmp
dvc check-ignore$ dvc check-ignore data/file.txt
data/file.txt
-d untuk detail$ dvc check-ignore -d data/file.txt
.dvcignore:3:data/* data/file.txt
pip install dvcdvc versiondvc init.dvcignore untuk mengecualikan berkas.gitignore, sintaks samadvc check-ignore <filename>Pengantar Versioning Data dengan DVC