DVC Kurulumu ve Başlatma

DVC ile Veri Sürümlendirmeye Giriş

Ravi Bhadauria

Machine Learning Engineer

Kurulum

  • DVC bir Python paketidir
    • pip ile evrensel kurulum
$ pip install dvc
  • Sanal ortamda kurmayı unutmayın
  • Git'in kurulu olduğundan emin olun
DVC ile Veri Sürümlendirmeye Giriş

Kurulumu Doğrulama

$ dvc version
DVC version: 3.40.1 (pip)

Platform: Python 3.9.16 on macOS-14.2.1-arm64-arm-64bit
Config: Global: /Users/<username>/Library/Application Support/dvc System: /Library/Application Support/dvc
Repo: dvc, git
1 https://dvc.org/doc/command-reference/version
DVC ile Veri Sürümlendirmeye Giriş

DVC'yi Başlatma

  • Git'in başlatıldığından emin olun
$ git init
Initialized empty Git repository in /path/to/repo/.git/
  • Depoda DVC'yi başlatın
$ dvc init
Initialized DVC repository.

You can now commit the changes to git.
1 https://dvc.org/doc/command-reference/init
DVC ile Veri Sürümlendirmeye Giriş

DVC Gizli Dosyaları

  • Başlatma, Git ile izlenmesi gereken dahili dosyalar oluşturur
$ git status
Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
    new file:   .dvc/.gitignore
    new file:   .dvc/config
    new file:   .dvcignore
  • Değişiklikleri commit edin
$ git commit -m "initialized dvc"
DVC ile Veri Sürümlendirmeye Giriş

.dvcignore Dosyası

  • .gitignore dosyasına benzer

    • Aynı deseni izler
    • DVC'nin yok sayacağı dosya/dizinleri belirtir
  • Gerekli olmayan çok sayıda veri dosyası izlenirken faydalı

    • DVC işlemlerinin süresini kısaltır
1 https://dvc.org/doc/user-guide/project-structure/dvcignore-files 2 https://git-scm.com/docs/gitignore
DVC ile Veri Sürümlendirmeye Giriş

Örnek

# .dvcignore
# 'data' dizinindeki tüm dosyaları yok say
data/*

# Ancak 'data/data.csv' dosyasını yok sayma !data/data.csv
# Tüm .tmp dosyalarını yok say *.tmp
1 https://dvc.org/doc/user-guide/project-structure/dvcignore-files
DVC ile Veri Sürümlendirmeye Giriş

Yok Sayılan Dosyaları Kontrol Etme

  • dvc check-ignore komutunu kullanın
$ dvc check-ignore data/file.txt
data/file.txt
  • Ayrıntılar için -d bayrağıyla kullanın
$ dvc check-ignore -d data/file.txt
.dvcignore:3:data/*    data/file.txt
1 https://dvc.org/doc/command-reference/check-ignore
DVC ile Veri Sürümlendirmeye Giriş

Özet

  • DVC'yi pip install dvc ile kurun
  • DVC sürümünü, platformu vb. doğrulayın
    • dvc version
  • Çalışma alanında DVC'yi başlatma
    • dvc init
    • Önce Git'i başlatın
  • Hariç tutulan dosyaları belirtmek için .dvcignore kullanılır
    • .gitignore ile benzer, aynı söz dizimi
    • Belirli bir dosyanın hariç olup olmadığını kontrol edin
      • dvc check-ignore <filename>
DVC ile Veri Sürümlendirmeye Giriş

Ayo berlatih!

DVC ile Veri Sürümlendirmeye Giriş

Preparing Video For Download...