DVC'ye Giriş

DVC ile Veri Sürümlendirmeye Giriş

Ravi Bhadauria

Machine Learning Engineer

Sürüm Kontrolü olarak Git

  • Kod sürüm kontrol sistemi
  • Bağımsız yerel geliştirme
    • Dallanma ve birleştirme
    • Sürüm geçmişi yönetimi
  • İşbirliğini mümkün kılar

Git'in merkezi olmayan modelinin şeması

DVC ile Veri Sürümlendirmeye Giriş

Sürüm Kontrolü olarak Git

  • CLI tabanlı etkileşim
  • Terminalde (shell) çalışır
  • Git, bir depo ile içerikleri izler
    • İzlenecek gerçek dosya/klasörler
    • Git metaverisi (.git klasöründe)

Git depo yapısının görseli

DVC ile Veri Sürümlendirmeye Giriş

Data Version Control (DVC)

  • DVC: Veri Sürüm Kontrol aracı
    • Verileri ve deneyleri yönetir
    • Git'e benzer

Git ve DVC ile verilerin sürümlenmesi kavram görseli.png

  • Git metaveriyi izler, DVC veri sürümlemesini yapar
DVC ile Veri Sürümlendirmeye Giriş

Git ve DVC CLI

Git

  • Çalışma klasöründe depo başlatın
$ git init
  • Dosyaları depoya ekleyin (sahneleme)
$ git add code.py
  • Değişiklikleri (sürüm geçmişine) işleyin
$ git commit -m "adding first file"

DVC

  • Çalışma klasöründe DVC deposu başlatın
$ dvc init
  • Veri dosyalarını DVC'ye ekleyin
$ dvc add data/mydata.csv
  • İzlenen tüm veri dosyalarını güncelleyin
$ dvc commit
DVC ile Veri Sürümlendirmeye Giriş

Git ve DVC CLI

Git

  • Değişiklikleri uzak sunucuya gönderin
$ git push
  • Uzak depodan değişiklikleri alın
$ git pull
  • Uzak depodan (Github) mevcut bir depoyu klonlayın
$ git clone \
https://github.com/username/repository-name.git

DVC

  • Veri değişikliklerini uzak veri sunucusuna gönderin
$ dvc push
  • DVC projenizi senkronize edin
$ dvc pull
  • DVC ile izlenen bir dosya/dizini indirin
$ dvc get \
https://github.com/username/repo-name model.pkl
DVC ile Veri Sürümlendirmeye Giriş

Hadi pratik yapalım!

DVC ile Veri Sürümlendirmeye Giriş

Preparing Video For Download...