DVC Uzaklarını Yapılandırma

DVC ile Veri Sürümlendirmeye Giriş

Ravi Bhadauria

Machine Learning Engineer

Gözden Geçirme

  • DVC deposunu başlatma
    • dvc init çalıştırın
    • Depo çalışma alanında (/path/to/my-project)
  • DVC önbelleğini kurma
    • .dvc dizininde geçici aşama alanı
      • /path/to/my-project/.dvc/cache
    • Geçici dosyaları dvc add ile aşamaya alın
  • Şimdi: DVC Uzakları
    • Harici depolama
    • Varlıkları izleyin ve paylaşın
DVC ile Veri Sürümlendirmeye Giriş

DVC Uzaklarına Neden Gerek Var?

  • DVC Uzakları: Veri depolama konumu
  • Git uzaklarına benzer, ancak önbelleğe alınmış veriler için
  • Uzak kullanmanın faydaları
    • Büyük dosya ve dizinleri eşitleyin
    • Depolamayı merkezileştirin veya dağıtın
    • Yerel alan tasarrufu sağlayın

DVC çalışma alanından önbelleğe ve uzağa veri akışının şeması

DVC ile Veri Sürümlendirmeye Giriş

Desteklenen Depolama Türleri

DVC'de desteklenen depolama türleri grafiği

DVC ile Veri Sürümlendirmeye Giriş

Uzakları Ayarlama

  • Uzakları ayarlama

    • dvc remote add <name> <location>
  • S3 bucket

$ dvc remote add s3_remote \
   s3://mys3bucket
  • DVC yapılandırma değişiklikleri
 ['remote "s3_remote"']
     url = s3://mys3bucket
  • GCP bucket
$ dvc remote add gcp_remote \
   gs://myGCPbucket
  • Azure
$ dvc remote add azure_remote \
   azure://mycontainer/path
DVC ile Veri Sürümlendirmeye Giriş

Yerel Uzaklar

  • Yerel uzaklar hızlı prototipleme için kullanılır
  • Sistem dizinleri veya Ağ Bağlantılı Depolama kullanın
$ dvc remote add mylocalremote /tmp/dvc
  • Varsayılan uzakları -d bayrağıyla ayarlayın
$ dvc remote add -d mylocalremote /tmp/dvc
  • Varsayılan uzak, .dvc/config içindeki core bölümünde atanır
[core]
remote = mylocalremote
DVC ile Veri Sürümlendirmeye Giriş

Uzakları Listeleme

  • Uzakları listeleme
$ dvc remote list
s3_remote    s3://mys3bucket
local_remote /tmp/dvcremote
  • .dvc/config dosyasından okur
 ['remote "s3_remote"']
     url = s3://mys3bucket
 ['remote "local_remote"']
     url = /tmp/dvcremote
DVC ile Veri Sürümlendirmeye Giriş

Uzak Yapılandırmasını Değiştirme

  • Özelleştirmeler dvc remote modify ile yapılır
$ dvc remote modify s3_remote connect_timeout 300
  • DVC yapılandırma dosyası değişikliği
 ['remote "s3_remote"']
     url = s3://mys3bucket
     connect_timeout = 300
DVC ile Veri Sürümlendirmeye Giriş

Özet

  • DVC uzakları veri ve ML modellerini paylaşmak için kullanılır
  • Çeşitli yerel ve bulut depolama konumları desteklenir
  • Uzak ekle: dvc remote add
    • Varsayılan için -d bayrağını kullanın
  • Uzakları listele: dvc remote list
  • Uzakları değiştir: dvc remote modify
DVC ile Veri Sürümlendirmeye Giriş

Hadi pratik yapalım!

DVC ile Veri Sürümlendirmeye Giriş

Preparing Video For Download...