Tebrikler!

DVC ile Veri Sürümlendirmeye Giriş

Ravi Bhadauria

Machine Learning Engineer

Veri sürümlendirme ve DVC

  • Makine Öğrenimi Modelinin Anatomisi
    • Kod, veri ve hiperparametreler modeli kesin biçimde tanımlar
    • Üçü de izlenmeli ve sürümlenmelidir
  • Git ve DVC
    • Kod takibi için Git, veri takibi için DVC
    • Git, verinin kendisi hakkında meta veriyi izler
  • DVC ile yapabileceklerimiz
    • Verileri ve modelleri sürümlendirmek
    • Tekrarlanabilir deney boru hatları çalıştırmak
    • Metrik ve grafik değişimlerini izlemek
DVC ile Veri Sürümlendirmeye Giriş

DVC kurulum, önbellek ve uzaklar

  • Kurulum
    • pip install dvc ile yükleyin
    • dvc init ile başlatın
    • İzlenecek dosya kalıplarını .dvcignore ile yönetin
  • Önbellek
    • dvc add ile dosya ekleyin
    • .dvc dosyalarıyla meta veriyi izleyin
    • dvc remove ile kaldırın, dvc gc ile temizleyin
  • Uzaklar
    • dvc remote add ile yapılandırın, dvc remote list ile listeleyin
    • dvc push ve dvc pull ile veriyi yükleyin/indirin
DVC ile Veri Sürümlendirmeye Giriş

DVC boru hatları

  • dvc.yaml dosyasının anatomisi

    • Aşamaları eklemek için dvc stage add kullanın
    • Bileşenler: steps, commands, dependencies, params, outputs
    • metrics ve plots anahtarlarıyla metrik ve grafikleri izleyin
  • DAG'ı görselleştirme ve çalıştırma

    • dvc dag ile görselleştirin
    • dvc repro ile çalıştırın
  • Metrik ve grafikleri gösterme ve karşılaştırma

    • dvc plots show ve dvc metrics show ile görselleştirin
    • dvc plots diff ve dvc metrics diff ile karşılaştırın
DVC ile Veri Sürümlendirmeye Giriş

Teşekkürler!

DVC ile Veri Sürümlendirmeye Giriş

Preparing Video For Download...