Git Large File Storage

Geavanceerd Git

Amanda Crawford-Adamo

Software and Data Engineer

Wat is Git Large File System?

Git LFS-commando:

git lfs
  • Git LFS: Git Large File Storage
  • Vervangt grote bestanden in de repo
  • Kleine pointerbestanden
  • Grote bestanden los van de repo

Voordelen:

  1. Kleiner repositoryformaat
  2. Sneller clonen en fetchen
  3. Efficiënte afhandeling van binaire bestanden
  4. Betere samenwerking aan grote bestanden
Geavanceerd Git

Git LFS-initialisatieproces

  • Git LFS initialiseren

    git lfs install
    
  • Bestanden instellen om te tracken en .gitattributes genereren

    git lfs track "*.csv"
    
  • .gitattributes met trackingconfig aan de index toevoegen

    git add .gitattributes
    
  • Nieuwe wijzigingen committen
    git commit -m "Track CSV files"
    

Een gif van een archiefkast met uitstekende mappen

Geavanceerd Git

Git LFS-updateproces

  1. Nieuw bestand toevoegen met git add
    git add large_file.csv
    
  2. Wijzigingen committen en pushen
    git commit -m "Update large CSV file"
    git push origin main
    
  3. Wijzigingen downloaden
    git pull
    git lfs pull  # Indien nodig expliciet LFS-content downloaden
    
Geavanceerd Git

Wanneer Git LFS gebruiken

Wanneer gebruiken:

  1. Wijzigingen in grote datasets volgen (CSV, JSON, enz.)
  2. Machine learning-modellen
  3. Binaire assets (afbeeldingen, video's)
  4. Versiebeheer voor gecomprimeerde of installer-bestanden

Wanneer niet gebruiken:

  1. Grote bestanden die zelden veranderen
  2. Kleine tekstbestanden, zoals code
  3. Strakke opslagquota
Geavanceerd Git

Best practices

  1. Efficiënt beheer van grote bestanden
  2. Betere samenwerking op data-rijke projecten
  3. Naadloze integratie met je Git-workflow

Tips:

  1. Volg bestanden selectief
  2. Houd je team op de hoogte van LFS-gebruik
  3. Ruim LFS-cache regelmatig op
Geavanceerd Git

Laten we oefenen!

Geavanceerd Git

Preparing Video For Download...