İnce ayar

Large Language Models (LLMs) Kavramları

Vidhi Chugh

AI strategist and ethicist

Neredeyiz?

İlerleme grafiği: ince ayar aşamasına geldik

Large Language Models (LLMs) Kavramları

 

  • Ön eğitim

Ön eğitime benzetme olarak okul çocuklarını gösteren görsel

          Okul eğitimi

 

  • İnce ayar

İnce ayara benzetme olarak üniversite öğrencilerini gösteren görsel

        Üniversite uzmanlaşması
1 Freepik
Large Language Models (LLMs) Kavramları

“Büyüklük” zorlukları

  • İnce ayar yardımcı olabilir
  • Güçlü bilgisayarlar
  • Verimli eğitim yöntemleri
  • Büyük miktarda eğitim verisi

LLM oluşturmada veri, eğitim süresi ve hesaplama gücü zorluklarını gösteren görsel

Large Language Models (LLMs) Kavramları

Hesaplama gücü

  • Bellek

  • İşlem gücü

  • Altyapı

  • Maliyetli

  • LLM:
    • Yüz binlerce Merkezi İşlem Birimi (CPU)
    • On binlerce Grafik İşlem Birimi (GPU)
  • Kişisel bilgisayar: 4-8 CPU ve 1-2 GPU

Büyük sunucuya bağlı bilgisayarda çalışan kişi

1 Freepik
Large Language Models (LLMs) Kavramları

Verimli model eğitimi

Derin öğrenme modelini simgeleyen illüstrasyon

  • Eğitim süresi çok uzun

 

  • Haftalar hatta aylar sürebilir

 

  • Verimli model eğitimi = daha kısa süre

 

  • Tek bir GPU’da 355 yıl işlem süresi
Large Language Models (LLMs) Kavramları

Veri kullanılabilirliği

 

  • Yüksek kaliteli veriye ihtiyaç
  • Dilin karmaşıklık ve inceliklerini öğrenmek için
  • Birkaç yüz gigabayt (GB) metin

    • Bir milyondan fazla kitap
  • Devasa veri miktarı

  Büyük veriyi simgeleyen taşan klasör yığınları

Large Language Models (LLMs) Kavramları

Zorlukların aşılması

  • İnce ayar (fine-tuning)
    • Bu zorlukların bir kısmını giderir
    • Önceden eğitilmiş bir modeli uyarlar

 

  • Önceden eğitilmiş model
    • Genel amaçlı veri kümelerinden öğrenmiştir
    • Belirli görevler için optimize edilmemiştir
    • Belirli bir sorun için ince ayar yapılabilir

İnce ayarı simgeleyen aletler ve dişlilerle dev dizüstünde çalışan insanlar

Large Language Models (LLMs) Kavramları

İnce ayar vs. Ön eğitim

  • İnce ayar

  • Hesaplama

    • 1-2 CPU ve GPU

 

  • Eğitim süresi
    • Saatler ila günler

 

  • Veri
    • ~1 gigabayt
  • Ön eğitim

  • Hesaplama

    • Binlerce CPU ve GPU

 

  • Eğitim süresi
    • Haftalar ila aylar

 

  • Veri
    • Yüzlerce gigabayt
Large Language Models (LLMs) Kavramları

Hadi pratik yapalım!

Large Language Models (LLMs) Kavramları

Preparing Video For Download...