Transformer'ı anlamak

Python ile LLM'lere Giriş

Jasmin Ludolf

Senior Data Science Content Developer, DataCamp

Transformer nedir?

  • Derin öğrenme mimarileri
  • Metni işleme, anlama ve üretme
  • Çoğu LLM'de kullanılır
  • Uzun dizileri paralel işler

Üç transformer mimarisi: yalnızca encoder, yalnızca decoder ve encoder–decoder görseli

Python ile LLM'lere Giriş

Transformer mimarileri

Üç transformer mimarisi: yalnızca encoder, yalnızca decoder ve encoder–decoder görseli

  • Mimari ayrıntıları Hugging Face model kartında bulun
Python ile LLM'lere Giriş

Yalnızca encoder

Yalnızca encoder görseli

  • Girdi metnini anlama
  • Sıralı çıktı yok
  • Yaygın görevler:
    • Metin sınıflandırma
    • Duygu analizi
    • Çıkarımsal soru-cevap (çıkar veya etiketle)
  • BERT modelleri
  • Örnek: "distilbert-base-uncased-distilled-squad"
Python ile LLM'lere Giriş

Yalnızca encoder

Yalnızca encoder görseli

llm = pipeline(model="bert-base-uncased")
print(llm.model)
BertForMaskedLM(
  (bert): ...
    )
    (encoder): BertEncoder(
      ...
print(llm.model.config)
BertConfig {
...
  "architectures": [
    "BertForMaskedLM"
...
Python ile LLM'lere Giriş

Yalnızca encoder

Yalnızca encoder görseli

print(llm.model.config.is_decoder)
False
  • Alternatif: llm.model.config.is_encoder_decoder
Python ile LLM'lere Giriş

Yalnızca decoder

Yalnızca decoder görseli

  • Odak çıktıdadır
  • Yaygın görevler:
    • Metin üretimi
    • Üretken soru-cevap (cümle veya paragraf)
  • GPT modelleri
  • Örnek: "gpt-5.4-mini"
Python ile LLM'lere Giriş

Yalnızca decoder

Yalnızca decoder görseli

llm = pipeline(model="gpt2")
print(llm.model.config)
GPT2Config {
...
  "architectures": [
    "GPT2LMHeadModel"
  ],
...
  "task_specific_params": {
    "text-generation": {
...
print(llm.model.config.is_decoder)
False
Python ile LLM'lere Giriş

Encoder–decoder

Encoder–decoder görseli

  • Girdi ve çıktıyı birlikte anlar/işler
  • Yaygın görevler:
    • Çeviri
    • Özetleme
  • T5, BART modelleri
Python ile LLM'lere Giriş

Encoder–decoder

Encoder–decoder görseli

llm = pipeline(model="Helsinki-NLP/opus-mt-es-en")
print(llm.model)
MarianMTModel(
...
    (encoder): MarianEncoder(
...
    (decoder): MarianDecoder(
...
Python ile LLM'lere Giriş

Encoder–decoder

Encoder–decoder görseli

print(llm.model.config)
MarianConfig {
...
  "decoder_attention_heads": 8,
...
  "encoder_attention_heads": 8,
...
  "is_encoder_decoder": true,
...
print(llm.model.config.is_encoder_decoder)
True
Python ile LLM'lere Giriş

Hadi pratik yapalım!

Python ile LLM'lere Giriş

Preparing Video For Download...