spaCy modellerini özelleştirme

spaCy ile Natural Language Processing

Azadeh Mobasher

Principal data scientist

Neden spaCy modelleri eğitilir?

  • Genel NLP kullanım durumları için oldukça etkilidir
  • Ancak eğitim sırasında belirli alan verilerini görmemiş olabilir, örn.
    • Twitter verisi
    • Tıbbi veriler

Tıbbi alana özgü bir NER örneği

spaCy ile Natural Language Processing

Neden spaCy modelleri eğitilir?

 

  • Özel alanınızda daha iyi sonuçlar
  • Alana özgü metin sınıflandırma için kritik

 

Eğitime başlamadan önce şu soruları sorun:

  • spaCy modelleri verimizde yeterince iyi mi?
  • Alanımızda spaCy modellerinde olmayan çok sayıda etiket var mı?
spaCy ile Natural Language Processing

Verimizde modellerin performansı

  • spaCy modelleri verimizde yeterince iyi mi?
  • Oxford Street, GPE etiketiyle doğru sınıflandırılmadı:
import spacy
nlp = spacy.load("en_core_web_sm")

text = "The car was navigating to the Oxford Street."
doc = nlp(text)
print([(ent.text, ent.label_) for ent in doc.ents])
[('the Oxford Street', 'ORG')]
spaCy ile Natural Language Processing

spaCy modellerindeki çıktı etiketleri

  • Alanımızda spaCy modellerinde olmayan çok sayıda etiket var mı?

Genel vs. tıbbi alanlarda NER örneği

spaCy ile Natural Language Processing

spaCy modellerindeki çıktı etiketleri

 

Özel model eğitimi gerekiyorsa şu adımları izleriz:

  • Alana özgü verileri toplayın
  • Verileri etiketleyin
  • Mevcut bir modeli güncelleyeceğinize mi yoksa sıfırdan bir model eğiteceğinize mi karar verin
spaCy ile Natural Language Processing

Hadi pratik yapalım!

spaCy ile Natural Language Processing

Preparing Video For Download...