Adlandırılmış varlık tanıma

Python ile NLP için Özellik Mühendisliği

Rounak Banik

Data Scientist

Uygulamalar

  • Verimli arama algoritmaları
  • Soru yanıtlama
  • Haber makalesi sınıflandırma
  • Müşteri hizmetleri
Python ile NLP için Özellik Mühendisliği

Adlandırılmış varlık tanıma

  • Adlandırılmış varlıkları önceden tanımlı kategorilere ayırma ve sınıflandırma.
  • Kategoriler: kişi, kuruluş, ülke vb.
    "John Doe is a software engineer working at Google. He lives in France."
    
  • Adlandırılmış Varlıklar
  • John Doe → kişi
  • Google → kuruluş
  • France → ülke (jeopolitik varlık)
Python ile NLP için Özellik Mühendisliği

spaCy ile NER

import spacy
string = "John Doe is a software engineer working at Google. He lives in France."

# Load model and create Doc object
nlp = spacy.load('en_core_web_sm')
doc = nlp(string)

# Generate named entities ne = [(ent.text, ent.label_) for ent in doc.ents] print(ne)
[('John Doe', 'PERSON'), ('Google', 'ORG'), ('France', 'GPE')]
Python ile NLP için Özellik Mühendisliği

spaCy’de NER açıklamaları

NER açıklamaları için spaCy dokümantasyonu

Python ile NLP için Özellik Mühendisliği

Dikkat edilmesi gerekenler

  • Mükemmel değildir
  • Başarım, eğitim ve test verilerine bağlıdır
  • İnce durumlar için özel verilerle model eğitin
  • Dile özeldir
Python ile NLP için Özellik Mühendisliği

Hadi pratik yapalım!

Python ile NLP için Özellik Mühendisliği

Preparing Video For Download...