Pengenalan entitas bernama

Rekayasa Fitur untuk NLP di Python

Rounak Banik

Data Scientist

Aplikasi

  • Algoritme pencarian efisien
  • Penjawaban pertanyaan
  • Klasifikasi artikel berita
  • Layanan pelanggan
Rekayasa Fitur untuk NLP di Python

Pengenalan entitas bernama

  • Mengidentifikasi dan mengklasifikasikan entitas bernama ke dalam kategori pradefinisi.
  • Kategori mencakup orang, organisasi, negara, dll.
    "John Doe is a software engineer working at Google. He lives in France."
    
  • Entitas Bernama
  • John Doe → orang
  • Google → organisasi
  • France → negara (entitas geopolitik)
Rekayasa Fitur untuk NLP di Python

NER dengan spaCy

import spacy
string = "John Doe is a software engineer working at Google. He lives in France."

# Load model and create Doc object
nlp = spacy.load('en_core_web_sm')
doc = nlp(string)

# Generate named entities ne = [(ent.text, ent.label_) for ent in doc.ents] print(ne)
[('John Doe', 'PERSON'), ('Google', 'ORG'), ('France', 'GPE')]
Rekayasa Fitur untuk NLP di Python

Anotasi NER di spaCy

Dokumentasi spaCy tentang anotasi NER

Rekayasa Fitur untuk NLP di Python

Catatan kehati-hatian

  • Tidak sempurna
  • Kinerja bergantung pada data latih dan uji
  • Latih model dengan data khusus untuk kasus bernuansa
  • Spesifik bahasa
Rekayasa Fitur untuk NLP di Python

Ayo berlatih!

Rekayasa Fitur untuk NLP di Python

Preparing Video For Download...