Ringkasan

Pemrosesan Bahasa Alami dengan spaCy

Azadeh Mobasher

Principal data scientist

Bab 1 - Pengantar NLP dan spaCy

 

  • Gunakan pipeline pemrosesan teks spaCy untuk mengekstrak fitur linguistik:

 

Pipeline Bahasa spaCy

Pemrosesan Bahasa Alami dengan spaCy

Bab 2 - Anotasi linguistik spaCy dan vektor kata

  • Gunakan kelas spaCy seperti Doc, Token, dan Span, serta prediksi kemiripan semantik dengan vektor kata:

Analogi dan operasi vektor

Pemrosesan Bahasa Alami dengan spaCy

Bab 3 - Analisis data dengan spaCy

  • Tulis pola pencocokan untuk mengekstrak istilah dan frasa menggunakan Matcher dan PhraseMatcher spaCy:

 

matcher = Matcher(nlp.vocab)
pattern = [{"LOWER": "good"}, {"LOWER": {"IN": ["morning", "evening"]}}]
matcher.add("morning_greeting", [pattern])

 

matcher = PhraseMatcher(nlp.vocab, attr = "LOWER")
patterns = [nlp.make_doc(term) for term in terms]
matcher.add("InvestmentTerms", patterns)
Pemrosesan Bahasa Alami dengan spaCy

Bab 4 - Kustomisasi model spaCy

 

  • Anotasi dan siapkan data untuk pelatihan
  • Latih model spaCy dan gunakan saat inferensi

 

Contoh NER domain medis

Pemrosesan Bahasa Alami dengan spaCy

Sumber daya yang disarankan

Pemrosesan Bahasa Alami dengan spaCy

Selamat!

Pemrosesan Bahasa Alami dengan spaCy

Preparing Video For Download...