Ringkasan

Pemrosesan Bahasa Alami dengan spaCy

Azadeh Mobasher

Principal data scientist

Bab 1 - Pengantar NLP dan spaCy

Pipeline Bahasa spaCy

Gunakan kelas spaCy seperti Doc, Token, dan Span, serta prediksi kemiripan semantik dengan vektor kata:

Analogi dan operasi vektor

Tulis pola pencocokan untuk mengekstrak istilah dan frasa menggunakan Matcher dan PhraseMatcher spaCy:

matcher = Matcher(nlp.vocab)
pattern = [{"LOWER": "good"}, {"LOWER": {"IN": ["morning", "evening"]}}]
matcher.add("morning_greeting", [pattern])

matcher = PhraseMatcher(nlp.vocab, attr = "LOWER")
patterns = [nlp.make_doc(term) for term in terms]
matcher.add("InvestmentTerms", patterns)

Contoh NER domain medis

Pemrosesan Bahasa Alami dengan spaCy