spaCy ile Natural Language Processing
Azadeh Mobasher
Principal Data Scientist
spaCy önce metni belirteçlere ayırarak bir Doc nesnesi oluştururDoc, işleme ardışık düzeninin çeşitli adımlarında işlenir
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp(example_text)
spaCy VNE (NER) ardışık düzeni:print([ent.text for ent in doc.ents])
sentencizer: cümle bölütleme için spaCy ardışık düzen bileşeni.text = " ".join(["This is a test sentence."]*10000)en_core_sm_nlp = spacy.load("en_core_web_sm") start_time = time.time() doc = en_core_sm_nlp(text)print(f"Finished processing with en_core_web_sm model in {round((time.time() - start_time)/60.0 , 5)} minutes")
>>> Finished processing with en_core_web_sm model in 0.09332 minutes
sentencizer borusu ekleyin:blank_nlp = spacy.blank("en")blank_nlp.add_pipe("sentencizer")start_time = time.time() doc = blank_nlp(text) print(f"Finished processing with blank model in {round((time.time() - start_time)/60.0 , 5)} minutes")
>>> Finished processing with blank model in 0.00091 minutes
nlp.analyze_pipes(), bir spaCy ardışık düzenini şunları belirlemek için analiz eder:
pretty değerini True yapmak, yalnızca yapılandırılmış veri döndürmek yerine bir tablo yazdırır.import spacy
nlp = spacy.load("en_core_web_sm")
analysis = nlp.analyze_pipes(pretty=True)
spaCy ile Natural Language Processing