Pipeline di elaborazione

NLP avanzato con spaCy

Ines Montani

spaCy core developer

Cosa succede quando chiami nlp?

Illustrazione della pipeline di spaCy che trasforma un testo in un Doc elaborato

doc = nlp("This is a sentence.")
NLP avanzato con spaCy

Componenti di pipeline integrati

Nome Descrizione Crea
tagger PoS tagger (parti del discorso) Token.tag
parser Parser di dipendenze Token.dep, Token.head, Doc.sents, Doc.noun_chunks
ner Riconoscitore di entità nominate Doc.ents, Token.ent_iob, Token.ent_type
textcat Classificatore di testo Doc.cats
NLP avanzato con spaCy

Sotto il cofano

Illustrazione di un pacchetto etichettato en_core_web_sm, cartelle, file e meta.json

  • Pipeline definita nel meta.json del modello, in ordine
  • I componenti integrati richiedono dati binari per fare previsioni
NLP avanzato con spaCy

Attributi della pipeline

  • nlp.pipe_names: elenco dei nomi dei componenti della pipeline
print(nlp.pipe_names)
['tagger', 'parser', 'ner']
  • nlp.pipeline: elenco di tuple (name, component)
print(nlp.pipeline)
[('tagger', <spacy.pipeline.Tagger>),
 ('parser', <spacy.pipeline.DependencyParser>),
 ('ner', <spacy.pipeline.EntityRecognizer>)]
NLP avanzato con spaCy

Passiamo alla pratica !

NLP avanzato con spaCy

Preparing Video For Download...