Aproveitando Classes

Princípios de Engenharia de Software em Python

Adam Spannbauer

Machine Learning Engineer at Eastman

Estendendo a classe Document

class Document:
    def __init__(self, text):
        self.text = text

Tokenizar Documento

Princípios de Engenharia de Software em Python

Classe de documento atual

class Document:
    def __init__(self, text):
        self.text = text

Tokenizar Documento init

Princípios de Engenharia de Software em Python

Revisando __init__

class Document:
    def __init__(self, text):
        self.text = text
        self.tokens = self._tokenize()

doc = Document('test doc') print(doc.tokens)
['test', 'doc']
Princípios de Engenharia de Software em Python

Adicionando método _tokenize()

# Importar função para realizar tokenização
from .token_utils import tokenize

class Document: def __init__(self, text, token_regex=r'[a-zA-Z]+'): self.text = text self.tokens = self._tokenize()
def _tokenize(self): return tokenize(self.text)
Princípios de Engenharia de Software em Python

Métodos não públicos

Tokenizar Documento init

Placa de Propriedade Privada

Princípios de Engenharia de Software em Python

Riscos dos métodos não públicos

  • Falta de documentação

  • Imprevisibilidade

Placa de Propriedade Privada

Princípios de Engenharia de Software em Python

Vamos praticar!

Princípios de Engenharia de Software em Python

Preparing Video For Download...