Memanfaatkan Kelas

Prinsip Rekayasa Perangkat Lunak di Python

Adam Spannbauer

Machine Learning Engineer at Eastman

Memperluas Kelas Dokumen

class Document:
    def __init__(self, text):
        self.text = text

Tokenisasi Dokumen

Prinsip Rekayasa Perangkat Lunak di Python

Kelas Dokumen Saat Ini

class Document:
    def __init__(self, text):
        self.text = text

Inisialisasi Tokenisasi Dokumen

Prinsip Rekayasa Perangkat Lunak di Python

Merevisi __init__

class Document:
    def __init__(self, text):
        self.text = text
        self.tokens = self._tokenize()

doc = Document('test doc') print(doc.tokens)
['test', 'doc']
Prinsip Rekayasa Perangkat Lunak di Python

Menambahkan Metode _tokenize()

# Impor fungsi untuk melakukan tokenisasi
from .token_utils import tokenize

class Document: def __init__(self, text, token_regex=r'[a-zA-Z]+'): self.text = text self.tokens = self._tokenize()
def _tokenize(self): return tokenize(self.text)
Prinsip Rekayasa Perangkat Lunak di Python

Metode Non-publik

Inisialisasi Tokenisasi Dokumen

Tanda Properti Pribadi

Prinsip Rekayasa Perangkat Lunak di Python

Risiko Metode Non-publik

  • Kurangnya dokumentasi

  • Ketidakpastian

Tanda Properti Pribadi

Prinsip Rekayasa Perangkat Lunak di Python

Ayo berlatih!

Prinsip Rekayasa Perangkat Lunak di Python

Preparing Video For Download...