Pengantar Data Quality dengan Great Expectations
Davina Moossazadeh
Data Scientist
Komponen GX - Kelas Python yang merepresentasikan entitas data dan validasi data
Sumber Data - Objek yang memberi tahu GX cara terhubung ke sumber data eksternal tertentu



Sumber Data - Objek yang memberi tahu GX cara terhubung ke sumber data eksternal tertentu



Kelola Sumber Data dengan atribut .data_sources, gunakan metode .add_pandas():
data_source = context.data_sources.add_pandas(name="my_pandas_datasource" )
Catatan: Parameter name di GX berbeda dari nama variabel Python
"my_pandas_datasource" vs. data_sourceAset Data - Kumpulan rekaman dalam satu Sumber Data
data_asset = data_source.add_dataframe_asset(name="my_dataframe_asset" )
Buat Sumber Data dari Data Context:
data_source = context.data_sources.add_pandas(
name: str
)
Buat Aset Data dari Sumber Data:
data_asset = data_source.add_dataframe_asset(
name: str
)
Pengantar Data Quality dengan Great Expectations