Pengantar Data Quality dengan Great Expectations
Davina Moossazadeh
Data Scientist

Batch Definition - Konfigurasi cara Data Asset dibagi untuk pengujian
batch_definition = data_asset.add_batch_definition_whole_dataframe(name="my_batch_definition" )print(batch_definition)
id='69e2a81d-1c28-4d1a-b66e-52cdc1198266'
name='my_batch_definition'
partitioner=None
Batch - Sekelompok rekaman tempat validasi dijalankan
batch = batch_definition.get_batch(batch_parameters={"dataframe": dataframe} )


Kita bisa memakai .head() seperti di pandas:
print(batch.head())

print(batch.head(fetch_all=True))

.columns() menampilkan semua kolom DataFrame (perhatikan ())
print(batch.columns())
['Location',
'Date_Time',
'Temperature_C',
'Humidity_pct',
'Precipitation_mm',
'Wind_Speed_kmh']
Buat Batch Definition dari Data Asset:
batch_definition = data_asset. \
add_batch_definition_whole_dataframe(
name: str
)
Buat Batch dari Batch Definition:
batch = batch_definition.get_batch(
batch_parameters={"dataframe": dataframe}
)
Ambil baris DataFrame Batch:
batch.head(fetch_all: bool)
Ambil daftar kolom DataFrame Batch:
batch.columns()
Pengantar Data Quality dengan Great Expectations