Kennismaking met Datakwaliteit met Great Expectations
Davina Moossazadeh
Data Scientist

Batch Definition - Een configuratie voor hoe een Data Asset moet worden opgedeeld voor tests
batch_definition = data_asset.add_batch_definition_whole_dataframe(name="my_batch_definition" )print(batch_definition)
id='69e2a81d-1c28-4d1a-b66e-52cdc1198266'
name='my_batch_definition'
partitioner=None
Batch - Een groep records waarop je validaties kunt uitvoeren
batch = batch_definition.get_batch(batch_parameters={"dataframe": dataframe} )


We kunnen .head() gebruiken zoals in pandas:
print(batch.head())

print(batch.head(fetch_all=True))

.columns() toont alle DataFrame-kolommen (let op de ())
print(batch.columns())
['Location',
'Date_Time',
'Temperature_C',
'Humidity_pct',
'Precipitation_mm',
'Wind_Speed_kmh']
Maak een Batch Definition van een Data Asset:
batch_definition = data_asset. \
add_batch_definition_whole_dataframe(
name: str
)
Maak een Batch van een Batch Definition:
batch = batch_definition.get_batch(
batch_parameters={"dataframe": dataframe}
)
Haal DataFrame-rijen van een Batch op:
batch.head(fetch_all: bool)
Haal de kolomlijst van een Batch-DataFrame op:
batch.columns()
Kennismaking met Datakwaliteit met Great Expectations