Kennismaking met Datakwaliteit met Great Expectations
Davina Moossazadeh
Data Scientist
Checkpoint - Een object dat Validation Definitions met gedeelde parameters groepeert en uitvoert

Actions - Componenten die door Checkpoints worden geconfigureerd om GX te koppelen aan andere tools op basis van Validation Results
Herbruikbaarheid
Actions
$$
Een Checkpoint maken met Slack-notificatie via gx.Checkpoint():
checkpoint = gx.Checkpoint(name="my_checkpoint",validation_definitions=[validation_definition],actions=[SlackNotificationAction()] # optioneel )
Een Checkpoint uitvoeren vóórdat de Validation Definition aan de Data Context is toegevoegd, geeft een fout:
CheckpointRelatedResourcesFreshnessError:
ValidationDefinition 'my_validation_definition' must be added to the DataContext
before it can be updated. Please call `context.validation_definitions.add(
<VALIDATION_DEFINITION_OBJECT>)`, then try your action again.
Voeg de Validation Definition toe aan de Data Context met .validation_definitions.add():
validation_definition = context.validation_definitions.add(validation_definition=validation_definition )
checkpoint_results = checkpoint.run(
batch_parameters={"dataframe": dataframe}
)

print(checkpoint_results.success)
False
print(checkpoint_results.describe())
{ "success": false,
"statistics": {
"evaluated_expectations": 1, "successful_expectations": 0,
"unsuccessful_expectations": 1, "success_percent": 0.0
},
"expectations": [{
"expectation_type": "expect_table_row_count_to_equal",
"success": false,
"kwargs": {"batch_id": ""my_datasource-my_dataframe_asset", "value": 118000},
"result": {"observed_value": 11866}}
],
"result_url": "https://app.greatexpectations.io/organizations/my_org/data-assets/*/validations/expectation-suites/0a123b9c-e370-4b18-b703-785dde88732d/results/cb093105-6ede-47d4-a141-dee10c632e18"
}
Data Docs - statische websites die worden gegenereerd uit GX-metadata
# Checkpoint met Action om Data Docs bij te werken
gx.Checkpoint(
name,
validation_definitions,
actions=[
gx.checkpoint.actions.UpdateDataDocsAction(
name="update_my_site", site_names="my_data_docs_site"
)
],
)

Validation Definition toevoegen aan Data Context:
context.validation_definitions.add(
validation_definition
)
Checkpoint maken:
checkpoint = gx.Checkpoint(
name: str,
validation_definitions: list,
)
Checkpoint uitvoeren:
checkpoint_results = checkpoint.run(
batch_parameters={"dataframe": dataframe}
)
Checkpoint-resultaten bekijken:
checkpoint_results.success
checkpoint_results.describe()
Kennismaking met Datakwaliteit met Great Expectations