Kennismaking met Datakwaliteit met Great Expectations
Davina Moossazadeh
Data Scientist
Hoe geschikt een dataset is voor het beoogde doel




Een model is maar zo goed als de data die je erin stopt!

Great Expectations (GX) - Platform voor datakwaliteitsbeheer
Expectation - Verifieerbare uitspraak over data

Data Context - Het belangrijkste startpunt voor een GX-implementatie
Importeer Great Expectations met alias gx:
import great_expectations as gx
Gebruik get_context() om de Data Context te maken:
context = gx.get_context()print(context)
{ "analytics_enabled": true,
"checkpoint_store_name": "default_checkpoint_store",
"config_variables_file_path": "uncommitted/config_variables.yml",
"config_version": 4.0,
"data_context_id": "5b407294-b17c-43e3-aa5f-4f8a4741e772",
"expectations_store_name": "default_expectations_store",
"fluent_datasources": {},
"plugins_directory": "plugins/",
"stores": {},
"validation_results_store_name": "default_validations_store" }
Kennismaking met Datakwaliteit met Great Expectations