Kennismaking met Datakwaliteit met Great Expectations
Davina Moossazadeh
Data Scientist
GX-componenten: Pythonclasses die data- en datavalidatie-entiteiten voorstellen
Data source: een object dat GX vertelt hoe te verbinden met een specifieke externe databron



Data source: een object dat GX vertelt hoe te verbinden met een specifieke externe databron



Beheer data sources met het attribuut .data_sources en de methode .add_pandas():
data_source = context.data_sources.add_pandas(name="my_pandas_datasource" )
Let op: de parameter name in GX is anders dan de Python-variabelenaam
"my_pandas_datasource" vs. data_sourceData asset: een verzameling records binnen een data source
data_asset = data_source.add_dataframe_asset(name="my_dataframe_asset" )
Maak een data source via de Data Context:
data_source = context.data_sources.add_pandas(
name: str
)
Maak een data asset via de data source:
data_asset = data_source.add_dataframe_asset(
name: str
)
Kennismaking met Datakwaliteit met Great Expectations