Introduzione alla Data Quality con Great Expectations
Davina Moossazadeh
Data Scientist
Componenti GX - Classi Python che rappresentano entità di dati e di validazione
Origine dati - Oggetto che indica a GX come connettersi a una specifica fonte di dati esterna



Origine dati - Oggetto che indica a GX come connettersi a una specifica fonte di dati esterna



Gestisci le origini dati con l'attributo .data_sources, usando il metodo .add_pandas():
data_source = context.data_sources.add_pandas(name="my_pandas_datasource" )
Nota: Il parametro name in GX è diverso dal nome della variabile Python
"my_pandas_datasource" vs data_sourceData Asset - Una raccolta di record all'interno di un'origine dati
data_asset = data_source.add_dataframe_asset(name="my_dataframe_asset" )
Crea un'origine dati dal Data Context:
data_source = context.data_sources.add_pandas(
name: str
)
Crea un Data Asset dall'origine dati:
data_asset = data_source.add_dataframe_asset(
name: str
)
Introduzione alla Data Quality con Great Expectations