Great Expectations ile Veri Kalitesine Giriş
Davina Moossazadeh
Data Scientist
gx.expectations.ExpectColumnMeanToBeBetween( column="mark_price_usd", min_value=20, max_value=25 )gx.expectations.ExpectColumnMedianToBeBetween( column="mark_price_usd", min_value=20, max_value=25 )gx.expectations.ExpectColumnStdevToBeBetween( column="mark_price_usd", min_value=15, max_value=20 )gx.expectations.ExpectColumnSumToBeBetween( column="mark_price_usd", min_value=20000, max_value=21000 )
Değer aralıkları için satır düzeyinde Beklentiler belirleyin:
gx.expectations.ExpectColumnValuesToBeBetween(
column="star_rating", min_value=0, max_value=5
)
veya sıralama:
gx.expectations.ExpectColumnValuesToBeIncreasing( column="price_usd" )gx.expectations.ExpectColumnValuesToBeDecreasing( column="price_usd" )
Dize düzeyinde Beklentiler belirleyin (bunların tümü satır düzeyindedir):
gx.expectations.ExpectColumnValueLengthsToEqual( column="sku_id", value=18 )gx.expectations.ExpectColumnValuesToMatchRegex( column="link", regex="^https://us.shein.com/[\w-]+" )regex_list = [ "//img.ltwebstatic.com/images3_(spmp)|(pi)/202[0-4]/[0-1][0-9]/.*", "//sheinsz.ltwebstatic.com/she_dist/images/bg-g.*" ]gx.expectations.ExpectColumnValuesToMatchRegexList( column="hero_image", regex_list=regex_list )
Verinin ayrıştırılabilir olması için dize sütunları için Beklentiler belirleyin
Tarihler için ExpectColumnValuesToBeDateutilParseable():
gx.expectations.ExpectColumnValuesToBeDateutilParseable(
column="colour"
)
JSON için ExpectColumnValuesToBeJsonParseable():
gx.expectations.ExpectColumnValuesToBeJsonParseable(
column="colour"
)
Sayısal Beklentiler:
ExpectColumn<METRIC>ToBeBetween(
column, min_value, max_value
)
# <METRIC> in {"Mean", "Median", "Stdev", "Sum"}
ExpectColumnValuesToBeBetween(
column, min_value, max_value
)
ExpectColumnValuesToBeIncreasing(column)
ExpectColumnValuesToBeDecreasing(column)
Dize Beklentileri:
ExpectColumnValueLengthsToEqual(column, value)
ExpectColumnValuesToMatchRegex(column, regex)
ExpectColumnValuesToMatchRegexList(
column, regex_list
)
ExpectColumnValuesToBeDateutilParseable(column)
ExpectColumnValuesToBeJsonParseable(column)
Great Expectations ile Veri Kalitesine Giriş