Türe Özel Beklentiler

Great Expectations ile Veri Kalitesine Giriş

Davina Moossazadeh

Data Scientist

Sayısal Beklentiler: toplu düzey

gx.expectations.ExpectColumnMeanToBeBetween(
    column="mark_price_usd", min_value=20, max_value=25
)

gx.expectations.ExpectColumnMedianToBeBetween( column="mark_price_usd", min_value=20, max_value=25 )
gx.expectations.ExpectColumnStdevToBeBetween( column="mark_price_usd", min_value=15, max_value=20 )
gx.expectations.ExpectColumnSumToBeBetween( column="mark_price_usd", min_value=20000, max_value=21000 )
Great Expectations ile Veri Kalitesine Giriş

Sayısal Beklentiler: satır düzeyi

Değer aralıkları için satır düzeyinde Beklentiler belirleyin:

gx.expectations.ExpectColumnValuesToBeBetween(
    column="star_rating", min_value=0, max_value=5
)

veya sıralama:

gx.expectations.ExpectColumnValuesToBeIncreasing(
    column="price_usd"
)

gx.expectations.ExpectColumnValuesToBeDecreasing( column="price_usd" )
Great Expectations ile Veri Kalitesine Giriş

Dize (string) Beklentileri

Dize düzeyinde Beklentiler belirleyin (bunların tümü satır düzeyindedir):

gx.expectations.ExpectColumnValueLengthsToEqual(
    column="sku_id", value=18
)

gx.expectations.ExpectColumnValuesToMatchRegex( column="link", regex="^https://us.shein.com/[\w-]+" )
regex_list = [ "//img.ltwebstatic.com/images3_(spmp)|(pi)/202[0-4]/[0-1][0-9]/.*", "//sheinsz.ltwebstatic.com/she_dist/images/bg-g.*" ]
gx.expectations.ExpectColumnValuesToMatchRegexList( column="hero_image", regex_list=regex_list )
Great Expectations ile Veri Kalitesine Giriş

Dize ayrıştırılabilirliği Beklentileri

Verinin ayrıştırılabilir olması için dize sütunları için Beklentiler belirleyin

Tarihler için ExpectColumnValuesToBeDateutilParseable():

gx.expectations.ExpectColumnValuesToBeDateutilParseable(
    column="colour"
)

JSON için ExpectColumnValuesToBeJsonParseable():

gx.expectations.ExpectColumnValuesToBeJsonParseable(
    column="colour"
)
Great Expectations ile Veri Kalitesine Giriş

Hızlı referans

Sayısal Beklentiler:

ExpectColumn<METRIC>ToBeBetween(
    column, min_value, max_value
)
# <METRIC> in {"Mean", "Median", "Stdev", "Sum"}

ExpectColumnValuesToBeBetween(
    column, min_value, max_value
)

ExpectColumnValuesToBeIncreasing(column)

ExpectColumnValuesToBeDecreasing(column)

Dize Beklentileri:

ExpectColumnValueLengthsToEqual(column, value)

ExpectColumnValuesToMatchRegex(column, regex)

ExpectColumnValuesToMatchRegexList(
    column, regex_list
)

ExpectColumnValuesToBeDateutilParseable(column)

ExpectColumnValuesToBeJsonParseable(column)
Great Expectations ile Veri Kalitesine Giriş

Hadi pratik yapalım!

Great Expectations ile Veri Kalitesine Giriş

Preparing Video For Download...