Tek değişkenli sürüklenme tespiti

Python ile Machine Learning İzleme

Hakim Elakhrass

CEO and co-founder

Tek değişkenli sürüklenme nedir?

Görsel, izleme iş akışını ve tek değişkenli yöntemin konumunu gösteriyor.

Python ile Machine Learning İzleme

Tek değişkenli yöntemler

  • Jensen–Shannon mesafesi - kategorik ve sürekli
  • Hellinger - kategorik ve sürekli
  • Wasserstein - yalnızca sürekli
  • Kolmogorov–Smirnov - yalnızca sürekli

  • L-infinity - yalnızca kategorik

  • Ki-kare (Chi2) - yalnızca kategorik

1 https://nannyml.readthedocs.io/en/stable/how_it_works/univariate_drift_comparison.html
Python ile Machine Learning İzleme

Kod uygulaması

# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
    continuous_methods=['wasserstein', 'hellinger'],
    categorical_methods=['jensen_shannon', 'l_infinity', 'chi2'],
    column_names=feature_column_names,
    timestamp_column_name='timestamp',
    chunk_period='d'
    )
# Fit, calculate and plot the results
uv_calc.fit(reference)
uv_results = uv_calc.calculate(analysis)
uv_results.plot().show()
Python ile Machine Learning İzleme

Filtreleme

  • Sütun adlarına göre
  • Tek değişkenli yöntemlere göre
# Filter the univariate results
filtered_figure = uv_results.filter(column_names=['trip_distance', 'fare_amount'], 
            methods=['jensen_shannon'])

# Plot the filtered results
filtered_figure.show().plot()
Python ile Machine Learning İzleme

Uyarı sayısı sıralayıcısı

  • Uyarı sayısına göre özellikleri sıralayın
# Initialize the alert count ranker
alert_count_ranker = nannyml.AlertCountRanker()
alert_count_ranked_results = alert_count_ranker.rank(
    uv_results,
    only_drifting=False)
# Display the results
display(alert_count_ranked_results)

Görsel, belirli bir özellik için uyarı sayısını içeren veri çerçevesini gösteriyor.

Python ile Machine Learning İzleme

Korelasyon sıralayıcısı

  • Özellikleri performanstaki mutlak değişimle korelasyonuna göre sıralar
# Initialize the correlation ranker
correlation_ranker = nannyml.CorrelationRanker()
correlation_ranker.fit(perf_results.filter(period='reference'))
correlation_ranked_results = correlation_ranker.rank(uv_results, perf_results)

# Display the results
display(correlation_ranked_results)

Görsel, her özellik için pearson korelasyonu ve p-değerini içeren veri çerçevesini gösteriyor.

Python ile Machine Learning İzleme

Özellik dağılımını izleme

  • Daha iyi içgörü ve açıklanabilirlik sağlar
# Create distribution plots
distribution_results = uv_results.plot(kind='distribution')

# Show the plots
distribution_results.show()
Python ile Machine Learning İzleme

Özellik dağılım grafiği

 

Görsel, sürekli ve kategorik özellikler için dağılım grafiklerini gösteriyor.

Python ile Machine Learning İzleme

Hadi pratik yapalım!

Python ile Machine Learning İzleme

Preparing Video For Download...