Analisi post-hoc dopo l'ANOVA

Progettazione Sperimentale in Python

James Chapman

Curriculum Manager, DataCamp

Quando usare i test post-hoc

 

  • Dopo un'ANOVA significativa
  • Per esplorare differenze a coppie tra gruppi

Una tenda blu da teatro viene scostata da una mano in stile cartoon, rivelando una rete di quattro cerchi colorati etichettati A, B, C e D collegati da linee che rappresentano confronti a coppie. Alcuni collegamenti hanno asterischi a indicare differenze significative, altri sono segnati come non significativi. L'illustrazione mostra come i test post-hoc rivelano quali gruppi differiscono dopo che un'ANOVA rileva un effetto complessivo.

Progettazione Sperimentale in Python

Metodi post-hoc chiave

 

  • HSD di Tukey (Honest Significant Difference)
    • Robusto per confronti multipli
    • Ideale per confronti tra tutti i gruppi
  • Correzione di Bonferroni
    • Aggiusta i p-value per controllare gli errori di Tipo I
    • Ideale per confronti specifici

John Tukey

Carlo Emilio Bonferroni

1 https://www.amphilsoc.org/item-detail/photograph-john-wilder-tukey 2 https://en.wikipedia.org/wiki/Carlo_Emilio_Bonferroni
Progettazione Sperimentale in Python

Dataset: campagne pubblicitarie

ad_campaigns
              Ad_Campaign  Click_Through_Rate
1300    Seasonal Discount        2.1659547732
1661          New Arrival        2.9409657365
2762       Loyalty Reward        3.2476777154
571     Seasonal Discount        3.3382186561
775     Seasonal Discount        1.7148876401
Progettazione Sperimentale in Python

Organizzare i dati con tabelle pivot

pivot_table = ad_campaigns.pivot_table(values='Click_Through_Rate',
                                       index='Ad_Campaign',
                                       aggfunc="mean")
print(pivot_table)
                   Click_Through_Rate
Ad_Campaign                          
Loyalty Reward               2.792716
New Arrival                  3.013843
Seasonal Discount            2.518917
Progettazione Sperimentale in Python

Eseguire l'ANOVA

from scipy.stats import f_oneway
campaign_types = ['Seasonal Discount', 'New Arrival', 'Loyalty Reward']

groups = [ad_campaigns[ad_campaigns['Ad_Campaign'] == campaign]['Click_Through_Rate'] for campaign in campaign_types]
f_stat, p_val = f_oneway(*groups) print(p_val)
4.484124496940693e-134
Progettazione Sperimentale in Python

Test HSD di Tukey

from statsmodels.stats.multicomp import pairwise_tukeyhsd

tukey_results = pairwise_tukeyhsd(ad_campaigns['Click_Through_Rate'],
ad_campaigns['Ad_Campaign'],
alpha=0.05)
print(tukey_results)
         Multiple Comparison of Means - Tukey HSD, FWER=0.05          
===========================================================================
        group1             group2  meandiff  p-adj   lower    upper  reject
<hr />---------------------------------------------------------------------
Loyalty Reward        New Arrival    0.2211   0.0    0.176   0.2663    True
Loyalty Reward  Seasonal Discount   -0.2738   0.0  -0.3189  -0.2287    True
   New Arrival  Seasonal Discount   -0.4949   0.0  -0.5401  -0.4498    True
<hr />---------------------------------------------------------------------
Progettazione Sperimentale in Python

Impostazione correzione Bonferroni

from scipy.stats import ttest_ind
from statsmodels.sandbox.stats.multicomp import multipletests

p_values = []
comparisons = [('Seasonal Discount', 'New Arrival'), ('Seasonal Discount', 'Loyalty Reward'), ('New Arrival', 'Loyalty Reward')]
for comp in comparisons: group1 = ad_campaigns[ad_campaigns['Ad_Campaign'] == comp[0]]['Click_Through_Rate'] group2 = ad_campaigns[ad_campaigns['Ad_Campaign'] == comp[1]]['Click_Through_Rate']
t_stat, p_val = ttest_ind(group1, group2)
p_values.append(p_val)
Progettazione Sperimentale in Python

Applicare la correzione di Bonferroni

p_adjusted = multipletests(p_values, alpha=0.05, method='bonferroni')

print(f"Adjusted P-values: {p_adjusted[1]}")
Adjusted P-values: [5.33634403e-133 2.17627991e-043 5.62590083e-029]
Progettazione Sperimentale in Python

Passiamo alla pratica !

Progettazione Sperimentale in Python

Preparing Video For Download...