Analisi di potenza: dimensione del campione ed effetto

Progettazione Sperimentale in Python

James Chapman

Curriculum Manager, DataCamp

Introduzione alla dimensione dell'effetto

 

  • Dimensione dell'effetto: quantifica la differenza tra due gruppi

 

  • Cohen's d: misura standard della dimensione dell'effetto

Due piante trattate con fertilizzanti diversi sono cresciute a altezze diverse. Una freccia indica la differenza di altezza per rappresentare la dimensione dell'effetto.

Progettazione Sperimentale in Python

Il dataset: coinvolgimento nel videogioco

  • 60 partecipanti
    • 30 assegnati casualmente ad Action
    • 30 assegnati casualmente a Puzzle
video_game_data.head()
   Game_Genre  Engagement_Time
0      Action              5.1
1      Puzzle              4.4
2      Action              7.2
3      Action              5.3
4      Puzzle              2.7
Progettazione Sperimentale in Python

Calcolo della potenza: panoramica

  • Potenza: probabilità di rifiutare correttamente un'ipotesi nulla falsa: ($1 - \beta$)

    • Varia tra 0 e 1 (certezza nel rilevare un effetto reale)
  • Supponi effect_size=1 da dati storici

from statsmodels.stats.power import TTestIndPower
power_analysis = TTestIndPower()

power = power_analysis.solve_power(effect_size=1, nobs1=30, alpha=0.05) print(power)
0.9677082519951168
Progettazione Sperimentale in Python

Formula di Cohen's d

def cohens_d(group1, group2):

diff = group1.mean() - group2.mean() n1, n2 = len(group1), len(group2) var1, var2 = group1.var(), group2.var()
pooled_std = np.sqrt(((n1 - 1) * var1 + (n2 - 1) * var2) / (n1 + n2 - 2))
d = diff / pooled_std return d

Deviazione standard combinata: $\sigma_{p} = \sqrt{\frac{(n_1 - 1) \times \text{var}_1 + (n_2 - 1) \times \text{var}_2}{n_1 + n_2 - 2}}$

Progettazione Sperimentale in Python

Cohen's d sui dati dei videogiochi

action_times = video_game_data[video_game_data['Game_Genre'] == 'Action']['Engagement_Time']
puzzle_times = video_game_data[video_game_data['Game_Genre'] == 'Puzzle']['Engagement_Time']

d = cohens_d(action_times, puzzle_times) print(f"Cohen's d: {d}")
Cohen's d: 1.161524633221452
Progettazione Sperimentale in Python

Capire campione e potenza

  • Compromesso tra potenza e dimensione del campione
  • Campioni più grandi aumentano la potenza

Dimensione del campione vs. Potenza statistica.png

1 https://grabngoinfo.com/power-analysis-for-sample-size-using-python/
Progettazione Sperimentale in Python

Calcolo del campione nel contesto

  • Variabile risposta: engagement_time
from statsmodels.stats.power import TTestIndPower
power_analysis = TTestIndPower()
required_n = power_analysis.solve_power(effect_size=d, alpha=0.05, 
                                        power=0.99, ratio=1)
print(required_n)
28.237827708942007
Progettazione Sperimentale in Python

Visualizzare i campioni richiesti

import numpy as np
import matplotlib.pyplot as plt
effect_sizes = np.linspace(0.1, 0.8, 8)
sample_sizes = [power_analysis.solve_power(effect_size=es, alpha=0.05, power=0.99, 
                                           ratio=1) for es in effect_sizes]

plt.figure(figsize=(10, 6))
plt.plot(effect_sizes, sample_sizes, 'o-')
plt.title('Effect Size vs. Required Sample Size')
plt.xlabel('Effect Size (Cohen\'s d)')
plt.ylabel('Required Sample Size')
plt.grid(True)
plt.show()
Progettazione Sperimentale in Python

Visualizzare i campioni richiesti

Dimensione dell'effetto vs. dimensione del campione richiesta.png

Progettazione Sperimentale in Python

Passons à la pratique !

Progettazione Sperimentale in Python

Preparing Video For Download...