Döngüye alternatif: pandas

Verimli Python Kodu Yazmak

Logan Thomas

Scientific Software Technical Trainer, Enthought

print(baseball_df.head())
  Team League  Year   RS   RA   W    G  Playoffs
0  ARI     NL  2012  734  688  81  162         0
1  ATL     NL  2012  700  600  94  162         1
2  BAL     AL  2012  712  705  93  162         1
3  BOS     AL  2012  734  806  69  162         0
4  CHC     NL  2012  613  759  61  162         0
def calc_run_diff(runs_scored, runs_allowed):

    run_diff = runs_scored - runs_allowed

    return run_diff
Verimli Python Kodu Yazmak

Döngü ile skor farkları

run_diffs_iterrows = []

for i,row in baseball_df.iterrows():
    run_diff = calc_run_diff(row['RS'], row['RA'])
    run_diffs_iterrows.append(run_diff)

baseball_df['RD'] = run_diffs_iterrows
print(baseball_df)
     Team League  Year   RS   RA    W    G  Playoffs   RD
0     ARI     NL  2012  734  688   81  162         0   46
1     ATL     NL  2012  700  600   94  162         1  100
2     BAL     AL  2012  712  705   93  162         1    7
...
Verimli Python Kodu Yazmak

pandas .apply() yöntemi

  • Bir fonksiyonu alır ve DataFrame’e uygular
    • Uygulanacak ekseni belirtiniz (0 sütunlar; 1 satırlar)
  • Anonim fonksiyonlarla (lambda) kullanılabilir
  • Örnek:
baseball_df.apply(

lambda row: calc_run_diff(row['RS'], row['RA']),
axis=1 )
Verimli Python Kodu Yazmak

apply() ile skor farkları

run_diffs_apply = baseball_df.apply(
         lambda row: calc_run_diff(row['RS'], row['RA']),
         axis=1)

baseball_df['RD'] = run_diffs_apply print(baseball_df)
     Team League  Year   RS   RA    W    G  Playoffs   RD
0     ARI     NL  2012  734  688   81  162         0   46
1     ATL     NL  2012  700  600   94  162         1  100
2     BAL     AL  2012  712  705   93  162         1    7
...
Verimli Python Kodu Yazmak

Yaklaşımların karşılaştırılması

%%timeit
run_diffs_iterrows = []

for i,row in baseball_df.iterrows():
    run_diff = calc_run_diff(row['RS'], row['RA'])
    run_diffs_iterrows.append(run_diff)

baseball_df['RD'] = run_diffs_iterrows
Döngü başına 86.8 ms ± 3 ms (7 çalıştırmanın ort. ± std. sap., her biri 10 döngü)
Verimli Python Kodu Yazmak

Yaklaşımların karşılaştırılması

%%timeit
run_diffs_apply = baseball_df.apply(
         lambda row: calc_run_diff(row['RS'], row['RA']),
         axis=1)

baseball_df['RD'] = run_diffs_apply
Döngü başına 30.1 ms ± 1.75 ms (7 çalıştırmanın ort. ± std. sap., her biri 10 döngü)
Verimli Python Kodu Yazmak

pandas .apply() yöntemini kullanalım!

Verimli Python Kodu Yazmak

Preparing Video For Download...