Optimal pandas yineleme

Verimli Python Kodu Yazmak

Logan Thomas

Scientific Software Technical Trainer, Enthought

pandas’ın iç yapısı

  • Döngüleri kaldırmak pandas için de geçerlidir
  • pandas, NumPy üzerine kuruludur
    • NumPy dizi verimliliklerinden yararlanın

alt=”üzerinde pandas kütüphanesi logosu, onun altında NumPy paket logosu, onun altında Python programlama dili logosu; pandas’tan NumPy’ye 'Üzerine kurulu' yazılı bir çizgi ve NumPy’den Python’a 'Üzerine kurulu' yazılı bir çizgi”

Verimli Python Kodu Yazmak
print(baseball_df)
  Team League  Year   RS   RA   W    G  Playoffs
0  ARI     NL  2012  734  688  81  162         0
1  ATL     NL  2012  700  600  94  162         1
2  BAL     AL  2012  712  705  93  162         1
...
wins_np = baseball_df['W'].values

print(type(wins_np))
<class 'numpy.ndarray'>
print(wins_np)
[ 81  94  93 ...]
Verimli Python Kodu Yazmak

Vektörleştirmenin gücü

  • Yayılım (vektörleştirme) son derece verimlidir!
baseball_df['RS'].values - baseball_df['RA'].values
array([  46,  100,    7, ...,  188,  110, -117])
Verimli Python Kodu Yazmak

Diziyle koşu farkları

run_diffs_np = baseball_df['RS'].values - baseball_df['RA'].values

baseball_df['RD'] = run_diffs_np print(baseball_df)
     Team League  Year   RS   RA    W    G  Playoffs   RD
0     ARI     NL  2012  734  688   81  162         0   46
1     ATL     NL  2012  700  600   94  162         1  100
2     BAL     AL  2012  712  705   93  162         1    7
3     BOS     AL  2012  734  806   69  162         0  -72
4     CHC     NL  2012  613  759   61  162         0 -146
...
Verimli Python Kodu Yazmak

Yaklaşımları karşılaştırma

%%timeit
run_diffs_np = baseball_df['RS'].values - baseball_df['RA'].values

baseball_df['RD'] = run_diffs_np
124 µs ± 1.47 µs döngü başına (7 çalıştırmanın ort. ± std. sap., her biri 10000 döngü)
Verimli Python Kodu Yazmak

Becerilerimizi uygulayalım!

Verimli Python Kodu Yazmak

Preparing Video For Download...