Meerdere aandelen ophalen & een MultiIndex beheren

Financiële data importeren en beheren in Python

Stefan Jansen

Instructor

Data voor meerdere aandelen ophalen

  • Gebruik de listinginfo om meerdere aandelen te selecteren
    • Bijv. grootste 3 per sector
  • Gebruik Yahoo! Finance om data voor meerdere aandelen op te halen
  • Leer een pandas-MultiIndex beheren: handig voor complexere datasets
Financiële data importeren en beheren in Python

Prijzen laden voor top 5 bedrijven

nasdaq = pd.read_excel('listings.xlsx', sheet_name='nasdaq', na_values='n/a')

nasdaq.set_index('Stock Symbol', inplace=True)
top_5 = nasdaq['Market Capitalization'].nlargest(n=5) # Top 5 top_5.div(1000000) # marktkap in miljoen USD
AAPL     740024.467000
GOOG     569426.124504
...      ...
Name: Market Capitalization, dtype: float64
tickers = top_5.index.tolist() # index naar lijst
['AAPL', 'GOOG', 'MSFT', 'AMZN', 'FB']
Financiële data importeren en beheren in Python

Prijzen laden voor top 5 bedrijven

df = DataReader(tickers, 'yahoo', start=date(2020, 1, 1))
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 712 entries, 2020-01-02 to 2022-10-27
Data columns (total 30 columns):
 #   Column             Non-Null Count  Dtype  
 --  ------             --------------  -----  
 0   (Adj Close, AAPL)  712 non-null    float64
 1   (Adj Close, GOOG)  712 non-null    float64
 2   (Adj Close, MSFT)  712 non-null    float64
...
 28  (Volume, AMZN)     712 non-null    float64
 29  (Volume, FB)       253 non-null    float64
dtypes: float64(30)
memory usage: 172.4 KB
df = df.stack()
Financiële data importeren en beheren in Python

Prijzen laden voor top 5 bedrijven

df.info()
MultiIndex: 3101 entries, (Timestamp('2020-01-02 00:00:00'), 'AAPL') to (Timestamp('2022-10-27 00:00:00'), 'FB')
Data columns (total 6 columns):
 #   Column     Non-Null Count  Dtype  
 --  ------     --------------  -----  
 0   Adj Close  3101 non-null   float64
...
Financiële data importeren en beheren in Python

Hervorm je data: .unstack()

unstacked = df['Close'].unstack()
unstacked.info()
DatetimeIndex: 712 entries, 2020-01-02 to 2022-10-27
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
 --  ------  --------------  -----  
 0   AAPL    712 non-null    float64
 1   GOOG    712 non-null    float64
 2   MSFT    712 non-null    float64
 3   AMZN    712 non-null    float64
 4   FB      253 non-null    float64
dtypes: float64(5)
memory usage: 33.4 KB
Financiële data importeren en beheren in Python

Van lang naar breed formaat

unstacked = df['Close'].unstack() # Resultaat is DataFrame

unstack-diagram

Financiële data importeren en beheren in Python

Aandelenkoersen: visualisatie

unstacked.plot(subplots=True)
plt.tight_layout(); plt.show()

deelplots

Financiële data importeren en beheren in Python

Laten we oefenen!

Financiële data importeren en beheren in Python

Preparing Video For Download...