Combineer data van meerdere werkbladen

Financiële data importeren en beheren in Python

Stefan Jansen

Instructor

Combineer DataFrames

  • Concateneer of “stapel” een lijst pd.DataFrames
  • Syntaxis: pd.concat([amex, nasdaq, nyse])

NASDAQ-, NYSE- en AMEX-tabellen met dezelfde kolommen

Financiële data importeren en beheren in Python

Combineer DataFrames

  • Concateneer of “stapel” een lijst pd.DataFrames
  • Syntaxis: pd.concat([amex, nasdaq, nyse])

tabellen met axis = 0

Financiële data importeren en beheren in Python

Combineer DataFrames

  • Concateneer of “stapel” een lijst pd.DataFrames
  • Syntaxis: pd.concat([amex, nasdaq, nyse])

drie tabellen gecombineerd tot één lange tabel

Financiële data importeren en beheren in Python

Concateneer twee DataFrames

amex = pd.read_excel('listings.xlsx',
                     sheet_name='amex', 
                     na_values=['n/a'])

nyse = pd.read_excel('listings.xlsx', sheet_name='nyse', na_values=['n/a'])
pd.concat([amex, nyse]).info()
Int64Index: 3507 entries, 0 to 3146
Data columns (total 7 columns):
 #   Column                 Non-Null Count  Dtype  
 --  ------                 --------------  -----  
 0   Stock Symbol           3507 non-null   object 
...
Financiële data importeren en beheren in Python

Voeg een referentiekolom toe

amex['Exchange'] = 'AMEX' # Kolom toevoegen om bron te refereren
nyse['Exchange'] = 'NYSE'

listings = pd.concat([amex, nyse])
listings.head(2)
  Stock Symbol    ...      Exchange       
0         XXII    ...         AMEX    
1          FAX    ...         AMEX
Financiële data importeren en beheren in Python

Combineer drie DataFrames

xls = pd.ExcelFile('listings.xlsx')

exchanges = xls.sheet_names
# Maak lege lijst om DataFrames te verzamelen listings = []
for exchange in exchanges: listing = pd.read_excel(xls, sheet_name=exchange) # Voeg referentiekolom toe listing['Exchange'] = exchange # Voeg DataFrame toe aan lijst listings.append(listing)
# Lijst van DataFrames combined_listings = pd.concat(listings)
Financiële data importeren en beheren in Python

Combineer drie DataFrames

combined_listings.info()
Int64Index: 6674 entries, 0 to 3146
Data columns (total 8 columns):
 #   Column                 Non-Null Count  Dtype  
 --  ------                 --------------  -----  
 0   Stock Symbol           6674 non-null   object 
 1   Company Name           6674 non-null   object 
 2   Last Sale              6590 non-null   float64
 3   Market Capitalization  6674 non-null   float64
 4   IPO Year               2852 non-null   float64
 5   Sector                 5182 non-null   object 
 6   Industry               5182 non-null   object 
 7   Exchange               6674 non-null   object 
dtypes: float64(3), object(5)
Financiële data importeren en beheren in Python

Laten we oefenen!

Financiële data importeren en beheren in Python

Preparing Video For Download...