Pemasukan Data yang Efisien dengan pandas
Amany Mahfouz
Instructor
read_excel() memuat sheet pertama secara defaultsheet_name untuk memuat sheet lainread_excel() berlaku untuk semua sheet yang dibaca
# Ambil sheet kedua berdasarkan indeks posisi survey_data_sheet2 = pd.read_excel('fcc_survey.xlsx', sheet_name=1)# Ambil sheet kedua berdasarkan nama survey_data_2017 = pd.read_excel('fcc_survey.xlsx', sheet_name='2017')print(survey_data_sheet2.equals(survey_data_2017))
True
sheet_name=None ke read_excel() akan membaca semua sheet dalam workbooksurvey_responses = pd.read_excel("fcc_survey.xlsx", sheet_name=None)
print(type(survey_responses))
<class 'collections.OrderedDict'>
for key, value in survey_responses.items():
print(key, type(value))
2016 <class 'pandas.core.frame.DataFrame'>
2017 <class 'pandas.core.frame.DataFrame'>
# Buat dataframe kosong untuk menampung semua sheet yang dimuat all_responses = pd.DataFrame()# Iterasi dataframe dalam dictionary for sheet_name, frame in survey_responses.items(): # Tambah kolom agar tahu tahun asal data frame["Year"] = sheet_name# Tambahkan dataframe ke all_responses all_responses = pd.concat([all_responses, frame])# Lihat tahun dalam data print(all_responses.Year.unique())
['2016' '2017']
Pemasukan Data yang Efisien dengan pandas