import pandas as pd
import os
path = os.getcwd()
"""
相關檔案可參考以下網址下載:
https://depart.moe.edu.tw/ED4500/News_Content.aspx?n=5A930C32CC6C3818&sms=91B3AAE8C6388B96&s=596D9D77281BE257
"""
# List files:
files = os.listdir(path)
# 印出目錄下所有檔案名稱
print(files)
# 選擇檔案名稱第4-10碼為「student」的檔案
files_xls = [f for f in files if f[4:11] == 'student']
print(files_xls)
In [2]:
df = pd.DataFrame()
for f in files_xls:
# 批次讀入excel檔,從第3列開始
data = pd.read_excel(f, skiprows = 2)
# 新增「學年」欄位
data['學年'] = int(f[:3])
df = df.append(data)
df
Out[2]:
In [3]:
df = df[['學校代碼', '學年', '學校名稱', '等級別', '總計']]
df.head()
Out[3]:
In [4]:
df = df.groupby(['學校代碼', '學校名稱', '學年']).sum()
df
Out[4]:
In [5]:
df = df.unstack(2)
df
Out[5]:
In [ ]:
沒有留言:
張貼留言