## **使用POST方法來爬取公開資訊觀測站上的財務報表**
### [公開資訊觀測站](https://mops.twse.com.tw/mops/web/index)，[ 公開資訊觀測站→彙總報表→財務報表→採用IFRSs後→綜合損益表](https://mops.twse.com.tw/mops/web/t163sb04)

In [None]:
# 可以去掉 python 輸出時，因為軟體版本所引起的警告的警告。
import warnings
warnings.filterwarnings('ignore')

In [None]:
import requests

# 以下 payload 內的 TYPEK, year, season等欄位內容需要做適當設定，說明如下：
# TYPEK(市場別) : 'sii'(上市)，'otc'(上櫃)，'rotc'(興櫃)，'pub'(公開發行)
# year(年度)：以國曆年度為輸入內容
# season(季別)：'01', '02', '03', '04' (第一季至第四季中任選擇一，字串中的'0'不可少)
payload = {
    'encodeURIComponent':'1',
    'step':'1',
    'firstin':'1',
    'off':'1',
    'isQuery':'Y',
    'TYPEK':'sii',
    'year':'109',
    'season':'04'
}

# 以下為 "公開資訊觀測站→彙總報表→財務報表→採用IFRSs後→綜合損益表" 的網頁網址
url_address = 'https://mops.twse.com.tw/mops/web/t163sb04' 

res_post = requests.post(url_address, data = payload)   # 使用 post 方法

res_post.encoding = 'utf-8'  # 為了能夠順利讓網頁中的中文字正確的呈現出來

print(res_post.text)

### **用 BeautifulSoup 來剖析並取出所有表格**

In [None]:
from bs4 import BeautifulSoup

soup = BeautifulSoup(res_post.text, 'html.parser')

_tables = soup.select("table[class='hasBorder']")  # 其 html 標籤為 <table class='hasBorder'>...</table>

print('總共有 %d 個表格！\n' % len(_tables)) # 顯示有多少個表格

#print(find_all_tables)

In [None]:
type(_tables)  # ResultSet class is a subclass of a list and not a Tag class

In [None]:
_tables

### **用 Pandas 資料科學套件來讀取爬出的表格**

In [None]:
import pandas as pd

tables = pd.read_html(str(_tables))

print('總共有 %d 個表格！\n' % len(tables)) # 顯示有多少個表格

print(tables)

### **試著依序讀出所抓取的表格，並看一下每一個表格**

In [None]:
df = tables[0]
df

In [None]:
tables[1]

In [None]:
tables[2]

In [None]:
tables[3]

In [None]:
tables[4]

In [None]:
tables[5]

### **將第三個表格內容取出來放入 Pandas DataFrame 內，並看一下表格上有哪一些欄位**** 

In [None]:
for name in tables[2].columns:
    
    print(name)

### **將索引值 index 起始值從預設的整數值 0 改從整數 1  開始**

In [None]:
df = pd.DataFrame(tables[2])

df.index += 1

df  # 顯示 df 表格

### Pandas Getting and setting options [[1]](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.set_option.html), [[2]](https://pandas.pydata.org/pandas-docs/stable/user_guide/options.html)

In [None]:
# Note: 更改 DataFrame 顯示的設定
# display.[line_width, max_categories, max_columns, max_colwidth, 
# max_info_columns, max_info_rows, max_rows, max_seq_items, memory_usage, multi_sparse, 
# notebook_repr_html, pprint_nest_depth, precision, show_dimensions]

pd.set_option('display.min_rows', 60)

pd.set_option('display.max_columns', len(tables[2].columns))

#pd.set_option('display.width', 1000)

df  # 顯示 df 表格