# 基本的網頁請求，先打通關

## 步驟
- 請求目標網址。
- 設定編碼為`utf-8`。
- 設定header避免被誤以為是機器人請求。
- 印出資訊。


## 注意事項
- Goodinfo為了防止機器人，因此會對於非瀏覽器的請求進行Reject， 假設我們沒有設定header的狀況之下會吐出以下的訊息。
```
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">請勿透過網站內容下載軟體查詢本網站
```
  - 通常阻檔爬蟲的方式都是檢查標頭內的User Agent，此時我們只要模擬瀏覽器的User Agent即可進行操作。

In [None]:
import requests
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'
}
res = requests.get('https://goodinfo.tw/tw/StockBzPerformance.asp?STOCK_ID=3231', headers = headers)
res.encoding = 'utf-8'
res.text

# 使用BeautifulSoap進行解析
## 步驟
- 分析抓取的html區塊目標: 使用Network工具。
- 引入套件。
- 宣告解析器。
- 抓取目標ID。


In [None]:
from bs4 import BeautifulSoup
bs = BeautifulSoup(res.text, 'html.parser')
data = bs.select_one('#tblDetail')
print(data)

<table class="b1 p4_2 r0_10 row_bg_2n row_mouse_over" id="tblDetail" style="width:100%;font-size:10pt;line-height:17px;"><tr class="bg_h2" style="font-weight:bold;text-align:center;"><th rowspan="2"><nobr>年度</nobr></th><th rowspan="2"><nobr>股本<br/>(億)</nobr></th><th rowspan="2"><nobr>財報<br/>評分</nobr></th><th colspan="4"><nobr>年度股價(元)</nobr></th><th colspan="5"><nobr>獲利金額(億)</nobr></th><th colspan="4"><nobr>獲利率(%)</nobr></th><th rowspan="2"><nobr>ROE<br/>(%)</nobr></th><th rowspan="2"><nobr>ROA<br/>(%)</nobr></th><th colspan="2"><nobr>EPS(元)</nobr></th><th rowspan="2"><nobr>BPS<br/>(元)</nobr></th></tr><tr class="bg_h2" style="font-weight:bold;text-align:center;"><th><nobr>收盤</nobr></th><th title="年度平均收盤價"><nobr>平均</nobr></th><th><nobr>漲跌</nobr></th><th><nobr>漲跌<br/>(%)</nobr></th><th><nobr>營業<br/>收入</nobr></th><th><nobr>營業<br/>毛利</nobr></th><th><nobr>營業<br/>利益</nobr></th><th><nobr>業外<br/>損益</nobr></th><th><nobr>稅後<br/>淨利</nobr></th><th><nobr>營業<br/>毛利</nobr></th><th><nobr>營業<br/>利益</nob

# 使用Pandas進行資料分析
## 步驟
- 引入套件。
- 剖析html。
- 取到正確的節點: 這邊僅能不斷的試誤，先設法統計幾個節點，再印出某個節點查看是否為我們需要的資訊。

In [None]:
import pandas
dfs = pandas.read_html(data.prettify())
node = dfs[0]
node.head()


Unnamed: 0_level_0,年度,股本 (億),財報 評分,年度股價(元),年度股價(元),年度股價(元),年度股價(元),獲利金額(億),獲利金額(億),獲利金額(億),獲利金額(億),獲利金額(億),獲利率(%),獲利率(%),獲利率(%),獲利率(%),ROE (%),ROA (%),EPS(元),EPS(元),BPS (元)
Unnamed: 0_level_1,年度,股本 (億),財報 評分,收盤,平均,漲跌,漲跌 (%),營業 收入,營業 毛利,營業 利益,...,稅後 淨利,營業 毛利,營業 利益,業外 損益,稅後 淨利,ROE (%),ROA (%),稅後 EPS,年增 (元),BPS (元)
0,22Q3,290,34,27.25,28.0,-1.9,-6.5,7208,471,168,...,70.9,6.53,2.33,-0.04,1.76,16.4 (年估),3.49 (年估),2.55,0.72,33.15
1,2021,290,32,29.15,30.0,-1.85,-6.0,8621,511,164,...,105.0,5.93,1.9,0.33,1.71,16.7,3.18,3.76,0.66,27.39
2,2020,284,38,31.0,29.6,2.65,9.3,8450,461,145,...,86.8,5.45,1.71,0.28,1.53,15.4,3.34,3.1,0.7,25.73
3,2019,284,34,28.35,24.5,9.25,48.4,8783,422,133,...,68.0,4.8,1.51,-0.06,1.11,12.4,2.85,2.4,0.64,26.03
4,2018,284,34,19.1,22.0,-4.85,-20.3,8895,376,108,...,49.1,4.22,1.21,-0.12,0.82,10.4,2.19,1.76,0.28,24.47
