# [requests](https://requests.readthedocs.io/en/master/user/quickstart/)

In [1]:
import requests # 讀取網頁資料
from bs4 import BeautifulSoup

## HTTP 請求
### [參考資料](https://blog.gtwang.org/programming/python-requests-module-tutorial/)

* `requests.get('url')`
* `requests.post("url", data={'key':'value'})`
* `requests.put("url", data ={'key':'value'})`
* `requests.delete("url")`
* `requests.head("url")`
* `requests.options("url")`

### `requests.get('url'))` GET 方法

* r = Response 對象

|||
|:---|---:|
|`R.headers`| 標頭檔資訊 |
|`R.encoding`| 編碼格式 ('utf-8') |
|`R.reason`| 回應 (OK) |
|`R.url`| 讀取網址 |
|`R.request`| Method 請求方法 (GET, POST) |
|`R.ok`| 是否OK (bool) |
|`R.status_code`| 網頁狀態 (200, 404...) |

* 其他應用範例

    * 傳遞參數網址
>```python
my_params = {'key1': 'val1', 'key2': 'val2'} # 查詢參數
r = requests.get('http://test.com.tw', params=my_params) # (http://test.com.tw/?key1=val1&key2=val2)
```

    * 自訂標頭 (Request Headers) 欺騙伺服器是人類使用瀏覽器上網
>``` python
my_headers = {'ser-agent'='Mozilla/5.0}
r = requests.get('http://test.com.tw', headers=my_headers, timeout=3) # GET 請求
```

    * 帳號登入 
>```python
r = requests.get('http://test.com.tw', auth=('user', 'pass'), timeout=3)) # 需要帳號登入的網頁
```


### [破解反爬蟲技巧](https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/114511/)
### 自定製 Requests Headers

* `user-agent`:裡面儲存的是系統和瀏覽器的型號版本，通過修改它來假裝自己是人。
* `referer`:告訴伺服器你是通過哪個網址點進來的而不是憑空出現的，有些網站會檢查。
* `cookie`:有時帶不帶餅乾得到的結果是不同的，試著帶餅乾去“賄賂”伺服器讓她給你完整的資訊。

In [2]:
url = 'https://sci2fig.herokuapp.com/func'
headers = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64)'}

r = requests.get(url, headers=headers) #將url網頁資料GET下來

In [3]:
def print_requests(r):
    print('request     :', r.request)
    print('url         :', r.url)
    print('status_code :', r.status_code)
    print('reason      :', r.reason)
    print('ok?         :', r.ok)
    print('encoding    :', r.encoding, '\n')

In [4]:
print_requests(r)

request     : <PreparedRequest [GET]>
url         : https://sci2fig.herokuapp.com/func
status_code : 200
reason      : OK
ok?         : True
encoding    : utf-8 



### 網頁內容

|||
|:---|---:|
|`R.content`| 網頁內容 (未解碼 二進制) |
|`R.text`| 網頁內容 (已解碼) |

In [5]:
rc = r.content
rt = r.text
print('type to rc:', type(rc))
print('type to rt:', type(rt))

type to rc: <class 'bytes'>
type to rt: <class 'str'>


#### 解碼即可還原

In [6]:
rc.decode(encoding=r.encoding) == rt

True

### 網頁內容是 html 格式

In [7]:
print(rt)

<!DOCTYPE html>
<html lang="" dir="ltr">

<head>
  
  <title>
    
Func2Fig

  </title>
  <link rel="icon" type="image/png" href="./static/image/fig.png">
  
</head>

<body bgcolor="#a3c6e9">

  <div id="content">
    
<h1><i>Func2Fig</i></h1>
<form action="/func" method="post">
  <div id="func_setting">
    <h2>func setting</h2>
    <i><b>y(x)=</b></i>
    <input type="text" name="func" id="func" style="width: 400px; height: 30px;" value="" placeholder="sin(x^(2*π))">
    
    
    
    <br><!-- onclick HTML5標準事件 -->
    <button type="button" id="num7" value="7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;">7</button>
    <button type="button" id="num8" value="8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;">8</button>
    <button type="button" id="num9" value="9" onclick="func.value+=num9.value" style="width: 40px; height: 40px;">9</button>
    <button type="button" id="divide" value="/" onclick="func.value+=divide.value" style="width: 40px

### 超時響應 timeout (s) 通常設定3秒即可

In [8]:
t = 3
# t = 0.01
try:
    r = requests.get(url, timeout=t)
    print('success')
except:
    print('error')

success


# [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/bs4/doc/)

* `bs4.BeautifulSoup`
* 解讀網頁標籤的小幫手
* `BeautifulSoup`物件, 由很多`bs4.element.Tag`物件(Tag)組成

In [9]:
url = 'https://sci2fig.herokuapp.com/func'
r = requests.get(url) #將url網頁資料GET下來
soup = BeautifulSoup(r.text, 'html.parser') #將網頁資料以html.parser
print('type of soup: ', type(soup))

type of soup:  <class 'bs4.BeautifulSoup'>


### 有縮排的版面 (str)

In [10]:
print(soup.prettify())

<!DOCTYPE html>
<html dir="ltr" lang="">
 <head>
  <title>
   Func2Fig
  </title>
  <link href="./static/image/fig.png" rel="icon" type="image/png"/>
 </head>
 <body bgcolor="#a3c6e9">
  <div id="content">
   <h1>
    <i>
     Func2Fig
    </i>
   </h1>
   <form action="/func" method="post">
    <div id="func_setting">
     <h2>
      func setting
     </h2>
     <i>
      <b>
       y(x)=
      </b>
     </i>
     <input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>
     <br/>
     <!-- onclick HTML5標準事件 -->
     <button id="num7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;" type="button" value="7">
      7
     </button>
     <button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">
      8
     </button>
     <button id="num9" onclick="func.value+=num9.value" style="width: 40px; height: 40px;" type="button" value="9">
      9
     </button>
     <

### 直接取用屬性, 找到第一個Tag

In [11]:
print('type of soup.a: ', type(soup.a))

type of soup.a:  <class 'bs4.element.Tag'>


In [12]:
print(soup.h1)
print(soup.link)
print(soup.b)

<h1><i>Func2Fig</i></h1>
<link href="./static/image/fig.png" rel="icon" type="image/png"/>
<b>y(x)=</b>


#### 大Tag 中的小 Tag

In [13]:
soup.h1.i

<i>Func2Fig</i>

#### Tag 的 name 屬性

In [14]:
soup.a.name

'a'

#### .children 子標籤 (產生器 同 `range()`)

In [15]:
for child in soup.form.children:
    print(child)



<div id="func_setting">
<h2>func setting</h2>
<i><b>y(x)=</b></i>
<input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>
<br/><!-- onclick HTML5標準事件 -->
<button id="num7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;" type="button" value="7">7</button>
<button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">8</button>
<button id="num9" onclick="func.value+=num9.value" style="width: 40px; height: 40px;" type="button" value="9">9</button>
<button id="divide" onclick="func.value+=divide.value" style="width: 40px; height: 40px;" type="button" value="/">÷</button>
<button id="sin" onclick="func.value+=sin.value" style="width: 50px; height: 40px;" type="button" value="sin("><i>sin</i></button>
<button id="cos" onclick="func.value+=cos.value" style="width: 50px; height: 40px;" type="button" value="cos("><i>cos</i></button>
<button id="tan" onclick="func.valu

### 取得 Tag 中的文字內容
* `Tag.string`
* `Tag.get_text()`
* 實做上兩者略有不同 `Tag.get_text()` 優先

In [16]:
tag = soup.h1
print(type(tag.string))
tag.get_text() == tag.string


<class 'bs4.element.NavigableString'>


True

#### 更改Tag.name 等於修改了 soup本身

In [17]:
soup.a.name = 'pool'

In [18]:
soup.find('pool')

<pool href="http://web.ift.uib.no/Teori/KURS/WRK/TeX/symALL.html">LaTeX</pool>

### Tag 的 屬性取用 `['key']`  or `.get('key')`

*  `['key']` 若是沒有屬性會報錯
* `.get('key')` 沒有屬性 回傳None


In [19]:
print(soup.button, '\n')
print("soup.button['id']:    ", soup.button['id'])
print("soup.button.get('type'):  ", soup.button.get('type'))
print("soup.button.get('Qoo'): ", soup.button.get('Qoo'))

<button id="num7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;" type="button" value="7">7</button> 

soup.button['id']:     num7
soup.button.get('type'):   button
soup.button.get('Qoo'):  None


### 用.attrs 取得所有屬性(dict)

In [20]:
soup.button.attrs

{'type': 'button',
 'id': 'num7',
 'value': '7',
 'onclick': 'func.value+=num7.value',
 'style': 'width: 40px; height: 40px;'}

### 找到所有的 Tag (list)
* `soup.find_all('Tag')` 專住在標籤的搜尋 輸出 list
* `soup.select('Tag')` 可以作為內容, 例如屬性上的搜尋 (CSS)


In [21]:
soup.find_all('a')

[<a href="/">Home</a>,
 <a href="https://www.buymeacoffee.com/sci2fig" target="_blank">
 <img alt="Buy Me A Sandwich" src="https://bmc-cdn.nyc3.digitaloceanspaces.com/BMC-button-images/custom_images/orange_img.png" style="height: auto !important;width: auto !important;"/>
 </a>]

In [22]:
soup.select('a') == soup.find_all('a')

True

### find_all() 功能詳解

|||
|:---|---:|
|`.find_all('tag')` |選取tag|
|`.find_all('tag1', 'tag2')`|tag1 中 子tag2|
|`.find_all(['tag1', 'tag'])` |多個tag選取|
|`.find_all(id='value')` |指定id 屬性的tag|
|`.find_all(id=True)` |有id 屬性的tags|
|`.find_all(attrs={'屬性1':'value1', '屬性2':'value2'})` |指定多個屬性的tag|
|`.find_all('tag', {'class':'value'})` |指定class屬性的tags|
|`.find_all('tag', {'class':{'value1', 'values2'}})` |指定多個class屬性的tags|
|`.find_all('tag', limit=n)`|限制搜尋數目|

In [23]:
soup.find_all('b')

[<b>y(x)=</b>,
 <b><i>x</i></b>,
 <b><i>π</i></b>,
 <b><i>e</i></b>,
 <b>Fig now</b>,
 <b>reset</b>]

In [24]:
soup.find_all(['a', 'b'])

[<b>y(x)=</b>,
 <b><i>x</i></b>,
 <b><i>π</i></b>,
 <b><i>e</i></b>,
 <b>Fig now</b>,
 <b>reset</b>,
 <a href="/">Home</a>,
 <a href="https://www.buymeacoffee.com/sci2fig" target="_blank">
 <img alt="Buy Me A Sandwich" src="https://bmc-cdn.nyc3.digitaloceanspaces.com/BMC-button-images/custom_images/orange_img.png" style="height: auto !important;width: auto !important;"/>
 </a>]

In [25]:
soup.find_all(id='func')

[<input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>]

In [26]:
soup.find_all(id=True)

[<div id="content">
 <h1><i>Func2Fig</i></h1>
 <form action="/func" method="post">
 <div id="func_setting">
 <h2>func setting</h2>
 <i><b>y(x)=</b></i>
 <input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>
 <br/><!-- onclick HTML5標準事件 -->
 <button id="num7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;" type="button" value="7">7</button>
 <button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">8</button>
 <button id="num9" onclick="func.value+=num9.value" style="width: 40px; height: 40px;" type="button" value="9">9</button>
 <button id="divide" onclick="func.value+=divide.value" style="width: 40px; height: 40px;" type="button" value="/">÷</button>
 <button id="sin" onclick="func.value+=sin.value" style="width: 50px; height: 40px;" type="button" value="sin("><i>sin</i></button>
 <button id="cos" onclick="func.value+=cos.value" style="width: 50px; heigh

In [27]:
soup.find_all(attrs={'name':"func"})

[<input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>]

In [28]:
print(soup.prettify())

<!DOCTYPE html>
<html dir="ltr" lang="">
 <head>
  <title>
   Func2Fig
  </title>
  <link href="./static/image/fig.png" rel="icon" type="image/png"/>
 </head>
 <body bgcolor="#a3c6e9">
  <div id="content">
   <h1>
    <i>
     Func2Fig
    </i>
   </h1>
   <form action="/func" method="post">
    <div id="func_setting">
     <h2>
      func setting
     </h2>
     <i>
      <b>
       y(x)=
      </b>
     </i>
     <input id="func" name="func" placeholder="sin(x^(2*π))" style="width: 400px; height: 30px;" type="text" value=""/>
     <br/>
     <!-- onclick HTML5標準事件 -->
     <button id="num7" onclick="func.value+=num7.value" style="width: 40px; height: 40px;" type="button" value="7">
      7
     </button>
     <button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">
      8
     </button>
     <button id="num9" onclick="func.value+=num9.value" style="width: 40px; height: 40px;" type="button" value="9">
      9
     </button>
     <

### [select() 功能詳解](https://ithelp.ithome.com.tw/articles/10204390)

|||
|:---|---:|
|`.select('tag')` |普通標籤|
|`.select('#id')` |id 有唯一性|
|`.select('.class')` |搜尋class|
|`.select('[attributes]')` |搜尋屬性|
|組合搜尋||
|`.select('a#id')` |Tag_a 中的 id ... 依此類推|
|`.select('body a ')` |body( 空白 )a ... 依此類推|
|`.select('xxx', 'yyy')` |多條件搜尋|

In [29]:
soup.select('#num8')

[<button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">8</button>]

In [30]:
soup.select('button#num8')

[<button id="num8" onclick="func.value+=num8.value" style="width: 40px; height: 40px;" type="button" value="8">8</button>]

In [31]:
soup.select('[href]')[0]

<link href="./static/image/fig.png" rel="icon" type="image/png"/>

In [32]:
soup.select('[href="/"]')

[<a href="/">Home</a>]

In [33]:
soup.select('body div#content input[name="c"]')

[<input name="c" type="color" value="#000000"/>]

In [34]:
soup.select('body a[href="/"]')

[<a href="/">Home</a>]

### text屬性獲取網頁的文本
* 屬性 `.text`
* 函式 `.get_text()`

In [35]:
soup.text == soup.get_text()

True

## 遇到按鈕(POST)

* [八卦板](https://www.ptt.cc/bbs/Gossiping/index.html)
* 方法1 假裝使用者按下Over18 按鈕, 並用requests.Session() 保留伺服器回傳的Cookies
* 方法2 假裝是按過按鈕的使用者帶上Cooklies
    * 觀察已經按鈕的Cookeies (Chrome F12 -> Application -> Cooklies)
    * 在 Request Headers (Chrome F12 -> Network)放入需要的Cookles
  
![Cookies](./Cookies.png)
![header](./rq_header.png)

### WAY 1

In [36]:
url = 'https://www.ptt.cc/bbs/Gossiping/index.html'
r = requests.get(url)
print_requests(r)

print('被轉到了確認18禁頁面:\n', r.url)
url2 = r.url

request     : <PreparedRequest [GET]>
url         : https://www.ptt.cc/ask/over18?from=%2Fbbs%2FGossiping%2Findex.html
status_code : 200
reason      : OK
ok?         : True
encoding    : utf-8 

被轉到了確認18禁頁面:
 https://www.ptt.cc/ask/over18?from=%2Fbbs%2FGossiping%2Findex.html


### 尋找原始碼中的form 確定我們要送出的資料

* `<form>` 中 有一個隱藏input 和兩個上傳button

* `<input>` 
    * name="from"
    * value="/bbs/Gossiping/index.html"
* `<button>`
    * name="yes"
    * value="yes"

In [37]:
soup = BeautifulSoup(r.text, 'html.parser')
soup.select('form')

[<form action="/ask/over18" method="post">
 <input name="from" type="hidden" value="/bbs/Gossiping/index.html"/>
 <div class="over18-button-container">
 <button class="btn-big" name="yes" type="submit" value="yes">我同意，我已年滿十八歲<br/><small>進入</small></button>
 </div>
 <div class="over18-button-container">
 <button class="btn-big" name="no" type="submit" value="no">未滿十八歲或不同意本條款<br/><small>離開</small></button>
 </div>
 </form>]

### `requests.Session()` 可以儲存本身cookie

In [38]:
r = requests.Session()
payload ={"from":"/bbs/Gossiping/index.html", 
          "yes":"yes"}

r.post(url2, data=payload) # 按按鈕的動作 保留Cookies
r2 = r.get(url)

### 順利進入需要十八禁的八卦板

In [39]:
soup = BeautifulSoup(r2.text, 'html.parser')
for a in soup.find_all('a'):
    print(a.get_text())

批踢踢實業坊
看板 Gossiping
關於我們
聯絡資訊
看板
精華區
最舊
‹ 上頁
下頁 ›
最新
[問卦] 蜂蜜水會壞嗎？
搜尋同標題文章
搜尋看板內 Axwell 的文章
[爆卦] 疾管署開記者會了!!武漢肺炎
搜尋同標題文章
搜尋看板內 sober716 的文章
[問卦] 武漢起疫，中華民國能守多久？
搜尋同標題文章
搜尋看板內 xxxcv 的文章
[問卦] 還有誰說要發雞排到現在還沒發的？
搜尋同標題文章
搜尋看板內 opemhood 的文章
Re: [新聞] 移送統促黨被否決 時力主席嗆民進黨：芒
搜尋同標題文章
搜尋看板內 simonjen 的文章
[新聞] 潤寅詐貸386億 楊文虎在美被逮下午遣返回
搜尋同標題文章
搜尋看板內 yuee 的文章
[新聞] 楊蕙如網軍戰術曝光：嘴砲後有記者會抄
搜尋同標題文章
搜尋看板內 Aliensoul 的文章
[新聞] 工程師買新房 邀女友人參觀竟獸性大發強
搜尋同標題文章
搜尋看板內 LIN9 的文章
[問卦] 再啦幹 是誰？
搜尋同標題文章
搜尋看板內 bebehome 的文章
[問卦] VR設備買那一款才不會後悔？
搜尋同標題文章
搜尋看板內 ben28 的文章
[問卦] 瘟疫公司地圖上沒有台灣???
搜尋同標題文章
搜尋看板內 TS28 的文章
[問卦] 現在發正念還得及嗎
搜尋同標題文章
搜尋看板內 poeta 的文章
[問卦] 武漢肺炎和香港反送中被捕人數誰快？
搜尋同標題文章
搜尋看板內 yayaya5566 的文章
[問卦] 唉！喜歡一個人，真的藏不住！
搜尋同標題文章
搜尋看板內 Kyle5566 的文章
[問卦] 吃果子 要懂得 拜樹頭 
搜尋同標題文章
搜尋看板內 j955369 的文章
Re: [問卦] 是不是有新芒果乾了？
搜尋同標題文章
搜尋看板內 monkey0817 的文章
[公告] 八卦板板規(2019.08.21)
搜尋同標題文章
搜尋看板內 arsonlolita 的文章
[公告] 赤鴻飛羽，一月份置底閒聊文
搜尋同標題文章
搜尋看板內 Bignana 的文章
[協尋] 高雄左營區 行車記錄器 
搜尋同標題文章
搜尋看板內 arsonlolita 的文章
[協尋] 台灣大道 民權路口車禍
搜尋同標題文章
搜尋看板內 bonnie890319 的文章
[協尋］1/18早上8

### WAY 2

In [40]:
url = 'https://www.ptt.cc/bbs/Gossiping/index.html'
headers = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64)', 
          'cookie':'over18=1'} # 放入Over18
r = requests.get(url, headers=headers)
print_requests(r)

request     : <PreparedRequest [GET]>
url         : https://www.ptt.cc/bbs/Gossiping/index.html
status_code : 200
reason      : OK
ok?         : True
encoding    : utf-8 



In [41]:
soup = BeautifulSoup(r.text, 'html.parser')
for a in soup.find_all('a'):
    print(a.get_text())

批踢踢實業坊
看板 Gossiping
關於我們
聯絡資訊
看板
精華區
最舊
‹ 上頁
下頁 ›
最新
[問卦] 蜂蜜水會壞嗎？
搜尋同標題文章
搜尋看板內 Axwell 的文章
[爆卦] 疾管署開記者會了!!武漢肺炎
搜尋同標題文章
搜尋看板內 sober716 的文章
[問卦] 武漢起疫，中華民國能守多久？
搜尋同標題文章
搜尋看板內 xxxcv 的文章
[問卦] 還有誰說要發雞排到現在還沒發的？
搜尋同標題文章
搜尋看板內 opemhood 的文章
Re: [新聞] 移送統促黨被否決 時力主席嗆民進黨：芒
搜尋同標題文章
搜尋看板內 simonjen 的文章
[新聞] 潤寅詐貸386億 楊文虎在美被逮下午遣返回
搜尋同標題文章
搜尋看板內 yuee 的文章
[新聞] 楊蕙如網軍戰術曝光：嘴砲後有記者會抄
搜尋同標題文章
搜尋看板內 Aliensoul 的文章
[新聞] 工程師買新房 邀女友人參觀竟獸性大發強
搜尋同標題文章
搜尋看板內 LIN9 的文章
[問卦] 再啦幹 是誰？
搜尋同標題文章
搜尋看板內 bebehome 的文章
[問卦] VR設備買那一款才不會後悔？
搜尋同標題文章
搜尋看板內 ben28 的文章
[問卦] 瘟疫公司地圖上沒有台灣???
搜尋同標題文章
搜尋看板內 TS28 的文章
[問卦] 現在發正念還得及嗎
搜尋同標題文章
搜尋看板內 poeta 的文章
[問卦] 武漢肺炎和香港反送中被捕人數誰快？
搜尋同標題文章
搜尋看板內 yayaya5566 的文章
[問卦] 唉！喜歡一個人，真的藏不住！
搜尋同標題文章
搜尋看板內 Kyle5566 的文章
[問卦] 吃果子 要懂得 拜樹頭 
搜尋同標題文章
搜尋看板內 j955369 的文章
Re: [問卦] 是不是有新芒果乾了？
搜尋同標題文章
搜尋看板內 monkey0817 的文章
[公告] 八卦板板規(2019.08.21)
搜尋同標題文章
搜尋看板內 arsonlolita 的文章
[公告] 赤鴻飛羽，一月份置底閒聊文
搜尋同標題文章
搜尋看板內 Bignana 的文章
[協尋] 高雄左營區 行車記錄器 
搜尋同標題文章
搜尋看板內 arsonlolita 的文章
[協尋] 台灣大道 民權路口車禍
搜尋同標題文章
搜尋看板內 bonnie890319 的文章
[協尋］1/18早上8

## 爬蟲 圖片篇

In [42]:
url = 'https://sci2fig.herokuapp.com/fourier'
r = requests.get(url, timeout=3)
soup = BeautifulSoup(r.text)

print_requests(r)

request     : <PreparedRequest [GET]>
url         : https://sci2fig.herokuapp.com/fourier
status_code : 200
reason      : OK
ok?         : True
encoding    : utf-8 



In [43]:
print(soup.prettify())

<!DOCTYPE html>
<html dir="ltr" lang="">
 <head>
  <title>
   Fourier Transform
  </title>
  <link href="./static/image/fig.png" rel="icon" type="image/png"/>
 </head>
 <body bgcolor="#a3c6e9">
  <div id="content">
   <h1>
    <i>
     Image Fourier Transform
    </i>
   </h1>
   <!--form 屬性 enctype="multipart/form-data" 才能上傳 -->
   <form action="/fourier" enctype="multipart/form-data" method="post">
    <input name="fourier" type="file"/>
    (filesize &lt; 4MB, file-formats: .bmp .gif .jpg .jpeg .png)
    <p>
    </p>
    <button style="width: 100px; height: 40px;" type="submit">
     Upload
    </button>
   </form>
   <hr/>
   <img src="./static/image/fourier1.jpg" width="1000"/>
   <br/>
   <img src="./static/image/fourier2.jpg" width="1000"/>
   <br/>
   <img src="./static/image/fourier3.jpg" width="498"/>
   <img src="./static/image/fourier4.jpg" width="498"/>
   <br/>
   <img src="./static/image/sandwich.jpeg" width="1000"/>
   <br/>
  </div>
  <div id="home">
   <pre>
    </pre

### 搜尋圖片Tag_name:  `img`

* Tag `img` 中 "src" 為網址
* 可以觀察到, 網址有公開網址(http開頭), 和伺服器路徑(~/zzz/xxx.png)
* 伺服器路徑 必須加上原始網址 `https:xxxxxx.com`

In [44]:
for tag in soup.find_all('img'):
    print(tag['src'])

./static/image/fourier1.jpg
./static/image/fourier2.jpg
./static/image/fourier3.jpg
./static/image/fourier4.jpg
./static/image/sandwich.jpeg
./static/image/matplotlib.svg
https://bmc-cdn.nyc3.digitaloceanspaces.com/BMC-button-images/custom_images/orange_img.png


### 獲得所有原始圖片網址

In [45]:
server_url = r.url[:r.url.find('.com') + 4] 
print('server_url: ', server_url, '\n')
for tag in soup.find_all('img'):
    img_url = tag['src']
    if not img_url.lower().startswith("http"): # 檢查開頭 並組合
        img_url = server_url + img_url[img_url.find('/'):]
    
    print(img_url)
    

server_url:  https://sci2fig.herokuapp.com 

https://sci2fig.herokuapp.com/static/image/fourier1.jpg
https://sci2fig.herokuapp.com/static/image/fourier2.jpg
https://sci2fig.herokuapp.com/static/image/fourier3.jpg
https://sci2fig.herokuapp.com/static/image/fourier4.jpg
https://sci2fig.herokuapp.com/static/image/sandwich.jpeg
https://sci2fig.herokuapp.com/static/image/matplotlib.svg
https://bmc-cdn.nyc3.digitaloceanspaces.com/BMC-button-images/custom_images/orange_img.png


### 假設抓取第一張 取得他的原始網址 需要打開二進位檔案

* `requests.get(img_url).content` 讀取二進位網路資料
* 寫入二進位檔案

In [46]:
img_url = 'https://sci2fig.herokuapp.com/static/image/fourier1.jpg'
img = requests.get(img_url).content

f_name = img_url.split('/')[-1]

# with open(f_name, 'wb') as file:
#     file.write(img)