# GET 請求

In [15]:
import requests  # 引入 requests 模組

r = requests.get('http://httpbin.org/get')   # 使用 GET 方式下載普通網頁

print(r.status_code)  # 伺服器回應的狀態碼
#如果顯示 200 就代表沒問題。我們也可以利用以下這個判斷式來檢查狀態碼：

if r.status_code == requests.codes.ok:  # 檢查狀態碼是否 OK
  print("OK")

print(r.text)  # 輸出網頁 HTML 原始碼

200
OK
{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.21.0"
  }, 
  "origin": "1.160.207.228, 1.160.207.228", 
  "url": "https://httpbin.org/get"
}



# 增加 URL 查詢參數
許多的 GET 請求都會在 URL 中夾帶簡短的查詢參數
（例如搜尋關鍵字等），這種狀況可以這樣寫：

In [3]:
# 查詢參數
my_params = {'key1': 'value1', 'key2': 'value2'}

# 將查詢參數加入 GET 請求中
r = requests.get('http://httpbin.org/get', params = my_params)
# 觀察 URL
print(r.url)
#雖然我們也可以自己產生這段 URL，然後直接指定給 requests，不過自己處理的話，
#還必須注意編碼問題（尤其是有中文字的情況），所以建議還是交給 requests 統一處理比較省事。

http://httpbin.org/get?key1=value1&key2=value2


# 自訂請求表頭
在進階的網路爬蟲程式中，自訂請求表頭也是一個很常被使用的技術，以下是一個簡單的範例：

In [5]:
my_headers = {'user-agent': 'my-app/0.0.1'}  # 自訂表頭

r = requests.get('http://httpbin.org/get', headers = my_headers)  # 將自訂表頭加入 GET 請求中

# 帳號密碼登入
若遇到需要帳號與密碼登入後才能看的網頁（HTTP 基本認證），可以使用 auth 參數指定帳號與密碼：

In [6]:
r = requests.get('https://api.github.com/user', auth=('user', 'pass'))

# POST 請求
POST 請求也是很常用的 HTTP 請求，只要是網頁中有讓使用者填入資料的表單，大部分都會需要用 POST 請求來處理，以下是一個簡單的範例：

In [7]:
my_data = {'key1': 'value1', 'key2': 'value2'}  # 資料

r = requests.post('http://httpbin.org/post', data = my_data)  # 將資料加入 POST 請求中

#若有遇到重複鍵值（key）的 HTML 表單欄位，可以這樣處理：

my_data = (('key1', 'value1'), ('key1', 'value2'))  # 具有重複鍵值的資料

r = requests.post('http://httpbin.org/post', data = my_data)  # 將資料加入 POST 請求中

# 上傳檔案
若要上傳檔案，也可以使用 POST 請求來處理，這是一個上傳 Word 文件的範例：

In [8]:
my_files = {'my_filename': open('my_file.docx', 'rb')}  # 要上傳的檔案

r = requests.post('http://httpbin.org/post', files = my_files)  # 將檔案加入 POST 請求中

FileNotFoundError: [Errno 2] No such file or directory: 'my_file.docx'

# Cookie
如果伺服器傳回的網頁資料中含有 cookies，requests 也可以輕鬆取出 cookies 的資料：

In [9]:
r = requests.get("http://my.server.com/has/cookies")  # 含有 cookie 的內容

print(r.cookies['my_cookie_name'])  # 取出 cookie

#若要將自己設定的 cookies 放進 GET 請求中送給伺服器，可以這樣寫：

my_cookies = dict(my_cookie_name='G. T. Wang')  # 設定 cookie

r = requests.get("http://httpbin.org/cookies", cookies = my_cookies)  # 將 cookie 加入 GET 請求

ConnectionError: HTTPConnectionPool(host='my.server.com', port=80): Max retries exceeded with url: /has/cookies (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x00000000061F9DA0>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed'))

# 常見問題

等待逾時
requests 預設會一直等待直到伺服器完成回應為止，如果想改變等待逾時設定，可以用 timeout 設定（單位為秒）：

In [11]:
requests.get('http://github.com/', timeout = 3)  # 等待 3 秒無回應則放棄

<Response [200]>

不合格憑證
當我們在自架網頁伺服器進行測試時，HTTPS 時常會有憑證不合格的問題，當 requests 遇到這種伺服器就容易會出現 requests.exceptions.SSLError 這樣的錯誤，解決的方式就是加上 verify=False，關閉 requests 的憑證檢查功能：

In [12]:
r = requests.get('https://my.server.com/', verify = False)  # 關閉憑證檢查

ConnectionError: HTTPSConnectionPool(host='my.server.com', port=443): Max retries exceeded with url: / (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x00000000054BB5F8>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed'))