### 1. 简单使用（无请求头）

In [None]:
import requests

# 发送请求
response = requests.get('http://www.baidu.com')

# 获取内容
response.text

# 获取响应内容
content = response.content
print('响应内容：{}'.format(content.decode()))
print()

# 状态码
status_code = response.status_code
assert status_code==200, '请求失败'  # 使用断言判断结果
print('状态码：{}'.format(status_code))
print()

# 请求头
req_headers = response.request.headers
print('请求头：{}'.format(req_headers))

# 响应头
headers = response.headers
print('响应头：{}'.format(headers))
print()

# 请求url
req_url = response.request.url
print('请求URL：{}'.format(req_url))

# 响应url
url = response.url
print('响应URL：{}'.format(req_url))

### 2. 简单使用（带请求头）

In [None]:
import requests

# 设置headers
headers = {
    'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:64.0) Gecko/20100101 Firefox/64.0'
}

# 发送请求
response = requests.get('http://www.baidu.com', headers=headers)

# 状态码
status_code = response.status_code
assert status_code==200, '请求失败'  # 使用断言判断结果
print('状态码：{}'.format(status_code))

# 获取响应内容
content = response.content
print('响应内容：{}'.format(content.decode()))

### 3. 简单使用（带参数）

In [None]:
# 参数形式： 字典

import requests

# 设置headers
headers = {
    'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:64.0) Gecko/20100101 Firefox/64.0'
}

# 设置headers
parm = {
    'wd': '长城'
}

# 发送请求
response = requests.get('https://www.baidu.com/s', params=parm, headers=headers)

# 状态码
status_code = response.status_code
assert status_code==200, '请求失败'  # 使用断言判断结果
print('状态码：{}'.format(status_code))

# 获取响应内容
content = response.content
print('响应内容：{}'.format(content.decode()))

### 4. demo1

In [None]:
import requests


class TiebaSpider:

    def __init__(self, tieba_name):
        """初始化"""
        self.tieba_name = tieba_name
        self.url_temp = 'http://tieba.baidu.com/f?ie=utf-8&kw='+tieba_name+'&pn={}'
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:64.0) Gecko/20100101 Firefox/64.0'
        }

    def get_url_list(self):
        """构造url列表"""
        url_list = [self.url_temp.format(i*50) for i in range(5)]
        return url_list

    def parse_url(self, url):
        """发送请求，获取响应"""
        print(url)
        response = requests.get(url=url, headers=self.headers)
        return response.content.decode(encoding='utf-8')

    def save_html(self, html_str, page_num):
        """保存html字符串"""
        file_path = '{}-第{}页.html'.format(self.tieba_name, page_num)
        with open(file_path, 'w', encoding='utf-8') as f:
            f.write(html_str)

    def run(self):
        # 1. 构造url列表
        url_list = self.get_url_list()

        # 2. 遍历，发送请求， 获取响应
        for url in url_list:
            html_str = self.parse_url(url=url)
            page_num = url_list.index(url)+1  # 页数
            # 3. 保存
            self.save_html(html_str, page_num)


if __name__ == '__main__':
    tieba_spider = TiebaSpider('python')
    tieba_spider.run()

### 5. 发送POST请求

In [None]:
# data形式： 字典
# 翻译模块- 借助百度翻译
import requests
import json

# 设置 消息头
headers = {
    'User-Agent': 'Mozilla/5.0 (Linux; Android 7.0; SM-G892A Build/NRD90M; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/67.0.3396.87 Mobile Safari/537.36'
}

# 要翻译的文字
str = '书'


# 语言检测
data = {
    'query': str
}
post_url = 'https://fanyi.baidu.com/langdetect'
r = requests.post(post_url, data=data, headers=headers)
dict_ret = json.loads(r.content.decode())
from_lan = dict_ret['lan']

# 语言翻译
data = {
    'query': str,
    'from': from_lan,
    'to': 'en'
}

post_url = 'https://fanyi.baidu.com/basetrans'

r = requests.post(post_url, data=data, headers=headers)

dict_ret = json.loads(r.content.decode())
ret = dict_ret['trans'][0]['dst']
print('result is:', ret)

### 6. 使用代理

In [None]:
# proxies 的形式： 字典
# 免费代理地址： 
# https://proxy.mimvp.com/free.php（米扑代理）
# https://proxy.coderbusy.com/（码农很忙）
# https://www.kuaidaili.com/free/（快代理）
# https://www.xicidaili.com/nn/(国内高匿代理IP)
import requests
import json

headers = {
    'User-Agent': 'Mozilla/5.0 (Linux; Android 7.0; SM-G892A Build/NRD90M; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/67.0.3396.87 Mobile Safari/537.36'
}

# 配置代理
proxies = {
    'http': 'http://119.101.113.49:9999',
    'https': 'http://119.101.113.49:9999'
}

r = requests.get('https://www.baidu.com', proxies=proxies, headers=headers)
print('状态码：',r.status_code)

##### 6.1 使用代理
- 准备一个代理IP池，随机选择一个ip
- 如何随机选择代理IP
    - {'ip':ip, 'times':0 }
    - 对IP的列表进行排序， 按到使用次数排序
    - 选择使用次数较少的10个ip， 从中随机选择一个
- 检查ip的可用性
    - 添加超时参数， 判断ip地址质量
    - 在线代理ip质量检测的网站

### 7. cookie 和 session

In [None]:
# 使用

import requests
import json

headers = {
    'User-Agent': 'Mozilla/5.0 (Linux; Android 7.0; SM-G892A Build/NRD90M; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/67.0.3396.87 Mobile Safari/537.36'
}

session = requests.session()
r = requests.get('https://www.baidu.com', headers=headers)
print('状态码：',r.status_code)

### 8. 保存图片

In [None]:
r = requests.get('https://www.baidu.com/img/baidu_jgylogo3.gif')

with open('a.gif', 'wb') as f:
    f.write(r.content)