# 利用 requests 从网络上下载东西

## 返回一个 response 对象

In [4]:
import requests

# 返回一个 response 对象
res = requests.get('http://www.gutenberg.org/cache/epub/1112/pg1112.txt')

# 检测类型
type(res)

requests.models.Response

## 检测请求状态

In [6]:
res.status_code == requests.codes.ok

True

# 更好的检测请求是否成功的方法
> 如果成功就什么都不做，如果没下载成功就抛出错误

In [10]:
res.raise_for_status()

### 错误示范

In [12]:
# 不存在的网页
res2 = requests.get('http://inventwithpython.com/page_that_does_not_exist')
res2.raise_for_status()

HTTPError: 404 Client Error: Not Found for url: http://inventwithpython.com/page_that_does_not_exist

### 处理崩溃

In [13]:
import requests

try:
    res3 = requests.get('http://inventwithpython.com/page_that_does_not_exist')
    res3.raise_for_status()
except Exception as err:
    print(f'The Problem is \n\t{err}')

The Problem is 404 Client Error: Not Found for url: http://inventwithpython.com/page_that_does_not_exist


# response 对象其他属性

In [8]:
len(res.text)

179380

In [9]:
print(res.text[:250])

﻿The Project Gutenberg EBook of Romeo and Juliet, by William Shakespeare


*******************************************************************
THIS EBOOK WAS ONE OF PROJECT GUTENBERG'S EARLY FILES PRODUCED AT A
TIME WHEN PROOFING METHODS AND TOO


In [None]:
res.iter_content(100000)

> 它返回一个迭代器，用于逐块读取rep.txt里面的内容。参数 100000 指定了每个块的大小
> 这里是 100,000 字节（即 100 KB），也就说每一块都是那么大的文本内容
> 通过使用逐块读取的方式，可以在处理大型响应时降低内存的使用量，特别是当响应的内容很大时。这在下载大文件或处理大型数据时特别有用

# 下载成功的数据保存到硬盘

In [15]:
import requests
# 返回一个 response 对象
res = requests.get('http://www.gutenberg.org/cache/epub/1112/pg1112.txt')

with open('/Users/momo/Desktop/Python_Auto/第二部分/Chapter11/data/RomeoAndJuliet.txt', 'wb') as f:
    # 读取文本块
    for chunk in res.iter_content(100000):
        # 把文本块二进制写入文件当中去
        f.write(chunk)