# AJAX Data Crawl

## 1.What is Ajax

- AJAX = *Asynchronous JavaScript and XML*(异步的JS和XML)
- AJAX 不是新的编程语言，而是一种使用现有标准的新方法。
- AJAX 最大的优点是在不重新加载整个页面的情况下，可以与服务器交换数据并更新部分网页内容。
- AJAX 不需要任何浏览器插件，但需要用户允许JavaScript在浏览器上执行。

## 2.基本原理

### × 发送请求

```js
//js的Ajax底层实现
var xmlhttp;
if(window.XMLHttpRequest){
    // Chrome, Firefox, Opera, Safari
    xmlhttp = new XMLHttpRequest();
}
xmlhttp.onreadystatechange = function(){
    if(xmlhttp.readyState==4 && xmlhttp.status==200){
        document.getElementById("divxx").innerHTML=xmlhttp.responseText;
    }
}
xmlhttp.open("POST", "/ajax/", true);
xmlhttp.send();
```

　　上面的代码实际上是新建了XMLHttpRequest对象，然后监听属性，然后调用open()和send()向服务器发送请求。由于设置了监听，服务器在返回响应时，onreadystatechange对应的方法便会被触发，并在这个方法里解析响应内容。

### × 解析内容

　　得到响应后，onreadystatechange属性对应的方法便会被触发，利用xmlhttp的responseText属性便可取到其内容。类似Python中requests请求和响应的过程。

### × 渲染网页

　　js解析完响应内容后，就对其进行进一步处理。以上步骤包括请求、解析、渲染都是通过js完成。

## 3.实战

In [4]:
# 取得XHR请求的url
from urllib.parse import urlencode
import requests
base_url = 'https://movie.douban.com/j/chart/top_list?'

headers = {
    'User-Agent': 'Chrome/66.0.3359.170',
    'X-Requested-With': 'XMLHttpRequest',
}

# 获得一页的json内容
def get_page(page):
    params = {
        'type': 11,
        'interval_id': '100:90',
        'start': page*20,
        'limit': 20
    }
    url = base_url + urlencode(params)
    try:
        response = requests.get(url,headers=headers)
        if response.status_code == 200:
            return response.json()
    except requests.ConnectionError as e:
        print("Error", e.args)

In [6]:
# 解析网页
def parse_page(json):
    if json:
        item1 = json[0]
        print(item1)      
        

page1_data = get_page(0)
parse_page(page1_data)

Success
{'rating': ['9.6', '50'], 'rank': 1, 'cover_url': 'https://img3.doubanio.com/view/photo/s_ratio_poster/public/p480747492.jpg', 'is_playable': True, 'id': '1292052', 'types': ['犯罪', '剧情'], 'regions': ['美国'], 'title': '肖申克的救赎', 'url': 'https://movie.douban.com/subject/1292052/', 'release_date': '1994-09-10', 'actor_count': 25, 'vote_count': 1333244, 'score': '9.6', 'actors': ['蒂姆·罗宾斯', '摩根·弗里曼', '鲍勃·冈顿', '威廉姆·赛德勒', '克兰西·布朗', '吉尔·贝罗斯', '马克·罗斯顿', '詹姆斯·惠特摩', '杰弗里·德曼', '拉里·布兰登伯格', '尼尔·吉恩托利', '布赖恩·利比', '大卫·普罗瓦尔', '约瑟夫·劳格诺', '祖德·塞克利拉', '保罗·麦克兰尼', '芮妮·布莱恩', '阿方索·弗里曼', 'V·J·福斯特', '弗兰克·梅德拉诺', '马克·迈尔斯', '尼尔·萨默斯', '耐德·巴拉米', '布赖恩·戴拉特', '唐·麦克马纳斯'], 'is_watched': False}
