# AJAX（Asynchronous JavaScript and XML）请求
	•使网页可以在后台与服务器通信，而无需重新加载整个页面。
	•主要用于局部更新网页内容，例如：搜索建议、加载更多数据、分页等。
	•通过 requests 库可以模拟 AJAX 请求，通常需要分析 XHR 请求的 URL 和参数。

#### 1. 如何区分是否是 AJAX 加载？
    •观察 requests.get(url) 是否能直接获取到完整内容。如果直接访问 URL 只能获取 HTML 结构，而数据部分需要额外请求 API，则说明是 AJAX 方式加载。
	•检查浏览器开发者工具（检查 → 网络 → XHR/Fetch）。在 XHR 或 Fetch 选项下看到数据请求，那说明网页是通过 AJAX 方式加载数据的。
	•刷新页面观察内容变化。页面主要内容在刷新后立即出现，则可能是普通请求加载的。如果需要额外的用户交互或延迟才能出现，则可能是 AJAX 加载的。

#### 2. 请求网页后，网页域名发生变化是否是 AJAX 加载？
	•不是 AJAX 加载。AJAX 只会在后台请求数据，不会改变浏览器的 URL。如果访问网页时，域名（或者完整的 URL）发生了变化，那通常是普通的页面跳转，而不是 AJAX 加载。
	•AJAX 可能会改变 URL 但不刷新页面
	•域名变化 = 不是 AJAX
	•域名不变，但页面数据更新 = 可能是 AJAX
	•URL 变化但没有刷新页面 = 可能是 pushState() + AJAX

# 1.爬取搜狗指定词条对应的搜索结果页面

In [4]:
import requests


#获取url
url='https://www.sogou.com/web'

headers = {'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36'
    }

#输入关键词
kw=input('Enter keyword: ')

params = {'query':kw
          }

response = requests.get(url,params=params,headers=headers)

text = response.text

filename=kw+'.html'

#以html格式保存
with open(filename,'w',encoding='utf-8') as f:
    f.write(text)
print('✅')


✅


# 2.破解百度

In [30]:
import requests
import json

url="https://fanyi.baidu.com/sug"


headers={
   'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36'

}

input_word= input('Enter words: ')

data={
    'kw':input_word,
}

#查看为post请求
response = requests.post(url=url,data=data,headers=headers)
text = response.json()

filename = input_word + '.json'
print(text)

#保存为json文件
#fp=fp使json文件为空？
#因为 fp=fp 这种重复赋值 可能让 json.dump() 解析参数时出错，导致写入失败。
fp = open(filename,'w',encoding='utf-8')
json.dump(text,fp,ensure_ascii=False)



{'errno': 0, 'data': [{'k': 'cat', 'v': 'n. 猫; 猫科动物; 狠毒的女人; 爵士乐爱好者 vt. 把（锚）吊放在锚架上; 〈俚〉寻欢，宿娼'}, {'k': 'CAT', 'v': 'abbr. Carburetor Air Temperature 汽化器空气温度'}, {'k': 'Cat', 'v': '[人名] 卡特'}, {'k': 'CaT', 'v': 'abbr. calcium tartrate tetrahydrate 酒石酸钙四水合物'}, {'k': 'cata', 'v': '[机] 渺位; 依照'}], 'logid': 232679471}


# 3.有道翻译


In [34]:
import requests

url='https://dict.youdao.com/suggest?num=5&ver=3.0&doctype=json&cache=false&le=en'

headers={
    'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36'
}

list=input('Enter list: ')

data={
    'q':list
}

response = requests.get(url=url,data=data,headers=headers)
text = response.text


print(text)



{"result":{"msg":"bad request","code":400},"data":{}}


In [35]:
response = requests.post(url=url,data=data,headers=headers)
text = response.json()
print(text)

{'result': {'msg': 'success', 'code': 200}, 'data': {'entries': [{'explain': 'n. 狗，犬；公狗，公狐，公狼；质量极差的东西；无吸引力的女子；卑鄙小人，无赖；<美，非正式>朋友;...', 'entry': 'dog'}, {'explain': 'n. 教条，信条，教义', 'entry': 'dogma'}, {'explain': 'adj. 教条的；武断的', 'entry': 'dogmatic'}, {'explain': 'adj. 顽强的，坚持不懈的; v. 困扰，纠缠；跟踪，尾随（dog 的过去式和过去分词）', 'entry': 'dogged'}, {'explain': 'n. <非正式>（儿童用语）狗狗; adj. 狗的，像狗一样的；爱狗的；时髦的，装阔气的；低人一等的', 'entry': 'doggy'}], 'query': 'dog', 'language': 'en', 'type': 'dict'}}


##### 说明数据以json格式储存

# 4.豆瓣电影

In [73]:
import requests
import json

url='https://movie.douban.com/j/chart/top_list'

headers={
    'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36',

}

params={
     'type':'24',
     'interval_id':'100:90',#100%3A90
     'action': '',
     'start':'0',
     'limit':'20'
}

response = requests.get(url=url,params=params,headers=headers)
text = response.json()

print(text)

fp = open('./douban.json','w',encoding='utf-8')
json.dump(text,fp,ensure_ascii=False)

[{'rating': ['9.5', '50'], 'rank': 1, 'cover_url': 'https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2578474613.jpg', 'is_playable': True, 'id': '1292063', 'types': ['剧情', '喜剧', '爱情', '战争'], 'regions': ['意大利'], 'title': '美丽人生', 'url': 'https://movie.douban.com/subject/1292063/', 'release_date': '2020-01-03', 'actor_count': 29, 'vote_count': 1424461, 'score': '9.5', 'actors': ['罗伯托·贝尼尼', '尼可莱塔·布拉斯基', '乔治·坎塔里尼', '朱斯蒂诺·杜拉诺', '赛尔乔·比尼·布斯特里克', '玛丽萨·帕雷德斯', '霍斯特·布赫霍尔茨', '利迪娅·阿方西', '朱利亚娜·洛约迪切', '亚美利哥·丰塔尼'], 'is_watched': False}, {'rating': ['9.3', '50'], 'rank': 2, 'cover_url': 'https://img9.doubanio.com/view/photo/s_ratio_poster/public/p1454261925.jpg', 'is_playable': True, 'id': '6786002', 'types': ['剧情', '喜剧'], 'regions': ['法国'], 'title': '触不可及', 'url': 'https://movie.douban.com/subject/6786002/', 'release_date': '2011-11-02', 'actor_count': 22, 'vote_count': 1232141, 'score': '9.3', 'actors': ['弗朗索瓦·克鲁塞', '奥玛·希', '安娜·勒尼', '奥德雷·弗勒罗', '约瑟芬娜·德·摩', '克洛蒂尔德·莫莱特', '阿尔芭·贝露琪', '萨丽马特·卡马特',

# 5.KFC餐厅位置查询

In [83]:
import requests,json

url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword'

headers={
    'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36',

}

kw=input('Enter keyword: ')

#找到完整参数
params={
    'cname': '北京',
    'pid':'',
    'keyword': kw,
    'pageIndex': '1',
    'pageSize':'10',
}

response = requests.post(url=url,data=params,headers=headers)
text = response.text
print(text)

filename=kw+'.json'

fp = open(filename,'w',encoding='utf-8')
json.dump(text,fp,ensure_ascii=False)


{"Table":[{"rowcount":5}],"Table1":[{"rownum":1,"storeName":"亦庄","addressDetail":"北京经济开发区西环北路18号F1＋F2","pro":"Wi-Fi,礼品卡,手机点餐","provinceName":"北京市","cityName":"北京市"},{"rownum":2,"storeName":"亦庄上海沙龙","addressDetail":"经济技术开发区天宝园五里二区A1+A2户一层","pro":"Wi-Fi,店内参观,礼品卡","provinceName":"北京市","cityName":"北京市"},{"rownum":3,"storeName":"亦庄沃尔玛","addressDetail":"经济技术开发区文化园东路6号北京经开汇展中心1-2层","pro":"Wi-Fi,店内参观,礼品卡","provinceName":"北京市","cityName":"北京市"},{"rownum":4,"storeName":"亦庄龙湖","addressDetail":"经济技术开发区河西区X78C2地块A-B1-40","pro":"手机点餐","provinceName":"北京市","cityName":"北京市"},{"rownum":5,"storeName":"亦庄龙湖","addressDetail":"经济技术开发区河西区X78C2地块A-B1-40","pro":"手机点餐","provinceName":"北京市","cityName":"北京市"}]}


# 6，网易云歌词

In [119]:
import requests,json

headers={
    'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Mobile Safari/537.36',

}

#榜单url
top_list_url='https://interface.music.163.com/weapi/v6/playlist/detail'

#歌词api
lyrics_url=  "https://music.163.com/api/song/lyric?id={}&lv=1"

#params
data={
    'params':'9T31zTsWQQM37pT4m6mFmM8bj3Dxr7stI2O7E/6JPO6HM0AG1D2Ad+WYkO9mELrWPwVt05AXl5qlIep3v/CRS7TLqUyzmxrFLy3GQ3AxA7o=',
    'encSecKey':'a0815c3cdbe3f0f1d69c78f7572d2592a9ef2e3cd634dbda53b51cc24c1c583020b8272fd334a135ce8bff33bed3243019c50288457f76e7fa57adc87933d6a83f7dfa7367350411ea0e1a51176f8379658525eb856157a97ea32bc6805b59a8a86fab60f3f75b9a191a498aea5ede3ab8716cf3208eface8e4afffbc8e6e8a5'

}

#获取id
response = requests.post(url=top_list_url,data=data,headers=headers)
list=response.json()
print(list)
lyrics_id=[]
lyrics_set=[]
for item in list['playlist']['tracks']:
    lyrics_id.append(item['id'])
print(lyrics_id)

#获取歌词
for id in lyrics_id:
    response = requests.get(url=lyrics_url.format(id),headers=headers)
    lyrics_set.append(response.text)
    print(lyrics_set)

#保存json
fp = open('./wyy.json','w',encoding='utf-8')
json.dump(lyrics_set,fp,ensure_ascii=False)
print('✅')







{'code': 200, 'relatedVideos': None, 'playlist': {'id': 19723756, 'name': '飙升榜', 'coverImgId': 109951170048506929, 'coverImgUrl': 'https://p1.music.126.net/rIi7Qzy2i2Y_1QD7cd0MYA==/109951170048506929.jpg', 'coverImgId_str': '109951170048506929', 'adType': 0, 'userId': 1, 'createTime': 1404115136883, 'status': 0, 'opRecommend': False, 'highQuality': False, 'newImported': False, 'updateTime': 1741480971690, 'trackCount': 99, 'specialType': 10, 'privacy': 0, 'trackUpdateTime': 1741510488125, 'commentThreadId': 'A_PL_0_19723756', 'playCount': 6181355008, 'trackNumberUpdateTime': 1741480953649, 'subscribedCount': 4144952, 'cloudTrackCount': 0, 'ordered': True, 'description': '云音乐中每天热度上升最快的100首单曲，每日更新。', 'tags': [], 'updateFrequency': None, 'backgroundCoverId': 0, 'backgroundCoverUrl': None, 'titleImage': 0, 'titleImageUrl': None, 'detailPageTitle': None, 'englishTitle': None, 'officialPlaylistType': None, 'copied': False, 'relateResType': None, 'coverStatus': 3, 'subscribers': [], 'subscrib

IOPub data rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_data_rate_limit`.

Current values:
ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
ServerApp.rate_limit_window=3.0 (secs)



['{"sgc":false,"sfy":false,"qfy":false,"lyricUser":{"id":4354675,"status":99,"demand":0,"userid":108488283,"nickname":"tkutdhgzsrgr","uptime":0},"lrc":{"version":19,"lyric":"[00:00.000] 制作人 : 郑润泽\\n[00:01.000] 作词 : 郑润泽\\n[00:02.000] 作曲 : JD_Kwan/郑润泽\\n[00:07.019]后期：Yhon\\n[00:14.090]窗外下着雨 房间里依然很冷清\\n[00:21.376]等着你出现 从来没改变\\n[00:28.513]昨晚想到你 被寂寞包裹的恐惧\\n[00:35.440]等待黎明 等待深爱 的你\\n[00:41.492]能不能留下来再陪我数次星星\\n[00:48.628]能不能别提起念念不忘的他\\n[00:55.760]能不能告诉我你这次离开的各种原因\\n[01:03.798]只能和孤独亲密 像小孩想要星星\\n[01:10.143]忘不了你我互相的甜蜜\\n[01:17.298]是你给我的最后的记忆\\n[01:24.453]松开的手再抓不紧\\n[01:28.856]等雨后等天晴\\n[01:32.392]一起走的路都泥泞 沉睡向往的梦境\\n[01:38.756]说来又说去还放不下你\\n[01:45.956]最后再求你求你别离去\\n[01:53.115]即便现实都已看清\\n[01:57.615]镜子两面我破碎又织起\\n[02:01.170]倔强的我最后过回了沉溺\\n[02:07.872]\\n[02:08.794]渐渐两路模糊我视线\\n[02:12.470]有一瞬间就将我冻结\\n[02:15.530]重新连接的爱却又只能够妥协\\n[02:23.150]于是我们又错过了时间\\n[02:26.731]乌云密布了整个蓝天\\n[02:32.585]忘不了你我互相的甜蜜\\n[02:39.747]是你给我的最后的记忆\\n[02:46.839]松开的手再抓不紧\\n[02:51.316]等雨后等天晴\\n[02:54.916]一起走的路都泥泞 沉睡向往的梦境\\n[03:01.194]说来又说

IOPub data rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_data_rate_limit`.

Current values:
ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
ServerApp.rate_limit_window=3.0 (secs)

