# 使用高德地图API(搜索POI)
## 1、首先，引入所需要用到的函数模块
- 其中，pd是pandas模块的命名惯例，当你看到pd.DataFrame()时，你就知道它是引用pandas中的DataFrame函数。
- DataFrame是一个常用到表格型数据结构，我们直接将其从pandas模块引出。

In [26]:
import requests,json,csv
import pandas as pd
from pandas import DataFrame

## 2、设置参数，使用requests模块请求返回数据
- url，key，keywords，city，extensions，page都是可以向API请求的参数，更多详细的请求参数数据请查看API文件：[搜索api/search](http://lbs.amap.com/api/webservice/guide/api/search)
- key可以在高德API自行申请。[key申请](https://lbs.amap.com/api/webservice/guide/create-project/get-key)
- 将参数构造成字典形式并且赋值于data。
- 使用requests来执行调用。并将URL和data传递给它，响应对象储存在req中。
- Reqeusts支持以form表单形式发送post请求，只需要将请求的参数构造成一个字典。

In [27]:
url = 'https://restapi.amap.com/v3/place/text?parameters'
key = '9bawhsfklsdjfsljflksdjd34kktj3'
data = {'key':'b6a74ab04e9e5883bfcf92b4fe6126a2','keywords':'游戏场所','city':'广州','extensions':'all','page':'1'}    
req = requests.post(url,data)
data = req.json()

### 查看返回的数据结果
- API返回JSON格式的信息，因此上面使用了json()将这些数据转化为一个Python字典，并储存在data中。

In [28]:
data

{'status': '1',
 'count': '351',
 'info': 'OK',
 'infocode': '10000',
 'suggestion': {'keywords': [], 'cities': []},
 'pois': [{'id': 'B0FFGY7LD2',
   'parent': 'B0FFFE8QDN',
   'name': '阿里游戏',
   'tag': [],
   'type': '体育休闲服务;娱乐场所;娱乐场所',
   'typecode': '080300',
   'biz_type': [],
   'address': '冼村街道平云路163号平云广场B塔9层',
   'location': '113.351179,23.118538',
   'tel': [],
   'postcode': [],
   'website': [],
   'email': [],
   'pcode': '440000',
   'pname': '广东省',
   'citycode': '020',
   'cityname': '广州市',
   'adcode': '440106',
   'adname': '天河区',
   'importance': [],
   'shopid': [],
   'shopinfo': '0',
   'poiweight': [],
   'gridcode': '3413524800',
   'distance': [],
   'navi_poiid': [],
   'entr_location': [],
   'business_area': '珠江新城',
   'exit_location': [],
   'match': '0',
   'recommend': '0',
   'timestamp': [],
   'alias': [],
   'indoor_map': '0',
   'indoor_data': {'cpid': [], 'floor': [], 'truefloor': [], 'cmsid': []},
   'groupbuy_num': '0',
   'discount_num': '0',
   '

## 3、使用pd.DataFrame对数据进行处理
- 使用DataFrame将data数据转换为表格型数据结构。

In [29]:
pois = data['pois']
frame = DataFrame(pois)

### 查看数据结果
- 切片索引前五行来看。

In [30]:
frame[:5]

Unnamed: 0,adcode,address,adname,alias,biz_ext,biz_type,business_area,children,citycode,cityname,...,postcode,recommend,shopid,shopinfo,tag,tel,timestamp,type,typecode,website
0,440106,冼村街道平云路163号平云广场B塔9层,天河区,[],"{'rating': [], 'cost': []}",[],珠江新城,[],20,广州市,...,[],0,[],0,[],[],[],体育休闲服务;娱乐场所;娱乐场所,80300,[]
1,440106,棠下中山大道188号好又多超市(天河店)1层,天河区,[],"{'rating': '3.2', 'cost': []}",[],东圃,[],20,广州市,...,[],0,[],0,[],020-85468521,[],体育休闲服务;娱乐场所;游戏厅,80305,[]
2,440106,天河路228号正佳广场7层,天河区,[],"{'rating': [], 'cost': []}",[],[],[],20,广州市,...,[],0,[],0,[],[],[],体育休闲服务;娱乐场所;游戏厅,80305,[]
3,440106,天河北路保利中宇广场A座405,天河区,[],"{'rating': [], 'cost': []}",[],五山,[],20,广州市,...,[],0,[],0,[],[],[],体育休闲服务;体育休闲服务场所;体育休闲服务场所,80000,[]
4,440106,建中路59号雅爵大厦9楼,天河区,[],"{'rating': [], 'cost': []}",[],[],[],20,广州市,...,[],0,[],0,[],[],[],体育休闲服务;体育休闲服务场所;体育休闲服务场所,80000,[]


## 4、使用pd.DataFrame处理POI信息列表栏位
- DataFrame的columns参数控制栏位的顺序
- 我们可以用添加字典键值的办法来为列表结构添加它所没有的信息，比如：keywords。

In [31]:
frame = DataFrame(frame,columns=['keywords','id','name','type','typecode','location',' tel','pname','pcode','cityname','citycode','adname','adcode'])
frame['keywords']='游戏场所'

### 查看数据结果
- 如下图，它已经按我们想要的排列顺序排列，并且添加了keywords值。

In [32]:
frame[:5]

Unnamed: 0,keywords,id,name,type,typecode,location,tel,pname,pcode,cityname,citycode,adname,adcode
0,游戏场所,B0FFGY7LD2,阿里游戏,体育休闲服务;娱乐场所;娱乐场所,80300,"113.351179,23.118538",,广东省,440000,广州市,20,天河区,440106
1,游戏场所,B0FFH12EH4,游戏机,体育休闲服务;娱乐场所;游戏厅,80305,"113.378325,23.125305",,广东省,440000,广州市,20,天河区,440106
2,游戏场所,B0FFH0XZDX,游戏机(正佳广场),体育休闲服务;娱乐场所;游戏厅,80305,"113.327023,23.132171",,广东省,440000,广州市,20,天河区,440106
3,游戏场所,B0FFIQ13G0,好玩游戏,体育休闲服务;体育休闲服务场所;体育休闲服务场所,80000,"113.341682,23.141075",,广东省,440000,广州市,20,天河区,440106
4,游戏场所,B0FFIWUG03,可以游戏,体育休闲服务;体育休闲服务场所;体育休闲服务场所,80000,"113.371513,23.123505",,广东省,440000,广州市,20,天河区,440106


## 5、对数据进行输出
- 分别使用pandas模块的to_json函数和to_csv来产出json文档和tsv文档。
- 其中，tsv需要设置sep = '\t',及以制表符来进行分割。

In [33]:
frame.to_json("output.json" )
frame.to_csv("output.tsv",encoding="utf8",sep='\t')

## 6、设置循环，迭代全部page返回的完整数据
- 如果不设置循环迭代，一次请求只能的返回one page(page为API提供的一个控制页数参数)的数据。page的详细信息可以查看API文件：[搜索api/search](http://lbs.amap.com/api/webservice/guide/api/search)
- 先为循环迭代设置一个pois的空列表，用来迭代更多的字典结构，其中原理涉及到data[pois]中的数据结构，看上文。
- %d为格式化整型，将每次循环后的+1page赋值于'page'。
- data[pois]的数据结构是列表嵌套多个字典的结构，每一个字典代表一个完整的poi信息。
- 使用whie True：来进行数据循环，当条件满足时，使用break跳出循环。
- 每次循环，使用列表函数extend来为空列表pois进行迭代赋值。
- len(pois)表示pois中字典的数量(字典的数量及为迭代数据的数量)。
- data['count']为API返回的数据之一，表示完整数据的数量，可看上data返回的详细信息来理解。
- 当len(pois) = data['count']时，及pois列表中已经迭代了全部的数据，这及为循环结束的条件。
- 每次循环为page+1。

In [34]:
url = 'https://restapi.amap.com/v3/place/text?parameters'
key = '9bawhsfklsdjfsljflksdjd34kktj3'
pois = []
page = 1    
while True:
    data = {'key':'b6a74ab04e9e5883bfcf92b4fe6126a2','keywords':'游戏场所','city':'广州','extensions':'all','page':'%d'%page}    
    req = requests.post(url,data)
    data = req.json()
    pois.extend(data['pois'])
    pois_counts = len(pois)   
    all_counts = int(data['count'])  
    if (pois_counts >= all_counts):  
        break                             
    else:
        page +=1

## 7、将搜索POI包装成函数
理由：
- 包装成函数可以更方便我们多次使用函数。
- 方便用户更换输入的keywords和city等参数。

函数输入：
- 关键词(keywords)
- 地区代码(city)

函数返回：

- poi数据的表格结构
- json文档
- tsv文档

产出文件使用%s格式字符串，使得文件名称和函数输入的keywords一致。

In [35]:
def APIpoi(keywords,city):
    url = 'https://restapi.amap.com/v3/place/text?parameters'
    key = '9bawhsfklsdjfsljflksdjd34kktj3'
    pois = []
    page = 1    
    while True:
        data = {'key':'b6a74ab04e9e5883bfcf92b4fe6126a2','keywords':keywords,'city':city,'extensions':'all','page':'%d'%page}    
        req = requests.post(url,data)
        data = req.json()
        pois.extend(data['pois'])
        no_pois_this_search = len(pois)   
        no_pois = int(data['count'])  
        if (no_pois_this_search >= no_pois):  
            break                             
        else:
            page +=1
          
    frame = DataFrame(pois)
    frame = DataFrame(frame,columns=['keywords','id','name','type','typecode','location',' tel','pname','pcode','cityname','citycode','adname','adcode'])
    frame['keywords']=keywords
    print(frame)
    frame.to_json("%s.json" %keywords)
    print("加载入json文件完成...")
    frame.to_csv("%s.tsv" %keywords,encoding="utf8",sep='\t')
    print("加载入tsv文件完成...")

## 调用函数

In [36]:
APIpoi(keywords='游戏场所',city='广州')

    keywords          id                name                             type  \
0       游戏场所  B0FFGY7LD2                阿里游戏                 体育休闲服务;娱乐场所;娱乐场所   
1       游戏场所  B0FFH12EH4                 游戏机                  体育休闲服务;娱乐场所;游戏厅   
2       游戏场所  B0FFH0XZDX           游戏机(正佳广场)                  体育休闲服务;娱乐场所;游戏厅   
3       游戏场所  B0FFIQ13G0                好玩游戏         体育休闲服务;体育休闲服务场所;体育休闲服务场所   
4       游戏场所  B0FFIWUG03                可以游戏         体育休闲服务;体育休闲服务场所;体育休闲服务场所   
5       游戏场所  B0FFIB7SFF                果子游戏         体育休闲服务;体育休闲服务场所;体育休闲服务场所   
6       游戏场所  B0FFFW7814                 游戏币               购物服务;购物相关场所;购物相关场所   
7       游戏场所  B0FFG8IBJZ             凤天游戏工作室               生活服务;生活服务场所;生活服务场所   
8       游戏场所  B0FFH7NP95                 游戏机                  体育休闲服务;休闲场所;游乐场   
9       游戏场所  B0FFHCS8H4        游戏区(新都汇购物广场)                  体育休闲服务;休闲场所;游乐场   
10      游戏场所  B0FFG1PLBL                火羽游戏                 体育休闲服务;娱乐场所;娱乐场所   
11      游戏场所  B0FFGBUCJE    