In [None]:
'''
【项目07】  城市餐饮店铺选址分析

1、从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行比较，并筛选出可开店铺的餐饮类型
要求：
① 计算出三个维度的指标得分
② 评价方法：
   口味 → 得分越高越好
   性价比 → 得分越高越好
   人均消费 → 价格适中即可
③ 制作散点图，x轴为“人均消费”，y轴为“性价比得分”，点的大小为“口味得分”
   绘制柱状图，分别显示“口味得分”、“性价比得分”
   * 建议用bokeh做图
提示：
① 数据清洗，清除空值、为0的数据
② 口味指标计算方法 → 口味评分字段，按照餐饮类别分组算均值，再做标准化处理
③ 人均消费指标计算方法 → 人均消费字段，按照餐饮类别分组算均值，再做标准化处理
④ 性价比指标计算方法 → 性价比 = （口味 + 环境 + 服务）/人均消费，按照餐饮类别分组算均值，再做标准化处理
⑤ 数据计算之前，检查一下数据分布，去除异常值（以外限为标准）
   * 这里排除了高端奢侈餐饮的数据干扰
⑥ 注意，这里先分别计算三个指标，再合并数据（merge）作图，目的是指标之间的噪音数据不相互影响

2、选择一个餐饮类型，在qgis中做将上海划分成格网空间，结合python辅助做空间指标评价，得到餐饮选址位置
* 课程这里以“素菜馆为例”
课程数据
① net_population.shp → 投影坐标系，上海1km²格网内的人口密度数据
② road.shp → 投影坐标西，上海道路数据
要求：
① 通过空间分析，分别计算每个格网内的几个指标：人口密度指标、道路密度指标、餐饮热度指标、同类竞品指标
② 评价方法：
   人口密度指标 → 得分越高越好
   道路密度指标 → 得分越高越好
   餐饮热度指标 → 得分越高越好
   同类竞品指标 → 得分越低越好
   综合指标 = 人口密度指标*0.4 + 餐饮热度指标*0.3 + 道路密度指标*0.2 +同类竞品指标*0.1
③ 最后得到较好选址的网格位置的中心坐标，以及所属区域
   * 可以用bokeh制作散点图
提示：
① 道路密度指标计算方法 → 网格内道路长度
② 餐饮热度指标计算方法 → 网格内餐饮poi计数
③ 同类竞品指标计算方法 → 网格内素菜馆poi计数
④ 餐饮poi数据记得投影
⑤ 可以以“net_population.shp”为网格基础数据，做空间统计
⑥ 在qgis做空间统计之后，网格数据导出点数据，投影成wgs84地理坐标系，导出excel数据，在python做指标标准化等
⑦ 在bokeh中做散点图时，注意添加一个size字段，通过最终评分来赋值
⑧ 在bokeh中做散点图时，可以给TOP10的点用颜色区分

'''

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os
% matplotlib inline

import warnings
warnings.filterwarnings('ignore') 
# 不发出警告

from bokeh.io import output_notebook
output_notebook()
# 导入notebook绘图模块

from bokeh.plotting import figure,show
from bokeh.models import ColumnDataSource
# 导入图表绘制、图标展示模块
# 导入ColumnDataSource模块

In [2]:
from bokeh.models import HoverTool
# 用于设置显示标签内容
from bokeh.layouts import gridplot
# 导入gridplot模块

os.chdir(r'C:\Users\acer\Documents\Tencent Files\1970237873\FileRecv\项目07城市餐饮店铺选址分析')
data = pd.read_excel('上海餐饮数据.xlsx')
q1 = data['人均消费'].quantile(0.25)
q3 = data['人均消费'].quantile(0.75)
iqr = q3 - q1
nx = q1 - 3*iqr   #计算内限
wx = q3 + 3*iqr   #计算外限

data = data[(wx.tolist()>data['人均消费'])&(data['人均消费']>nx.tolist())]
# 数据晒选

data.replace(0,np.nan,inplace = True )
data.dropna(inplace=True)
data1 = data[['类别','口味']]
data2 = data[['类别','人均消费']]
data3 = data[['类别','口味','环境','服务']]
data3['xjb'] = (data['口味']+data['环境']+data['服务']) / 3

df_kw = data1.groupby(['类别']).mean()
df_rj = data2.groupby(['类别']).mean()
df_xjb = data3[['xjb','类别']].groupby(['类别']).mean()
# 分三组计算分类计算平均值

df = df_kw.join(df_rj)
df = df.join(df_xjb)
#合并三组数据

df.columns = [['kw','rj','xjb']]
rj_num = df['rj'].median()                            #计算人均消费的中位数
df['rjs'] = abs(rj_num - df['rj'])                    # 人均消费的评分判断
df['kw_sd'] = ( df['kw'] - df['kw'].min()) / (df['kw'].max() - df['kw'].min())        #标准化口味得分
df['rjs_sd'] = ( df['rjs'].max() - df['rjs']) / (df['rjs'].max() - df['rjs'].min())    #标准化人均消费得分
df['xjb_sd'] = ( df['xjb'] - df['xjb'].min()) / (df['xjb'].max() - df['xjb'].min())     #标准化性价比得分
df.index.name = 'index'
# 给df的index命名
cy_type = df.index.tolist()  #柱状图的横坐标
defens = df.columns.tolist()  #柱状图的纵坐标值
data = {'type':cy_type}
for defen in defens:
    data[defen] = df[defen].tolist() #构建一个字典型data 

source = ColumnDataSource(data = data)

hover = HoverTool(tooltips=[
                            ("餐饮类型","@index"),
                            ("人均消费", "$x"),
                            ("性价比得分", "$y"),
                            ("口味得分","@kw_sd")
                        ])

p1 = figure(plot_width = 600,plot_height = 400,
          tools=[hover,'box_select,reset,wheel_zoom,pan,crosshair'])  #绘制
p2 = figure(x_range = cy_type,plot_height=400, y_range=p1.y_range)
p3 = figure(x_range = cy_type,plot_height=400, y_range=p1.y_range)

p1.circle(x ='rj',y = 'xjb_sd',source=source,
        size = df['kw_sd']*45,color = 'yellow',alpha = 0.5,
        line_color = 'gray',line_alpha = 0.7,line_dash = 'dashed',line_width = 1,
         legend = '餐饮类型得分情况散点图'
        )
# 绘制散点图
p2.vbar(x='type',top='kw_sd',source = source,
      width = 0.8,alpha=0.8,color='red')
# 绘制口味得分柱状图
p3.vbar(x='type',top='rjs_sd',source = source,
       width = 0.8,alpha = 0.8,color = 'blue')
# 绘制人均消费得分柱状图

p1.yaxis.axis_label = "性价比得分"
p1.xaxis.axis_label = "人均消费"
p2.xaxis.axis_label = "餐饮类别"
p2.yaxis.axis_label = "口味得分"
p3.xaxis.axis_label = "餐饮类别"
p3.yaxis.axis_label = "人均消费得分"

p = gridplot([[p1, p2, p3]])
show(p)


Supplying a user-defined data source AND iterable values to glyph methods is deprecated.

See https://github.com/bokeh/bokeh/issues/2056 for more information.

  warn(message)


In [67]:
from bokeh.palettes import brewer
os.chdir(r'C:\Users\acer\Desktop')
df1 = pd.read_excel('素菜馆数据.xlsx')
df2 = pd.read_excel('基本坐标数据.xlsx')
df1['zf_sd'] = (df1['综合得分'] - df1['综合得分'].min()) / (df1['综合得分'].max()-df1['综合得分'].min())  #标准化综合得分
# print(df1.head())
n = 8
length = len(df1)
rng = np.random.RandomState(1)
colormap = brewer['Greens'][n]
df1['color'] = [colormap[x] for x in rng.randint(0,n,length)] # 设定颜色
df1.sort(columns = 'zf_sd',ascending = False,inplace=True)
# print(df1.head())
p = figure(plot_width = 600,plot_height=700,title='空间散点图')
p.square_cross(df1['Lng'],df1['Lat'],
        size = df1['zf_sd']*30,
        line_color = 'white',   # 设置点边线为白色
         fill_color = df1['color'],fill_alpha = 0.6   # 设置内部填充颜色
        )
# 绘制素菜馆位置散点图
p.square(df2['lng'],df2['lat'],
        size = 0.3,
        color = 'black')
# 绘制上海区地图
p.square(df1[:10]['Lng'],df1[:10]['Lat'],
        color = 'red',alpha = 0.5,
         size = df1[:10]['zf_sd']*10
        )
# 给前10上色

p.title.text_color = "white"
p.title.text_font = "times"
p.title.text_font_style = "italic"
p.title.background_fill_color = "black"
# 标题相关设置
p.ygrid.grid_line_alpha = 0.8
p.ygrid.grid_line_dash = [6, 4]
p.xgrid.grid_line_alpha = 0.8
p.xgrid.grid_line_dash = [6, 4]
# 格网设置
show(p)


Unnamed: 0,Z,餐馆数量,Lat,Lng,素菜馆数量,长度,综合得分,Unnamed: 7,zf_sd,color
4825,42691,32,31.298926,121.460775,1,11215.542456,19329.000000,,1.000000,#74c476
4768,42691,103,31.289106,121.468936,1,9564.642648,19020.000000,,0.984014,#f7fcf5
4643,42691,91,31.273299,121.481411,1,8157.216228,18735.000000,,0.969269,#41ab5d
4440,40441,209,31.249197,121.469009,1,10435.319726,18326.000000,,0.948109,#238b45
4163,36929,895,31.214779,121.461093,3,14432.974864,17927.000000,,0.927467,#a1d99b
4301,36929,1049,31.224683,121.452976,3,14010.454617,17889.000000,,0.925501,#a1d99b
4369,38393,403,31.233560,121.439824,2,11831.283869,17845.000000,,0.923224,#74c476
4437,38393,346,31.248734,121.441487,4,11489.521043,17759.000000,,0.918775,#f7fcf5
4299,38393,390,31.228924,121.436314,3,10467.176607,17568.000000,,0.908893,#f7fcf5
4372,35036,1244,31.236627,121.468377,2,15483.180214,17484.000000,,0.904548,#005a32
