### 前言
> 世界上较为主流的大学排名有美国U.S. News世界大学排名、英国QS世界大学排名、英国泰晤士高等教育世界大学排名，以及学术类排名如世界大学自然指数排名、中国软科世界大学学术排名等。影响力较大的还有沙特CWUR世界大学排名、美国Scimago世界大学排名、西班牙CSIC世界大学排名、荷兰CWTS世界大学排名等。此外，武汉大学中国科教评价网版世界大学及研究机构排行榜和中国台湾大学（NTU）版世界大学排名也具有一定的影响力。同时还有世界科研机构排名如自然指数排名等。
![Image Name](http://p2.itc.cn/images01/20200610/a4af2459eef84d02ac3120246dc83a6e.jpeg)
* 此次选用的是6月份刚刚公布的**2021年度英国QS世界大学排名**；

---

#### 排名规则

在看数据之前，我们可以简单了解一下QS的排名方法。

QS通过如下6个指标对各大学进行评估：
1. 学术声誉（40%）

2. 雇主声誉（10%）

3. 师生比（20%）

4. 每名教师的引用率（20%）

5. 国际教师比例（5%）

6. 留学生比例（5%）

篇幅有限，单项指标的评估细则可参考[QS世界大学排名 - 排名方法](https://www.qschina.cn/qs-world-university-rankings/methodology)




In [1]:
from pyecharts.charts import *
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.components import Table
import re
import pandas as pd

df = pd.read_csv('/home/kesci/input/top_university3648/top_university.csv')

# 香港，澳门等在办单中是分开的，都归为china
df['loc'] = df['country']
df['country'].replace(['China (Mainland)', 'Hong Kong SAR', 'Taiwan', 'Macau SAR'],'China',inplace=True)

In [3]:
tool_js = """
<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">
                 {} 
                 </div>
                 排名：{} <br>
                 国家地区：{} <br>
                 加权总分：{} <br>
                 国际学生：{} <br>
                 国际教师：{} <br>
                 师生比例：{} <br>
                 学术声誉：{} <br>
                 雇主声誉：{} <br>
                 教员引用率：{} <br>
"""

t_data = df[(df.year==2021) & (df['rank']<=100)]
t_data = t_data.sort_values(by="total_score" , ascending=True) 

university, score = [], []
for idx, row in t_data.iterrows():
    tjs = tool_js.format(row['university'], row['rank'], row['country'],row['total_score'], 
                         row['score_6'],row['score_5'], row['score_3'],row['score_1'],row['score_2'], row['score_4'])
    if row['country'] == 'China':
        university.append('🇨🇳 {}'.format(re.sub('（.*?）', '',row['university'])))
    else:
        university.append(re.sub('（.*?）', '',row['university']))
    score.append(opts.BarItem(name='', value=row['total_score'], tooltip_opts=opts.TooltipOpts(formatter=tjs)))

### TOP 100高校

篇幅有限，这边只展示TOP100的高校，完整的榜单可以通过附件下载查看～

* 排名第一的大学是麻省理工，在单项上除了**国际学生**和**教员引用率**其余都是100分；

* TOP4大学全部来自美国，除此之外是排名第五的牛津大学；

* **国内排名最高的大学是清华大学，排名15**，其次是香港大学&北京大学；

In [4]:
bar = (Bar()
       .add_xaxis(university)
       .add_yaxis('', score, category_gap='30%')
       .set_global_opts(title_opts=opts.TitleOpts(title="2021年世界大学排名（QS） TOP 100",
                                                  pos_left="center",
                                                  title_textstyle_opts=opts.TextStyleOpts(font_size=20)),
                        datazoom_opts=opts.DataZoomOpts(range_start=70, range_end=100, orient='vertical'),
                        visualmap_opts=opts.VisualMapOpts(is_show=False, max_=100, min_=60, dimension=0,
                                range_color=['#00FFFF', '#FF7F50']),
                        legend_opts=opts.LegendOpts(is_show=False),
                        xaxis_opts=opts.AxisOpts(is_show=False, is_scale=True),
                        yaxis_opts=opts.AxisOpts(axistick_opts=opts.AxisTickOpts(is_show=False),
                                                 axisline_opts=opts.AxisLineOpts(is_show=False),
                                                 axislabel_opts=opts.LabelOpts(font_size=12)))
       .set_series_opts(label_opts=opts.LabelOpts(is_show=True,
                                                  position='right',
                                                  font_style='italic'),
                        itemstyle_opts={"normal": {
                                                    "barBorderRadius": [30, 30, 30, 30],
                                                    'shadowBlur': 10,
                                                    'shadowColor': 'rgba(120, 36, 50, 0.5)',
                                                    'shadowOffsetY': 5,
                                                }
                                       }
).reversal_axis())

grid = (
        Grid(init_opts=opts.InitOpts(theme='purple-passion', width='1000px', height='1200px'))
        .add(bar, grid_opts=opts.GridOpts(pos_right='10%', pos_left='20%'))
    )
grid.render_notebook()

In [5]:
tool_js = """
<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">
                 {} 
                 </div>
                 世界排名：{} <br>
                 国家地区：{} <br>
                 加权总分：{} <br>
                 国际学生：{} <br>
                 国际教师：{} <br>
                 师生比例：{} <br>
                 学术声誉：{} <br>
                 雇主声誉：{} <br>
                 教员引用率：{} <br>
"""

t_data = df[(df.country=='China') & (df['rank']<=500)]
t_data = t_data.sort_values(by="total_score" , ascending=True) 

university, score = [], []
for idx, row in t_data.iterrows():
    tjs = tool_js.format(row['university'], row['rank'], row['country'],row['total_score'], 
                         row['score_6'],row['score_5'], row['score_3'],row['score_1'],row['score_2'], row['score_4'])
    if row['country'] == 'China':
        university.append('🇨🇳 {}'.format(re.sub('（.*?）', '',row['university'])))
    else:
        university.append(re.sub('（.*?）', '',row['university']))
    score.append(opts.BarItem(name='', value=row['total_score'], tooltip_opts=opts.TooltipOpts(formatter=tjs)))

### 中国大学排名

因为在500名之后没有具体的分值，所以这里只筛选了榜单TOP 500中的国内高校；

* 在第一梯队中，香港的高校占比很高，**TOP10中有4所来自香港**；

* 刨除香港的高校，**TOP5高校分别是清华，北大，复旦，上交，浙大**；

In [6]:
bar = (Bar()
       .add_xaxis(university)
       .add_yaxis('', score, category_gap='30%')
       .set_global_opts(title_opts=opts.TitleOpts(title="TOP 500中的中国大学",
                                                  pos_left="center",
                                                  title_textstyle_opts=opts.TextStyleOpts(font_size=20)),
                        datazoom_opts=opts.DataZoomOpts(range_start=50, range_end=100, orient='vertical'),
                        visualmap_opts=opts.VisualMapOpts(is_show=False, max_=90, min_=20, dimension=0,
                                range_color=['#00FFFF', '#FF7F50']),
                        legend_opts=opts.LegendOpts(is_show=False),
                        xaxis_opts=opts.AxisOpts(is_show=False, is_scale=True),
                        yaxis_opts=opts.AxisOpts(axistick_opts=opts.AxisTickOpts(is_show=False),
                                                 axisline_opts=opts.AxisLineOpts(is_show=False),
                                                 axislabel_opts=opts.LabelOpts(font_size=12)))
       .set_series_opts(label_opts=opts.LabelOpts(is_show=True,
                                                  position='right',
                                                  font_style='italic'),
                        itemstyle_opts={"normal": {
                                                    "barBorderRadius": [30, 30, 30, 30],
                                                    'shadowBlur': 10,
                                                    'shadowColor': 'rgba(120, 36, 50, 0.5)',
                                                    'shadowOffsetY': 5,
                                                }
                                       }
).reversal_axis())

grid = (
        Grid(init_opts=opts.InitOpts(theme='purple-passion', width='1000px', height='1200px'))
        .add(bar, grid_opts=opts.GridOpts(pos_right='10%', pos_left='20%'))
    )
grid.render_notebook()

### 按大洲分布

* TOP 1000高校中有**近40%是来自于欧洲**；

* 非洲仅有11所高校上榜；

In [7]:
t_data = df[(df.year==2021) & (df['rank']<=1000)]
t_data = t_data.groupby(['region'])['university'].count().reset_index()
t_data.columns = ['region', 'num']
t_data = t_data.sort_values(by="num" , ascending=False) 


bar = (Bar(init_opts=opts.InitOpts(theme='purple-passion', width='1000px', height='600px'))
       .add_xaxis(t_data['region'].tolist())
       .add_yaxis('出现次数', t_data['num'].tolist(), category_gap='50%')
       .set_global_opts(title_opts=opts.TitleOpts(title="TOP 1000高校按大洲分布",
                                                  pos_left="center",
                                                  title_textstyle_opts=opts.TextStyleOpts(font_size=20)),
                        visualmap_opts=opts.VisualMapOpts(is_show=False, max_=300, min_=0, dimension=1,
                                range_color=['#00FFFF', '#FF7F50']),
                        legend_opts=opts.LegendOpts(is_show=False),
                        xaxis_opts=opts.AxisOpts(axistick_opts=opts.AxisTickOpts(is_show=False),
                                                 axisline_opts=opts.AxisLineOpts(is_show=False),
                                                 axislabel_opts=opts.LabelOpts(font_size=15)),
                        yaxis_opts=opts.AxisOpts(is_show=False))
       .set_series_opts(label_opts=opts.LabelOpts(is_show=True,
                                                  position='top',
                                                  font_size=15,
                                                  font_style='italic'),
                        itemstyle_opts={"normal": {
                                                    "barBorderRadius": [30, 30, 30, 30],
                                                    'shadowBlur': 10,
                                                    'shadowColor': 'rgba(120, 36, 50, 0.5)',
                                                    'shadowOffsetY': 5,
                                                }
                                       }
))

bar.render_notebook()

In [8]:
# 以下国家单独在地图上显示出来
country_list = ['China', 'United States', 'Brazil', 'United Kingdom', 'Canada', 'Russia', 'India']

# 对应国家的经纬度
loc = {
    'Brazil': [-51.92528, -14.235004],
    'Canada': [-106.346771, 56.130366],
    'China': [104.195397, 35.86166],
    'India': [78.96288, 20.593684],
    'United Kingdom': [-3.435973, 55.378051],
    'United States': [-95.712891, 37.09024],
    'Russia': [116.8564, 65.067703],
}

t_data = df[(df.year==2021) & (df['rank']<=1000)]
t_data = t_data.groupby(['country'])['university'].count().reset_index()
t_data.columns = ['country', 'num']
t_data = t_data.sort_values(by="num" , ascending=True) 

data_pair = []
for idx, row in t_data.iterrows():
    if row['country'] in ['China (Mainland)', 'Hong Kong SAR', 'Taiwan', 'Macau SAR']:
        data_pair.append(['China', row['num']])
    else:
        data_pair.append([row['country'], row['num']])

### 按国家分布

* **美国拥有151所排名第一**，其次是英国（84所）,中国（76所）；

* 非洲地区基本空白，仅有**埃及4所 & 南非7**所高校上榜；

In [9]:
fmt_js = """function (params) {return params.name+': '+Number(params.value[2]);}"""

mp = Map()
mp.add(
        "高校数量",
        data_pair,
        "world",
        is_map_symbol_show=False,
        is_roam=False)

mp.set_series_opts(label_opts=opts.LabelOpts(is_show=False),
                          itemstyle_opts={'normal': {
                                                'areaColor': '#191970',
                                                'borderColor': '#1773c3',
                                                'shadowColor': '#1773c3',
                                                'shadowBlur': 20,
                                                'opacity': 0.8
                                                    }
                                        })
    
mp.set_global_opts(
        title_opts=opts.TitleOpts(title="TOP 1000高校按国家分布", pos_left='center',
                                  title_textstyle_opts=opts.TextStyleOpts(font_size=18)),
        legend_opts=opts.LegendOpts(is_show=False),
        visualmap_opts=opts.VisualMapOpts(is_show=False, 
                                          max_=100,
                                          is_piecewise=False,
                                          dimension=0,
                                          range_color=['rgba(255,228,225,0.6)', 'rgba(255,0,0,0.9)', 'rgba(255,0,0,1)'])
    )

data_pair = [[x, y] for x, y in data_pair if x in country_list]    
geo = Geo()
    
# 需要先将几个国家的经纬度信息加入到geo中
for k, v in loc.items():
    geo.add_coordinate(k, v[0], v[1])
# 这里将geo的地图透明度配置为0
geo.add_schema(maptype="world", is_roam=False, itemstyle_opts={'normal': {'opacity': 0}})
    
geo.add("", data_pair, symbol_size=1)
# 显示标签配置
geo.set_series_opts(
    label_opts=opts.LabelOpts(
            is_show=True,
            position='right',
            color='white',
            font_size=12,
            font_weight='bold',
            formatter=JsCode(fmt_js)),
    )
    
grid = (
        Grid(init_opts=opts.InitOpts(theme='chalk', width='1000px', height='600px'))
        .add(mp, grid_opts=opts.GridOpts(pos_top="12%"))
        .add(geo, grid_opts=opts.GridOpts(pos_bottom="12%"))
    )

grid.render_notebook()

In [10]:
t_data = df[(df.year==2021) & (df['rank']<=1000)]
t_data = t_data.groupby(['region', 'country'])['university'].count().reset_index()
t_data.columns = ['region', 'country', 'num']
#t_data.num = round(t_data.num.div(t_data.num.sum(axis=0), axis=0) * 100, 1)

data_pair = [
            {"name": 'Europe',
              "label":{"show": True},
              "children": []},
            {"name": 'Asia',
              "label":{"show": True},
              "children": []},
            {"name": 'North America',
              "label":{"show": True},
              'shadowBlur': 10,
              'shadowColor': 'rgba(120, 36, 50, 0.5)',
              'shadowOffsetY': 5,
              "children": []},
            {"name": 'Latin America',
              "label":{"show": True},
              "children": []},
            {"name": 'Oceania',
              "label":{"show": True},
              "children": []},
            {"name": 'Africa',
              "label":{"show": False},
              "children": []}
    ]

for idx, row in t_data.iterrows():
    t_dict = {"name": row.country,
              "label":{"show": True},
              "children": []}
    if row.num > 15:
        child_data = {"name": row.country, "value":row.num, "label":{"show": True}}
    else:
        child_data = {"name": row.country, "value":row.num, "label":{"show": False}}
    if row.region == "Europe":
        data_pair[0]['children'].append(child_data)   
    elif row.region == "Asia":
        data_pair[1]['children'].append(child_data)   
    elif row.region == "North America":
        data_pair[2]['children'].append(child_data)  
    elif row.region == "Latin America":
        data_pair[3]['children'].append(child_data)  
    elif row.region == "Oceania":
        data_pair[4]['children'].append(child_data)  
    elif row.region == "Africa":
        data_pair[5]['children'].append(child_data)  

### 大洲-国家分布

In [11]:
c = (Sunburst(
        init_opts=opts.InitOpts(
            theme='purple-passion',
            width="1000px",
            height="1000px"))
    .add(
        "",
        data_pair=data_pair,
        highlight_policy="ancestor",
        radius=[0, "100%"],
        sort_='null',
        levels=[
            {},
            {
                "r0": "20%",
                "r": "48%",
                "itemStyle": {"borderColor": 'rgb(220,220,220)', "borderWidth": 2}
            },
            {"r0": "50%", "r": "80%", "label": {"align": "right"},
                "itemStyle": {"borderColor": 'rgb(220,220,220)', "borderWidth": 1}}
        ],
    )
    .set_global_opts(
        visualmap_opts=opts.VisualMapOpts(is_show=False, max_=300, min_=0, is_piecewise=False,
                                range_color=['#4285f4', '#34a853', '#fbbc05', '#ea4335', '#ea4335']),
        title_opts=opts.TitleOpts(title="TOP 1000\n\n大学地理分布",
                                               pos_left="center",
                                               pos_top="center",
                                               title_textstyle_opts=opts.TextStyleOpts(font_style='oblique', font_size=20),))
    .set_series_opts(label_opts=opts.LabelOpts(font_size=14, formatter="{b}: {c}"))
)

c.render_notebook()

### 中美英对比

我们从师资力量 & 国际化两个方面对比一下中，英，美三国的高校，看看能发现点什么

* 师资力量：主要通过学术声誉（40%） & 教员引用率（20%）& 师生比（20%）这三个指标对比；

* 国际化：主要通过国际教师（5%） & 国际学生（5%）这三个指标对比；

#### 师资力量

x轴为师生比，y轴为教员引用率，图形大小反映学校声誉，图形明暗反映排名；

其实通过下图来看，并不能看到明显的差距，三国的高校都还是分布比较平均，虽然在最右上角都是被美国高校给占据了；

In [12]:
cn_data_x, cn_data_y = [], []
for idx, row in df[(df.country=='China') & (df['rank']<=1000)].iterrows():
    cn_data_y.append([row['score_4'], row['score_1'], row['rank'], row['university']])
    cn_data_x.append(row['score_3'])
    
un_data_x, un_data_y = [], []
for idx, row in df[(df.country=='United States') & (df['rank']<=1000)].iterrows():
    un_data_y.append([row['score_4'], row['score_1'], row['rank'], row['university']])
    un_data_x.append(row['score_3'])
    
uk_data_x, uk_data_y = [], []
for idx, row in df[(df.country=='United Kingdom') & (df['rank']<=1000)].iterrows():
    uk_data_y.append([row['score_4'], row['score_1'], row['rank'], row['university']])
    uk_data_x.append(row['score_3'])

tool_js = """
function (obj) {
            var value = obj.value;
            var schema = [{name: 'rank', index: 0, text: '总体排名'},
                            {name: 'score_1', index: 1, text: '学术声誉'},
                            {name: 'score_4', index: 2, text: '教员引用率'},
                            {name: 'score_3', index: 3, text: '师生比例'}];
            return '<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">'
                + value[4] 
                + '</div>'
                + schema[0].text + '：' + value[3] + '<br>'
                + schema[1].text + '：' + value[2] + '<br>'
                + schema[2].text + '：' + value[1] + '<br>'
                + schema[3].text + '：' + value[0] + '<br>';
        }
"""

itemStyle_1 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#80F1BE'
}

itemStyle_2 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#fec42c'
}

itemStyle_3 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#dd4444'
}


visualMap = [
        {
            'left': 'right',
            'top': '10%',
            'dimension': 2,
            'min': 20,
            'max': 100,
            'itemWidth': 30,
            'itemHeight': 120,
            'calculable': True,
            'precision': 0.1,
            'text': ['圆形大小：学术声誉'],
            'textGap': 30,
            'textStyle': {
                'color': '#fff'
            },
            'inRange': {
                'symbolSize': [10, 50]
            },
            'outOfRange': {
                'symbolSize': [10, 50],
                'color': ['rgba(255,255,255,.2)']
            },
            'controller': {
                'inRange': {
                    'color': ['#c23531']
                },
                'outOfRange': {
                    'color': ['#444']
                }
            }
        },
        {
            'left': 'right',
            'bottom': '15%',
            'dimension': 3,
            'min': 1,
            'max': 500,
            'itemHeight': 120,

            'precision': 0.1,
            'text': ['明暗：总体排名'],
            'textGap': 30,
            'textStyle': {
                'color': '#fff'
            },
            'inRange': {
                'colorLightness': [0.5, 1]
            },
            'outOfRange': {
                'color': ['rgba(255,255,255,.2)']
            },
            'controller': {
                'inRange': {
                    'color': ['#c23531']
                },
                'outOfRange': {
                    'color': ['#444']
                }
            }
        }
    ]

scatter1 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(cn_data_x)
            .add_yaxis("中国", cn_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_3
                       )
            .set_global_opts(yaxis_opts=opts.AxisOpts(name='教员引用率', type_="value", is_scale=True, 
                                                      name_textstyle_opts={'color': '#fff', 'fontSize': 16},
                                                      axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color='#eee'))),
                             xaxis_opts=opts.AxisOpts(name='师生比', type_="value", is_scale=True, 
                                                      name_textstyle_opts={'color': '#fff', 'fontSize': 16},
                                                      axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color='#eee'))),
                             tooltip_opts=opts.TooltipOpts(is_show=True, background_color='#222', border_color='#777', border_width=1, formatter=JsCode(tool_js)),
                             legend_opts=opts.LegendOpts(is_show=True, pos_right=10,
                                                         textstyle_opts=opts.TextStyleOpts(color='#fff',font_size=16)),
                             visualmap_opts=visualMap
                             )
            )

scatter2 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(un_data_x)
            .add_yaxis("美国", un_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_2
                       )
            )
            
scatter3 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(uk_data_x)
            .add_yaxis("英国", uk_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_1
                       )
            )
            
scatter1.overlap(scatter2)
scatter1.overlap(scatter3)
scatter1.render_notebook()

#### 国际化

虽然国际老师&国际学生这两项数据加起来也不过10%的权重，不过也是这部分数据恰好能说明一些问题：

* 美国整体分布较为平均；

* 右上角基本被英国的高校占据了，这也是欧洲地区的优势吧；

* 左下角也基本被中国的高校占据了，而且仔细去看的话会发现，右上角的几个中国高校也都是香港的；

综上来看，在国际化程度上我们与英美还是有较大差距的；

In [13]:
cn_data_x, cn_data_y = [], []
for idx, row in df[(df.country=='China') & (df['rank']<=1000)].iterrows():
    cn_data_y.append([row['score_6'], row['total_score'], row['rank'], row['university']])
    cn_data_x.append(row['score_5'])
    
un_data_x, un_data_y = [], []
for idx, row in df[(df.country=='United States') & (df['rank']<=1000)].iterrows():
    un_data_y.append([row['score_6'], row['total_score'], row['rank'], row['university']])
    un_data_x.append(row['score_5'])
    
uk_data_x, uk_data_y = [], []
for idx, row in df[(df.country=='United Kingdom') & (df['rank']<=1000)].iterrows():
    uk_data_y.append([row['score_6'], row['total_score'], row['rank'], row['university']])
    uk_data_x.append(row['score_5'])

tool_js = """
function (obj) {
            var value = obj.value;
            var schema = [{name: 'rank', index: 0, text: '总体排名'},
                            {name: 'score_1', index: 1, text: '国际学生'},
                            {name: 'score_4', index: 2, text: '国际教师'},
                            {name: 'score_3', index: 3, text: '总体分数'}];
            return '<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">'
                + value[4] 
                + '</div>'
                + schema[0].text + '：' + value[3] + '<br>'
                + schema[1].text + '：' + value[1] + '<br>'
                + schema[2].text + '：' + value[0] + '<br>'
                + schema[3].text + '：' + value[2] + '<br>';
        }
"""

itemStyle_1 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#80F1BE'
}

itemStyle_2 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#fec42c'
}

itemStyle_3 = {
    'opacity': 0.8,
    'shadowBlur': 10,
    'shadowOffsetX': 0,
    'shadowOffsetY': 0,
    'shadowColor': 'rgba(0, 0, 0, 0.5)',
    'color': '#dd4444'
}


visualMap = [
        {
            'left': 'right',
            'top': '10%',
            'dimension': 2,
            'min': 20,
            'max': 100,
            'itemWidth': 30,
            'itemHeight': 120,
            'calculable': True,
            'precision': 0.1,
            'text': ['圆形大小：总体分数'],
            'textGap': 30,
            'textStyle': {
                'color': '#fff'
            },
            'inRange': {
                'symbolSize': [10, 50]
            },
            'outOfRange': {
                'symbolSize': [10, 50],
                'color': ['rgba(255,255,255,.2)']
            },
            'controller': {
                'inRange': {
                    'color': ['#c23531']
                },
                'outOfRange': {
                    'color': ['#444']
                }
            }
        },
        {
            'left': 'right',
            'bottom': '15%',
            'dimension': 3,
            'min': 1,
            'max': 500,
            'itemHeight': 120,

            'precision': 0.1,
            'text': ['明暗：总体排名'],
            'textGap': 30,
            'textStyle': {
                'color': '#fff'
            },
            'inRange': {
                'colorLightness': [0.5, 1]
            },
            'outOfRange': {
                'color': ['rgba(255,255,255,.2)']
            },
            'controller': {
                'inRange': {
                    'color': ['#c23531']
                },
                'outOfRange': {
                    'color': ['#444']
                }
            }
        }
    ]

scatter1 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(cn_data_x)
            .add_yaxis("中国", cn_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_3
                       )
            .set_global_opts(yaxis_opts=opts.AxisOpts(name='国际学生', type_="value", is_scale=True, 
                                                      name_textstyle_opts={'color': '#fff', 'fontSize': 16},
                                                      axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color='#eee'))),
                             xaxis_opts=opts.AxisOpts(name='国际教师', type_="value", is_scale=True, 
                                                      name_textstyle_opts={'color': '#fff', 'fontSize': 16},
                                                      axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color='#eee'))),
                             tooltip_opts=opts.TooltipOpts(is_show=True, background_color='#222', border_color='#777', border_width=1, formatter=JsCode(tool_js)),
                             legend_opts=opts.LegendOpts(is_show=True, pos_right=10,
                                                         textstyle_opts=opts.TextStyleOpts(color='#fff',font_size=16)),
                             visualmap_opts=visualMap
                             )
            )

scatter2 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(un_data_x)
            .add_yaxis("美国", un_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_2
                       )
            )
            
scatter3 = (Scatter(init_opts=opts.InitOpts(bg_color='#404a59',width='1000px', height='800px'))
            .add_xaxis(uk_data_x)
            .add_yaxis("英国", uk_data_y,
                       label_opts=opts.LabelOpts(is_show=False),
                       itemstyle_opts=itemStyle_1
                       )
            )
            
scatter1.overlap(scatter2)
scatter1.overlap(scatter3)
scatter1.render_notebook()

#### TOP100高校对比

筛选TOP 100的高校中中，英，美三国的数据进行对比，可以明显的看到：

⚠️ 为方便对比，这里剔除了港澳台的高校～

* 中国在国际学生和国际教师两项上得分偏低；

* 美国整体比较均衡；

* 英国在国际学生和国际教师两项上优势较大，但在教员引用率上比较欠缺；

In [14]:
t_data = df[(df['loc'] == 'China (Mainland)') & (df['rank'] <= 100)]

data_cn = []
for idx, row in t_data.iterrows():
    data_cn.append([row['score_1'], row['score_2'], row['score_3'],
                    row['score_4'], row['score_5'], row['score_6'], row['university']])


t_data = df[(df['loc'] == 'United States') & (df['rank'] <= 100)]

data_un = []
for idx, row in t_data.iterrows():
    data_un.append([row['score_1'], row['score_2'], row['score_3'],
                    row['score_4'], row['score_5'], row['score_6'], row['university']])
                    
t_data = df[(df['loc'] == 'United Kingdom') & (df['rank'] <= 100)]

data_uk = []
for idx, row in t_data.iterrows():
    data_uk.append([row['score_1'], row['score_2'], row['score_3'],
                    row['score_4'], row['score_5'], row['score_6'], row['university']
                    
                     ])

In [15]:
split_line_style = {'color': [
                    'rgba(238, 197, 102, 0.1)', 'rgba(238, 197, 102, 0.2)',
                    'rgba(238, 197, 102, 0.4)', 'rgba(238, 197, 102, 0.6)',
                    'rgba(238, 197, 102, 0.8)', 'rgba(238, 197, 102, 1)'
                    ][::-1]
}

tool_js = """
function (obj) {
            var value = obj.value;
            var schema = [{name: 'score_1', index: 1, text: '学术声誉'},
                            {name: 'score_4', index: 2, text: '雇主声誉'},
                            {name: 'score_3', index: 3, text: '师生比'},
                            {name: 'score_3', index: 3, text: '教员引用率'},
                            {name: 'score_4', index: 2, text: '国际教师'},
                            {name: 'score_3', index: 3, text: '国际学生'}];
            return '<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">'
                + value[6] 
                + '</div>'
                + schema[0].text + '：' + value[0] + '<br>'
                + schema[1].text + '：' + value[1] + '<br>'
                + schema[2].text + '：' + value[2] + '<br>'
                + schema[3].text + '：' + value[3] + '<br>'
                + schema[4].text + '：' + value[4] + '<br>'
                + schema[5].text + '：' + value[5] + '<br>';
        }
"""

radar = Radar(init_opts=opts.InitOpts(theme='dark', bg_color='#161627', height='800px', width='1000px'))
radar.add_schema(shape='circle',
                 textstyle_opts=opts.TextStyleOpts(color='rgb(238, 197, 102)'),
                 axisline_opt=opts.LineStyleOpts(is_show=True, color='rgba(238, 197, 102, 1)'),
                 splitline_opt=opts.SplitLineOpts(is_show=True, linestyle_opts=split_line_style),
                 schema=[opts.RadarIndicatorItem(name='学术声誉', max_=100),
                         opts.RadarIndicatorItem(name='雇主声誉', max_=100),
                         opts.RadarIndicatorItem(name='师生比', max_=100),
                         opts.RadarIndicatorItem(name="教员引用率", max_=100),
                         opts.RadarIndicatorItem(name="国际教师", max_=100),
                         opts.RadarIndicatorItem(name="国际学生", max_=100)])

radar.add('中国', data_cn, symbol='none', is_selected=True,
          label_opts=opts.LabelOpts(is_show=False),
          linestyle_opts=opts.LineStyleOpts(color='#dd4444', width=1, opacity=0.5),
          areastyle_opts=opts.AreaStyleOpts(color='#dd4444', opacity=0.05))

radar.add('美国', data_un, symbol='none', is_selected=False,
          label_opts=opts.LabelOpts(is_show=False),
          linestyle_opts=opts.LineStyleOpts(color='#fec42c', width=1, opacity=0.5),
          areastyle_opts=opts.AreaStyleOpts(color='#fec42c', opacity=0.05))

radar.add('英国', data_uk, symbol='none', is_selected=False,
          label_opts=opts.LabelOpts(is_show=False),
          linestyle_opts=opts.LineStyleOpts(color='#80F1BE', width=1, opacity=0.5),
          areastyle_opts=opts.AreaStyleOpts(color='#80F1BE',opacity=0.05))

radar.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, selected_mode='multiple', pos_bottom=5),
                      tooltip_opts=opts.TooltipOpts(is_show=True, background_color='#222', 
                          border_color='#777', border_width=1, formatter=JsCode(tool_js)),
                      title_opts=opts.TitleOpts(title="中英美——TOP100大学对比", pos_left='center',
                                                title_textstyle_opts=opts.TextStyleOpts(font_size=20)))


radar.render_notebook()

### 单项排名

* 在**学术声誉上国内排名最高的是北京大学**；

* 在教员引用率指标上，总体排名94的**中科大排名全球第6**，国内第一；

* **教员引用率这个指标明显偏向于理工类院校**；

* 国内高校在师生比排名普遍偏低；

* 国际教师&国际学生这两个指标TOP100榜单中**除开港澳台高校仅有浙大上榜**；

In [16]:
tool_js = """
<div style="border-bottom: 1px solid rgba(255,255,255,.3); font-size: 18px;padding-bottom: 7px;margin-bottom: 7px">
                 {} 
                 </div>
                 排名：{} <br>
                 国家地区：{} <br>
                 加权总分：{} <br>
                 国际学生：{} <br>
                 国际教师：{} <br>
                 师生比例：{} <br>
                 学术声誉：{} <br>
                 雇主声誉：{} <br>
                 教员引用率：{} <br>
"""


t_data = df[df['rank']<=1000]
item_rank = {
    '学术声誉':'score_1',
    '教员引用率':'score_4',
    '师生比':'score_3',
    '雇主声誉':'score_2',
    '国际教师':'score_5',
    '国际学生':'score_6'
}

tab = Tab()
for item in item_rank.items():
    t_data = t_data[t_data[item[1]]> 0]
    t_data = t_data.sort_values(by=item[1] , ascending=True) 
    university, score = [], []
    for idx, row in t_data.tail(100).iterrows():
        tjs = tool_js.format(row['university'], row['rank'], row['country'],row['total_score'], 
                             row['score_6'],row['score_5'], row['score_3'],row['score_1'],row['score_2'], row['score_4'])
        if row['country'] == 'China':
            university.append('🇨🇳 {}'.format(re.sub('（.*?）', '',row['university'])))
        else:
            university.append(re.sub('（.*?）', '',row['university']))
        score.append(opts.BarItem(name='', value=row[item[1]], tooltip_opts=opts.TooltipOpts(formatter=tjs)))
    
    
    bar = (Bar()
           .add_xaxis(university)
           .add_yaxis('', score, category_gap='30%')
           .set_global_opts(title_opts=opts.TitleOpts(title="2021年世界大学「{}」排名（QS） TOP 100".format(item[0]),
                                                      pos_left="center",
                                                      title_textstyle_opts=opts.TextStyleOpts(font_size=20)),
                            datazoom_opts=opts.DataZoomOpts(range_start=70, range_end=100, orient='vertical'),
                            visualmap_opts=opts.VisualMapOpts(is_show=False, max_=100, min_=90, dimension=0,
                                    range_color=['#00FFFF', '#FF7F50']),
                            legend_opts=opts.LegendOpts(is_show=False),
                            xaxis_opts=opts.AxisOpts(is_show=False, max_=100, is_scale=True),
                            yaxis_opts=opts.AxisOpts(axistick_opts=opts.AxisTickOpts(is_show=False),
                                                     axisline_opts=opts.AxisLineOpts(is_show=False),
                                                     axislabel_opts=opts.LabelOpts(font_size=12)))
           .set_series_opts(label_opts=opts.LabelOpts(is_show=True,
                                                      position='right',
                                                      font_style='italic'),
                            itemstyle_opts={"normal": {
                                                        "barBorderRadius": [30, 30, 30, 30],
                                                        'shadowBlur': 10,
                                                        'shadowColor': 'rgba(120, 36, 50, 0.5)',
                                                        'shadowOffsetY': 5,
                                                    }
                                           }
    ).reversal_axis())
    
    grid = (
            Grid(init_opts=opts.InitOpts(theme='purple-passion', width='1000px', height='1200px'))
            .add(bar, grid_opts=opts.GridOpts(pos_right='10%', pos_left='20%'))
        )
    tab.add(grid, item[0])
    
tab.render_notebook()

In [17]:
headers = ["学校", "国家", "大洲", "学术声誉", "教员引用率", "师生比",
          "雇主声誉", "国际教师", "国际学生", "总分", "排名"]
rows = []
for idx, row in df.iterrows():
    rows.append([row['university'], row['country'], row['region'], row['score_1'],
                 row['score_4'], row['score_3'], row['score_2'], row['score_5'], 
                 row['score_6'], row['total_score'], row['rank']])

headers = ["学校", "排名"]
rows = []
for idx, row in df.iterrows():
    rows.append([row['university'], row['rank']])


### 完整榜单

完整榜单请下载附件查看～

In [18]:
table = Table()
table.add(headers, rows[:100])

table.render_notebook()

学校,排名
麻省理工学院,1
斯坦福大学,2
哈佛大学,3
加州理工大学（Caltech),4
牛津大学,5
苏黎世联邦理工大学（瑞士联邦理工学院）,6
剑桥大学,7
帝国理工学院,8
芝加哥大学,9
伦敦大学学院,10


In [19]:
table = Table()
table.add(headers, rows)

table.render('top_university/top_university_full_list.html')

'/home/kesci/work/top_university/top_university_full_list.html'

* ***欢迎点赞，Fork❤️ 🧡 ～～***