# 世界幸福指数
---

### 幸福分数和排名使用盖洛普世界民意调查的数据。分数基于对民意调查中提出的主要生活评估问题的答案。这个问题称为Cantril阶梯，要求被调查者考虑一个阶梯，该阶梯的最长寿命是10，而最糟糕的寿命是0，并以此等级来评价自己当前的寿命。分数来自2013-2016年全国代表性样本，并使用盖洛普权重使估算值具有代表性。
---

# ※数据来源
### Kaggle官网——世界幸福报告
---

# ※数据所代表的意思：

### 1. 幸福分数：通过向被调查的人提问以下问题来衡量该指标：“您如何以0-10的的等级来评价自己的幸福感，其中10为最幸福。”
### 2.  经济（人均GDP）：GDP在多大程度上有助于幸福分数的计算
---

# ※欲探究
### 1. 哪些国家或地区在整体幸福感方面排名较高/较低，而导致幸福感的四个因素中的每一个？试猜想有什么原因会导致这些国家的幸福指数排名较高/较低。
### 2. 在2015年至2017年的报告之间，国家/地区的分数如何变化？主要分布在哪一带？
### 3. 有没有哪个国家的幸福感显着提高或降低？
### 4. 探究各国gdp与幸福感排名是否有关联

---

## ※探究一
### 导入世界幸福指数排名的数据

In [2]:
import pandas as pd
df3 = pd.read_csv("rank.csv", encoding='utf8')
df3

Unnamed: 0,country,rank_2015,rank_2016,rank_2017
0,Switzerland,1.0,2.0,4.0
1,Iceland,2.0,3.0,3.0
2,Denmark,3.0,1.0,2.0
3,Norway,4.0,4.0,1.0
4,Canada,5.0,6.0,7.0
5,Finland,6.0,5.0,5.0
6,Netherlands,7.0,7.0,6.0
7,Sweden,8.0,10.0,9.0
8,New Zealand,9.0,8.0,8.0
9,Australia,10.0,9.0,9.0


### 提取排名在前二十的国家数据

In [None]:
x1 = [x for x in df3.country.values[0:20]]
x1

['Switzerland',
 'Iceland',
 'Denmark',
 'Norway',
 'Canada',
 'Finland',
 'Netherlands',
 'Sweden',
 'New Zealand',
 'Australia',
 'Israel',
 'Costa Rica',
 'Austria',
 'Mexico',
 'United States',
 'Brazil',
 'Luxembourg',
 'Ireland',
 'Belgium',
 'United Arab Emirates']

In [9]:
y_2015 = [x for x in df3.rank_2015.values[0:20]]
y_2015

[1.0,
 2.0,
 3.0,
 4.0,
 5.0,
 6.0,
 7.0,
 8.0,
 9.0,
 10.0,
 11.0,
 12.0,
 13.0,
 14.0,
 15.0,
 16.0,
 17.0,
 18.0,
 19.0,
 20.0]

In [12]:
y_2016 = [x for x in df3.rank_2016.values[0:20]]
y_2016

[2.0,
 3.0,
 1.0,
 4.0,
 6.0,
 5.0,
 7.0,
 10.0,
 8.0,
 9.0,
 11.0,
 14.0,
 12.0,
 21.0,
 13.0,
 17.0,
 20.0,
 19.0,
 18.0,
 28.0]

In [13]:
y_2017 = [x for x in df3.rank_2017.values[0:20]]
y_2017

[4.0,
 3.0,
 2.0,
 1.0,
 7.0,
 5.0,
 6.0,
 9.0,
 8.0,
 9.0,
 11.0,
 12.0,
 13.0,
 25.0,
 14.0,
 22.0,
 18.0,
 15.0,
 17.0,
 21.0]

### 制作带tab栏的柱形图(前二十名)

In [None]:
from pyecharts import options as opts
from pyecharts.charts import Bar, Tab
from pyecharts.globals import ThemeType

def bar_base2015() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x1)
        .add_yaxis("2015年排名", y_2015)
        .set_global_opts(title_opts=opts.TitleOpts(title="2015年世界幸福指数在前二十的国家", subtitle=""))
    )
    return c
bar_base2015().render_notebook()

def bar_base2016() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x1)
        .add_yaxis("2016年排名", y_2016)
        .set_global_opts(title_opts=opts.TitleOpts(title="2016年世界幸福指数在前二十的国家", subtitle=""))
    )
    return c
bar_base2016().render_notebook()

def bar_base2017() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x1)
        .add_yaxis("2017年排名", y_2017)
        .set_global_opts(title_opts=opts.TitleOpts(title="2017年世界幸福指数在前二十的国家", subtitle=""))
    )
    return c
bar_base2017().render_notebook()

tab = Tab()
tab.add(bar_base2015(),"2015年前二十排名")
tab.add(bar_base2016(),"2016年前二十排名")
tab.add(bar_base2017(),"2017年前二十排名")
tab.render_notebook()

### 提取排名在后二十的国家数据

In [21]:
x2 = [x for x in df3.country.values[-20:]]
x2

['Niger',
 'Cambodia',
 'Tanzania',
 'Madagascar',
 'Central African Republic',
 'Chad',
 'Guinea',
 'Ivory Coast',
 'Burkina Faso',
 'Afghanistan',
 'Rwanda',
 'Benin',
 'Syria',
 'Burundi',
 'Togo',
 'Belize',
 'Namibia',
 'Puerto Rico',
 'Somalia',
 'South Sudan']

In [24]:
y_15 = [x for x in df3.rank_2015.values[-20:]]
y_15

[144.0,
 145.0,
 146.0,
 147.0,
 148.0,
 149.0,
 150.0,
 151.0,
 152.0,
 153.0,
 154.0,
 155.0,
 156.0,
 157.0,
 158.0,
 nan,
 nan,
 nan,
 nan,
 nan]

In [25]:
y_16 = [x for x in df3.rank_2016.values[-20:]]
y_16

[142.0,
 140.0,
 149.0,
 148.0,
 nan,
 144.0,
 151.0,
 139.0,
 145.0,
 154.0,
 152.0,
 153.0,
 156.0,
 157.0,
 155.0,
 52.0,
 113.0,
 15.0,
 76.0,
 143.0]

In [26]:
y_17 = [x for x in df3.rank_2017.values[-20:]]
y_17

[135.0,
 129.0,
 153.0,
 144.0,
 155.0,
 137.0,
 149.0,
 128.0,
 134.0,
 141.0,
 151.0,
 143.0,
 152.0,
 154.0,
 150.0,
 50.0,
 111.0,
 nan,
 93.0,
 147.0]

### 制作带tab栏的柱形图（后二十名）

In [37]:
from pyecharts import options as opts
from pyecharts.charts import Bar, Tab

def bar_base15() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x2)
        .add_yaxis("2015年排名", y_15)
        .set_global_opts(title_opts=opts.TitleOpts(title="2015年世界幸福指数在后二十的国家", subtitle=""))
    )
    return c
bar_base15().render_notebook()

def bar_base16() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x2)
        .add_yaxis("2016年排名", y_16)
        .set_global_opts(title_opts=opts.TitleOpts(title="2016年世界幸福指数在后二十的国家", subtitle=""))
    )
    return c
bar_base16().render_notebook()

def bar_base17() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add_xaxis(x2)
        .add_yaxis("2017年排名", y_17)
        .set_global_opts(title_opts=opts.TitleOpts(title="2017年世界幸福指数在后二十的国家", subtitle=""))
    )
    return c
bar_base17().render_notebook()

tab = Tab()
tab.add(bar_base15(),"2015年后二十排名")
tab.add(bar_base16(),"2016年后二十排名")
tab.add(bar_base17(),"2017年后二十排名")
tab.render_notebook()

## ※※ 故事一：
### 1. 瑞士、冰岛、丹麦、挪威、加拿大、荷兰、瑞典、新西兰、澳大利亚这些国家的幸福指数排名，在2015年至2017年间均在前十名间徘徊，未掉出过前十。
### 2.多哥、布隆迪共和国、叙利亚、贝宁共和国、卢旺达、阿富汗、布基纳法索等国家的幸福指数排名较低。
### 3.猜想：世界幸福指数的排名与国家的稳定程度有关，从上可以看出幸福指数较前的国家国局均处于安定的状态，而排名低下的国家国局大多不稳定并且有的还处于战乱之中。

In [1]:
---

SyntaxError: invalid syntax (<ipython-input-1-29e0c3615294>, line 1)

## ※探究二  
### 导入世界幸福分数的数据

In [81]:
import pandas as pd
df1 = pd.read_csv("scroe.csv", encoding='utf8')
df1

Unnamed: 0,country,2015,2016,2017
0,Switzerland,7.587,7.509,7.494
1,Iceland,7.561,7.501,7.504
2,Denmark,7.527,7.526,7.522
3,Norway,7.522,7.498,7.537
4,Canada,7.427,7.404,7.316
5,Finland,7.406,7.413,7.469
6,Netherlands,7.378,7.339,7.377
7,Sweden,7.364,7.291,7.284
8,New Zealand,7.286,7.334,7.314
9,Australia,7.284,7.313,7.284


### 制作带时间轴的世界幸福分数地图

In [82]:
from pyecharts import options as opts
from pyecharts.charts import Map,Timeline
from pyecharts.globals import ChartType, SymbolType

def timeline_map() -> Timeline:
    tl = Timeline()
    for i in range(2015, 2018):
        map0 = (
            Map()
            .add(
                "世界幸福分数", list(zip(list(df1.country),list(df1["{}".format(i)]))), "world",is_map_symbol_show = False
            )
            .set_global_opts(
                title_opts=opts.TitleOpts(title="{}年世界幸福分数".format(i),subtitle="",
                                         subtitle_textstyle_opts=opts.TextStyleOpts(color="red",font_size=18,font_style="italic")),#设置副标题样式，进行图例说明
                visualmap_opts=opts.VisualMapOpts(min_= df1['2016'].min(), max_=df1['2016'].max(),series_index=0),
            
            )
        )
        tl.add(map0, "{}".format(i))
    return tl
timeline_map().render_notebook()

## ※※ 故事二：
### 1. 世界幸福指数较高的国家基本都分布在北欧、北美洲、澳大利亚一带。
### 2. 世界幸福指数较低的国家则主要分布在非洲地区、西亚、欧洲东南部一带。
### 3. 较高的原因猜想：
### - 在商业与经济中处于富裕地位，比如瑞典、芬兰、丹麦都是工业制成品出口为导向的经济体，产品附加值极高，因此完全可以负担小国寡民情况下的高额福利。
### - 公民参与度高。据相关资料显示，北欧是全球廉洁程度最高的地区。据"透明国际"发布的"2014年全球清廉指数报告",北欧国家廉洁程度均名列前茅。其中,丹麦以92分居清廉指数世界第一,瑞典以87分排名第四。
### 4. 较低的原因猜想：
### - 与宗教问题有一定的相关性，东欧的位置正好是西方基督教和东方中亚，中东伊斯兰教的交汇处，尤其是奥斯曼不断推广伊斯兰教，基督教和伊斯兰教在此发生激烈的冲突和战争，使得在宗教影响下逐步改变了民族结构和宗教成分。同样的，非洲的宗教也有一些问题，据资料显示其宗教混乱繁多。
### - 与经济问题也有一定地相关性，在二战中，东欧基本都成了废墟，被打成了碎片。东欧被苏联掌控，都实行苏联的经济体制，使得前期还能运转正常的经济，到后来举步维艰。最后苏联解体，苏东剧变，很多国家经济几乎是推倒重来，比西欧整整又落后了半个世纪，导致了现在的巨大差异。

In [1]:
---

SyntaxError: invalid syntax (<ipython-input-1-29e0c3615294>, line 1)

##  ※探究三
### 导入世界幸福分数差值的数据
### （为了反映幸福感的增加或减少，故用2017年的幸福分数减去2015年的幸福分数的数据来进行可视化）

In [1]:
import pandas as pd
df2 = pd.read_csv("difference.csv", encoding='utf8')
df2

FileNotFoundError: [Errno 2] File b'difference.csv' does not exist: b'difference.csv'

In [1]:
# 提取前二十的国家作为x轴值

x = [x for x in df2.country.values[0:20]]
x

NameError: name 'df2' is not defined

In [151]:
# 提取前二十的差值作为y轴值

y = [x for x in df2.difference.values[0:20]]
y

[0.752,
 0.701,
 0.6559999999999999,
 0.631,
 0.569,
 0.541,
 0.525,
 0.524,
 0.496,
 0.456,
 0.44799999999999995,
 0.445,
 0.44299999999999995,
 0.39299999999999996,
 0.386,
 0.37,
 0.35700000000000004,
 0.349,
 0.345,
 0.331]

### 制作2015年-2017年世界幸福分数差值地柱形图

In [152]:
from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.globals import ThemeType

def bar_base() -> Bar:
    c = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.ESSOS))
        .add_xaxis(x)
        .add_yaxis("差值", y)
        .set_global_opts(title_opts=opts.TitleOpts(title="2015-2017年世界幸福分数的差值", subtitle="幸福感显著提高的前二十个国家"))
    )
    return c
bar_base().render_notebook()

## ※※ 故事三：
### 1. 幸福感显著提高的国家（前二十）有：拉脱维亚共和国、罗马尼亚、多哥共和国、塞内加尔共和国、加蓬共和国、阿拉伯埃及共和国、科特迪瓦、匈牙利、保加利亚、叙利亚、尼泊尔、布基纳法索、喀麦隆共和国、洪都拉斯共和国、黎巴嫩、希腊、菲律宾、柬埔寨、多米尼加共和国、危地马拉。综上，较多出现的地区有东欧、西非、西亚。
### 2. 东欧地区经济多为发达，商业条件好，且最近有实施经济自由化政策。西非正在增强政策的合力，例如推行单一货币ECO等动作，以及维持关键利率不变这一操作，有适当的减缓大众的通货膨胀压力。西亚在15年间，处于剧烈动荡的高危险局面，后来中国对西亚的外交政策作出了一系列新调整，介入地区的热点问题解决，合力打击国际恐怖主义并加快一带一路的建设，在一定程度上促成了西亚在之后两年的局势稳定，从而提升其国家人民的幸福分数。

--- 

## ※探究四（以下数据GDP的意思:GDP在多大程度上有助于幸福分数的计算）
### 导入世界gdp的数据

In [232]:
import pandas as pd
df4 = pd.read_csv("GDP.csv", encoding='utf8')
df4

Unnamed: 0,country,GDP_2015,GDP_2016,GDP_2017,rank_difference
0,Switzerland,1.40,1.53,1.56,3.0
1,Iceland,1.30,1.43,1.48,1.0
2,Denmark,1.33,1.44,1.48,-1.0
3,Norway,1.46,1.58,1.62,-3.0
4,Canada,1.33,1.44,1.48,2.0
5,Finland,1.29,1.41,1.44,-1.0
6,Netherlands,1.33,1.46,1.50,-1.0
7,Sweden,1.33,1.45,1.49,1.0
8,New Zealand,1.25,1.36,1.41,-1.0
9,Australia,1.33,1.44,1.48,-1.0


### 仅探究排名前十的国家的关系，所以先提取出前十的gdp数据

In [233]:
x4 = [x for x in df4.country.values[0:11]]
x4

['Switzerland',
 'Iceland',
 'Denmark',
 'Norway',
 'Canada',
 'Finland',
 'Netherlands',
 'Sweden',
 'New Zealand',
 'Australia',
 'Israel']

In [234]:
# 提取2015年前十gdp数据
y1 = [x for x in df4.GDP_2015.values[0:10]]
y1

[1.4, 1.3, 1.33, 1.46, 1.33, 1.29, 1.33, 1.33, 1.25, 1.33]

In [235]:
# 提取2016年前十gdp数据
y2 = [x for x in df4.GDP_2016.values[0:10]]
y2

[1.53, 1.43, 1.44, 1.58, 1.44, 1.41, 1.46, 1.45, 1.36, 1.44]

In [236]:
# 提取2017年前十gdp数据
y3 = [x for x in df4.GDP_2017.values[0:10]]
y3

[1.56, 1.48, 1.48, 1.62, 1.48, 1.44, 1.5, 1.49, 1.41, 1.48]

### 再提取出前十的排名差值

In [237]:
# 提取前十排名差值数据
y4 = [x for x in df4.rank_difference.values[0:10]]
y4

[3.0, 1.0, -1.0, -3.0, 2.0, -1.0, -1.0, 1.0, -1.0, -1.0]

### 制作2015年-2017年世界GDP与前十的幸福排名之间的关系的重叠线+散点图

In [239]:
from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.charts import Line

def overlap_line_scatter() -> Bar:
    x = x4
    bar = (
        Bar()
        .add_xaxis(x)
        .add_yaxis("排名差值", y4)
        .set_global_opts(title_opts=opts.TitleOpts(title="15-17年世界GDP与前十的幸福排名关系"))
    )
    line = (
        Line()
        .add_xaxis(x)
        .add_yaxis("2015年",y1)
        .add_yaxis("2016年",y2)
        .add_yaxis("2017年",y3)
    )
    bar.overlap(line)
    return bar

overlap_line_scatter().render()
overlap_line_scatter().render_notebook()

## ※※ 故事四：
### 1. 由图可看出，若GDP与幸福分数关联度越高，其幸福分数排名也会有较大可能的概率会上升，但不是绝对的。
### 2. 原因分析：
### - 前十基本都在北欧一带，而由此图可以推测，北欧一带的幸福指数高，与gdp的关系脱不了干系。北欧的得天优厚的自然资源，它不仅有渔业，还有石油、天然气等珍贵资源，挪威也因为此地的资源被称为石油大国。当然还有丰富的煤矿、铁矿等资源，而且这里的人口稀少，人均gdp也会相对的上升较多。
### - 北欧会通过税收进行财富再分配，通过公平提供教育资源让穷人的孩子不被忽视，这样尽量做到公平平等。
### - 北欧国家十分重视教育，那里的孩子从小学到大学都是免费的。如果想要出国留学，也可以申请，表现不错的也都免费。发展的根本就是把教育抓上去，科技搞上去，而上述这些都做到了，自然而然生活在这里的人们幸福度就会高了。

---