# 影响人口自然增长率的因素分析

### 数据来源：
 国家数据网
### 数据处理与分析：
 余杭宏
### 简介：
 人口自然增长率简称“自然增长率”。一定时期内 (通常为一年) 人口自然增加数 (出生人数减去死亡人数) 与同期平均总人口数之比，人口自然增长率是反映人口发展速度和制定人口计划的重要指标，也是计划生育统计中的一个重要指标，它表明人口自然增长的程度和趋势。
### 背景：
 随着时代的发展，世界人口急剧提升且不稳定，同时人口的增长和增长速率也为世界带来了许多难题。为了更好的控制人口增长与减少，我们着手探讨影响人口自然增长率的主要因素。


In [56]:
import pandas as pd
import numpy as np
from pyecharts.charts import Geo
from pyecharts import options as opts
from pyecharts.globals import ChartType, SymbolType,ThemeType
from pyecharts.charts import Bar,Tab,Line,Map,Timeline

In [57]:
df = pd.read_csv('人均消费.csv',encoding='utf8',index_col=0)
df1 = pd.read_csv('growth.csv',encoding='utf8',index_col=0)
df2 = pd.read_csv('fuyang.csv',encoding='utf8',index_col=0)



## 一、人均消费

In [58]:
df

Unnamed: 0_level_0,2018年,2017年,2016年,2015年,2014年,2013年,2012年,2011年
地区,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
北京,30319.98,28014.94,25669.13,23014.59,21330.83,19800.81,17879.4,16251.93
天津,18809.64,18549.19,17885.39,16538.19,15726.93,14442.01,12893.88,11307.28
河北,36010.27,34016.32,32070.45,29806.11,29421.15,28442.95,26575.01,24515.76
山西,16818.11,15528.42,13050.41,12766.49,12761.49,12665.25,12112.83,11237.55
内蒙古,17289.22,16096.21,18128.1,17831.51,17770.19,16916.5,15880.58,14359.88
辽宁,25315.35,23409.24,22246.9,28669.02,28626.58,27213.22,24846.43,22226.7
吉林,15074.62,14944.53,14776.8,14063.13,13803.14,13046.4,11939.24,10568.83
黑龙江,16361.62,15902.68,15386.09,15083.67,15039.38,14454.91,13691.58,12582.0
上海,32679.87,30632.99,28178.65,25123.45,23567.7,21818.15,20181.72,19195.69
江苏,92595.4,85869.76,77388.28,70116.38,65088.32,59753.37,54058.22,49110.27


In [59]:
list(df.index)

['北京',
 '天津',
 '河北',
 '山西',
 '内蒙古',
 '辽宁',
 '吉林',
 '黑龙江',
 '上海',
 '江苏',
 '浙江',
 '安徽',
 '福建',
 '江西',
 '山东',
 '河南',
 '湖北',
 '湖南',
 '广东',
 '广西',
 '海南',
 '重庆',
 '四川',
 '贵州',
 '云南',
 '西藏',
 '陕西',
 '甘肃',
 '青海',
 '宁夏',
 '新疆']

In [60]:
for i in range(2011, 2019):
    print(list(zip(list(df.index),list(df["{}年".format(i)]))))

[('北京', 16251.93), ('天津', 11307.28), ('河北', 24515.76), ('山西', 11237.55), ('内蒙古', 14359.88), ('辽宁', 22226.7), ('吉林', 10568.83), ('黑龙江', 12582.0), ('上海', 19195.69), ('江苏', 49110.27), ('浙江', 32318.85), ('安徽', 15300.65), ('福建', 17560.18), ('江西', 11702.82), ('山东', 45361.85), ('河南', 26931.03), ('湖北', 19632.26), ('湖南', 19669.56), ('广东', 53210.28), ('广西', 11720.87), ('海南', 2522.66), ('重庆', 10011.37), ('四川', 21026.68), ('贵州', 5701.84), ('云南', 8893.12), ('西藏', 605.83), ('陕西', 12512.3), ('甘肃', 5020.37), ('青海', 1670.44), ('宁夏', 2102.21), ('新疆', 6610.05)]
[('北京', 17879.4), ('天津', 12893.88), ('河北', 26575.01), ('山西', 12112.83), ('内蒙古', 15880.58), ('辽宁', 24846.43), ('吉林', 11939.24), ('黑龙江', 13691.58), ('上海', 20181.72), ('江苏', 54058.22), ('浙江', 34665.33), ('安徽', 17212.05), ('福建', 19701.78), ('江西', 12948.88), ('山东', 50013.24), ('河南', 29599.31), ('湖北', 22250.45), ('湖南', 22154.23), ('广东', 57067.92), ('广西', 13035.1), ('海南', 2855.54), ('重庆', 11409.6), ('四川', 23872.8), ('贵州', 6852.2), ('云南', 10309.47), ('西藏'

In [61]:
from pyecharts.faker import Faker
from pyecharts import options as opts
from pyecharts.charts import Bar, Page, Pie, Timeline


def timeline_pie() -> Timeline:
    attr = Faker.choose()
    tl = Timeline()
    for i in range(2011, 2019):
        pie = (
            Pie()
            .add(
                "数值",
                list(zip(list(df.index),list(df["{}年".format(i)]))),
                rosetype="radius",
                radius=["30%", "55%"],
            )
            .set_global_opts(title_opts=opts.TitleOpts("人均消费".format(i)))
        )
        tl.add(pie, "{}年".format(i))
    return tl


In [1]:
timeline_pie().render_notebook()

NameError: name 'timeline_pie' is not defined

### 现象
由图可直观的得出中国的江苏，山东和广东的人均消费水平十分高且突出，其他省份比较平均；而随着年份的增长，内蒙古，辽宁和黑龙江等地的人均消费会出现比较大幅度的下降，而广东等中东部地区普遍上升。

## 二、抚养比

In [2]:
df2

NameError: name 'df2' is not defined

In [3]:
for i in range(2011, 2019):
    print(list(zip(list(df2.index),list(df1["{}年".format(i)]))))

NameError: name 'df2' is not defined

In [4]:
def timeline_pie() -> Timeline:
    attr = Faker.choose()
    tl = Timeline()
    for i in range(2011, 2019):
        pie = (
            Pie()
            .add(
                "数值",
                list(zip(list(df2.index),list(df2["{}年".format(i)]))),
                rosetype="radius",
                radius=["30%", "55%"],
            )
            .set_global_opts(title_opts=opts.TitleOpts("抚养比".format(i)))
        )
        tl.add(pie, "{}年".format(i))
    return tl

NameError: name 'Timeline' is not defined

In [5]:
timeline_pie().render_notebook()

NameError: name 'timeline_pie' is not defined

## 三、人口自然增长率

In [6]:
df1

NameError: name 'df1' is not defined

In [7]:
for i in range(2011, 2019):
    print(list(zip(list(df.index),list(df["{}年".format(i)]))))

NameError: name 'df' is not defined

In [69]:
for i in range(2011, 2019):
    print(list(zip(list(df1.index),list(df1["{}年".format(i)]))))

[('北京', 4.02), ('天津', 2.5), ('河北', 6.5), ('山西', 4.86), ('内蒙古', 3.51), ('辽宁', -0.34), ('吉林', 1.02), ('黑龙江', 1.07), ('上海', 1.87), ('江苏', 2.61), ('浙江', 4.07), ('安徽', 6.32), ('福建', 6.21), ('江西', 7.5), ('山东', 5.1), ('河南', 4.94), ('湖北', 4.38), ('湖南', 6.55), ('广东', 6.1), ('广西', 7.67), ('海南', 8.97), ('重庆', 3.17), ('四川', 2.98), ('贵州', 6.38), ('云南', 6.35), ('西藏', 10.26), ('陕西', 3.69), ('甘肃', 6.05), ('青海', 8.31), ('宁夏', 8.97), ('新疆', 10.57)]
[('北京', 4.74), ('天津', 2.63), ('河北', 6.47), ('山西', 4.87), ('内蒙古', 3.65), ('辽宁', -0.39), ('吉林', 0.36), ('黑龙江', 1.27), ('上海', 4.2), ('江苏', 2.45), ('浙江', 4.6), ('安徽', 6.86), ('福建', 7.01), ('江西', 7.32), ('山东', 4.95), ('河南', 5.16), ('湖北', 4.88), ('湖南', 7.57), ('广东', 6.95), ('广西', 7.89), ('海南', 8.85), ('重庆', 4.0), ('四川', 2.97), ('贵州', 6.31), ('云南', 6.22), ('西藏', 10.27), ('陕西', 3.88), ('甘肃', 6.06), ('青海', 8.24), ('宁夏', 8.93), ('新疆', 10.84)]
[('北京', 4.41), ('天津', 2.28), ('河北', 6.17), ('山西', 5.24), ('内蒙古', 3.36), ('辽宁', -0.03), ('吉林', 0.32), ('黑龙江', 0.78), ('上海', 2.94)

In [70]:
from pyecharts.faker import Faker
from pyecharts import options as opts
from pyecharts.charts import Funnel, Page

In [71]:
def funnel_base() -> Funnel:
    tl = Timeline()
    for i in range(2011,2019):
        c = (
        Funnel()
        .add("人口自然增长率", list(zip(list(df1.index),list(df1["{}年".format(i)]))))
        .set_global_opts(
                title_opts=opts.TitleOpts(title="{}人口自然增长率".format(i),subtitle="",
                                          subtitle_textstyle_opts=opts.TextStyleOpts(color="red",font_size=18,font_style="italic")),
                visualmap_opts=opts.VisualMapOpts(min_= 1,max_=15)
            
            )
        )
        tl.add(c,"{}年".format(i))
    return tl

In [72]:
funnel_base().render_notebook()

### 现象
由图可看出，东部和北部的人口自然增长率特别低，而西部的人口自然增长率整体比较高，中部和东部的抚养比都比较均衡；随着年份的增大，中国整体人口自然增长率都随着上升。

## 四、人口自然增长率和人均消费、抚养比的对比分析图

### （1）人口自然增长率

In [73]:
def timeline_map() -> Timeline:
    tl = Timeline()
    for i in range(2011, 2019):
        map0 = (
            Map()
            .add(
                "人口自然增长率",list(zip(list(df1.index),list(df1["{}年".format(i)]))),"china",is_map_symbol_show = False
            )
            .set_global_opts(
                title_opts=opts.TitleOpts(title="{}人口自然增长率".format(i),subtitle="",
                                          subtitle_textstyle_opts=opts.TextStyleOpts(color="red",font_size=18,font_style="italic")),
                visualmap_opts=opts.VisualMapOpts(min_=-1,max_=11.5),
            
            )
        )
        tl.add(map0,"{}年".format(i))
    return tl
timeline_map().render_notebook()

### （2）人均消费

In [74]:
def timeline_map() -> Timeline:
    tl = Timeline()
    for i in range(2011, 2019):
        map0 = (
            Map()
            .add(
                "人均消费水平",list(zip(list(df.index),list(df["{}年".format(i)]))),"china",is_map_symbol_show = False
            )
            .set_global_opts(
                title_opts=opts.TitleOpts(title="{}人均消费".format(i),subtitle="",
                                          subtitle_textstyle_opts=opts.TextStyleOpts(color="red",font_size=18,font_style="italic")),
                visualmap_opts=opts.VisualMapOpts(min_=5000,max_=50000),
            
            )
        )
        tl.add(map0,"{}年".format(i))
    return tl
timeline_map().render_notebook()

### （3）抚养比

In [75]:
def timeline_map() -> Timeline:
    tl = Timeline()
    for i in range(2011, 2019):
        map0 = (
            Map()
            .add(
                "抚养比",list(zip(list(df2.index),list(df2["{}年".format(i)]))),"china",is_map_symbol_show = False
            )
            .set_global_opts(
                title_opts=opts.TitleOpts(title="{}抚养比".format(i),subtitle="",
                                          subtitle_textstyle_opts=opts.TextStyleOpts(color="red",font_size=18,font_style="italic")),
                visualmap_opts=opts.VisualMapOpts(min_=21,max_=50),
            
            )
        )
        tl.add(map0,"{}年".format(i))
    return tl
timeline_map().render_notebook()

## 总结论
- 通过人口自然增长率和人均消费两张地图对比可得，地图有两个类似点：

1.类似点1：两份数据图的西部和东北部随着年份的变化都不会变化太大。

2.类似点2：两份数据地图的中偏东地区原始数据都偏大，且随着年份的增加，中偏东地区的人口自然增长率和人均消费水平都随之大增大，且变化十分明显。

由两份单独的人口自然增长率和人均消费突结合地图分析，我们可推测出人口自然增长率和人均消费有一定的关系，且随着人均消费的提高，人口自然增长率也随之增大，而人均消费水平也代表着当地的经济发展水平：随着经济发展水平的提高，人口增长速度加快；因为经济发展水平提高，人们的各种生活条件得到改善，使人的寿命延长，死亡率下降，人口自然增长率也就提高了．所以要控制好人口的自然增长率，必须要先调控好当地的经济状况。

- 通过人口自然增长率和抚养比两张地图对比可得：

两图的颜色分布和变化趋势都大致相同，由此可推测抚养比与人口自然增长率呈正相关。我们猜测随着抚养比的升高，表明劳动力人均承担的抚养人数就越多，即意味着劳动力的抚养负担就越严重，特别是对老年人的抚养压力。所以人们会在自己能力范围内尽可能的生多几个孩子以减轻未来自己的经济负担和抚养压力，最后人口自然增长率也升高了。