### 概览
在这个项目中，我们将分析本地和全球的气温数据，并比较你居住地的气温走向与全球气温走向。

### 说明
你的任务是让数据可视化，描述全球气温走向和最接近你居住地的大城市气温走向之间的相似性与差异。所以需要按照以下步骤操作：

 - 从数据库中 **提取数据**。我们将在下一节介绍一个工作区，这个工作区与数据库连接。你需要导出世界气温数据以及最接近你居住地的大城市气温数据。city_list 表是城市和国家列表。想要与数据库交互，就需要编写一个 SQL 查询。
 编写 SQL 查询，提取城市数据，导出到 CSV 文件。
 编写一个 SQL 查询来提取全球数据，并导出到 CSV 文件。
- **用任何你喜欢使用的工具打开 CSV**，建议使用 Excel 或 Google 表格，但也欢迎使用其他工具，如 Python 或 R。
- **创建一个线条图**，将你所在城市的气温与全球气温比较。确保绘制 移动平均值 而不是年平均值，使线条平滑，使气温走向便于   观察（上一课的最后一个页面介绍了如何在电子表格中进行这类操作）。
- **观察** 世界平均气温与你所在城市平均气温之间的相似性和差异，以及整体趋势。可以通过这些问题开始。
 - 与全球平均气温相比，你所在城市平均气温是比较热还是比较冷？长期气温差异是否一致？
 - “长期以来，你所在城市气温变化与全球平均气温变化相比如何？”
 - 整体趋势如何？世界越来越热还是越来越冷了？气温走向与过去几百年的走向是否一致？

### 提交项目
应提交 PDF 格式的文件，其中包括：

 - 准备在图表中可视化数据而采取的大致步骤，例如：
   - 在每个步骤中，你都使用了哪些工具？（Python、SQL、Excel 等）
   - 请在报告中附上你所有用到的SQL语句或Python代码。
   - 你是如何计算移动平均数的？
   - 在决定如何可视化气温走向时，你的主要考虑因素是什么？
 - 表示本地和全球气温走向的折线图
 - 关于气温走向的相似性和/或差异方面，至少需要提供 四个问题和观察结论

### 在下面编写一个 SQL 查询
使用下面的 SQL Workspace 从气温数据库中提取数据，然后将结果下载为 CSV 文件。在电子表格程序中打开，对其进行分析。

### 数据库模式
数据库中有三个表：

- city_list - 这个表包含数据库中的城市和国家列表。看看这个列表，找到离你所在城市最近的城市。
- city_data - 这个表包含每个城市每年的平均气温 (ºC)。
- global_data - 这个表包含每年的全球平均气温 (ºC)。

导出最接近你居住地的大城市气温数据的SQL语句，保存为guangzhou.csv
>SELECT *  
>FROM city_data  
>WHERE city = 'Guangzhou'  

导出世界1840年到2013年气温数据的SQL语句，保存为global1840_2013.csv

>SELECT *  
>FROM global_data  
>WHERE year >= 1840 and year <= 2013  

In [32]:
import pandas as pd
import numpy as np 

In [34]:
city_df = pd.read_csv('G:\\UdacityClass\\DA-payed\\project1\\guangzhou.csv') 
global_df = pd.read_csv('G:\\UdacityClass\\DA-payed\\project1\\global1840_2013.csv') 

print(city_df.describe())
print(global_df.describe())

              year    avg_temp  7years average
count   174.000000  174.000000      168.000000
mean   1926.500000   21.611207       21.610417
std      50.373604    0.485201        0.376576
min    1840.000000   20.400000       20.827143
25%    1883.250000   21.272500       21.317857
50%    1926.500000   21.590000       21.601429
75%    1969.750000   21.980000       21.922143
max    2013.000000   22.930000       22.322857
              year    avg_temp  7years average
count   174.000000  174.000000      168.000000
mean   1926.500000    8.524713        8.518087
std      50.373604    0.469801        0.415108
min    1840.000000    7.560000        7.925714
25%    1883.250000    8.172500        8.181429
50%    1926.500000    8.520000        8.538571
75%    1969.750000    8.760000        8.706071
max    2013.000000    9.730000        9.588571


**问：** 你是如何计算移动平均数的？  
**答：** 开始时，创建一个名为 7years average 的列，这是存储移动平均值字段的地方。然后再到第七年 (1846)，使用 AVERAGE() 函数来计算前七年的平均气温。最后将公式一直拖动到最后一行，完成移动平均数的计算。

### 全球气温
![](https://raw.githubusercontent.com/FFFFFhb/DataAnalysis/master/global.png)

### 广州市气温
![](https://raw.githubusercontent.com/FFFFFhb/DataAnalysis/master/guangzhou.png)

### 全球气温与广州气温（移动平均值）
![](https://raw.githubusercontent.com/FFFFFhb/DataAnalysis/master/GlobalvsGuangzhou.png)

**问1:** 与全球平均气温相比，你所在城市平均气温是比较热还是比较冷？长期气温差异是否一致？  
**答：**我所在的城市平均气温比全球平均气温高，因为广州地处赤道附近，受太阳直射时间长，气温较全球平均气温高。长期气温差异一致。

**问2：** 长期以来，你所在城市气温变化与全球平均气温变化相比如何？  
**答：**长期以来，广州气温变化与全球平均气温变化趋势大致相同，但广州气温波动较大，两年平均气温差距最高超过1度。 

**问3：**整体趋势如何？世界越来越热还是越来越冷了？气温走向与过去几百年的走向是否一致？  
**答：**气温整体呈上升趋势，世界越来越热。近一百年气温上升趋势比过去一百年明显。

**问4：**气温变化的趋势说明了什么问题？  
**答：**全球平均气温整体呈上升趋势，2013年全球平均气温9.61℃，较1840年全球平均气温7.8℃升高了1.81℃，说明全球气候变暖情况严重。
>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;全球气候变暖是一种和自然有关的现象，是由于温室效应不断积累，导致地气系统吸收与发射的能量不平衡，能量不断在地气系统累积，从而导致温度上升，造成全球气候变暖。  
  
>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;由于人们焚烧化石燃料，如石油，煤炭等，或砍伐森林并将其焚烧时会产生大量的二氧化碳，即温室气体，这些温室气体对来自太阳辐射的可见光具有高度透过性，而对地球发射出来的长波辐射具有高度吸收性，能强烈吸收地面辐射中的红外线，导致地球温度上升，即温室效应。全球变暖会使全球降水量重新分配、冰川和冻土消融、海平面上升等，不仅危害自然生态系统的平衡，还威胁人类的生存。  
  
>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;另一方面，由于陆地温室气体排放造成大陆气温升高，与海洋温差变小，近而造成了空气流动减慢，雾霾无法短时间被吹散，造成很多城市雾霾天气增多，影响人类健康。汽车限行，暂停生产等措施只有短期和局部效果，并不能从根本上改变气候变暖和雾霾污染。