## 描述统计学案例代码：股票数据分析

先使用conda安装：数据分析pandas包，和互联数据获取包pandas-datareader

In [2]:
#导入包
#数据分析包
import pandas as pd

'''
互联数据获取包
注意：这里的pandas_datareader中使用的是下划线'_'，
而非在pip安装时使用的连接符‘-’
'''
from pandas_datareader import data

ImportError: No module named pandas_datareader

In [None]:
# 存在的问题：由于是从国外获取股票数据，会由于网络不稳定，获取数据失败，多运行几次这个cell就好了
'''
获取国内股票数据的方式是：“股票代码”+“对应股市”（港股为.hk，A股为.ss）
例如腾讯是港股是：0700.hk
'''
#字典：6家公司的股票
gafataDict={'谷歌':'GOOG','亚马逊':'AMZN','Facebook':'FB',
            '苹果':'AAPL','阿里巴巴':'BABA','腾讯':'0700.hk'}

## 阿里巴巴

In [None]:
'''
get_data_yahoo表示从雅虎数据源获取股票数据
雅虎股票数据源文档：http://pandas-datareader.readthedocs.io/en/latest/remote_data.html#yahoo-finance
'''
# 获取哪段时间范围的股票数据
start_date = '2017-01-01'
end_date = '2018-01-01'
#获取阿里巴巴股票数据
babaDf=data.get_data_yahoo(gafataDict['阿里巴巴'],start_date, end_date)

In [None]:
'''
每日股票价位信息
Open:开盘价
High:最高加
Low：最低价
Close：收盘价
下面我们主要关注每日的收盘价
'''
#查看前5行数据
babaDf.head()

In [None]:
babaDf.dtypes

In [None]:
#查看数据集描述统计信息
babaDf.describe()

In [None]:
'''
定义函数
函数功能：计算股票涨跌幅=（现在股价-买入价格）/买入价格
输入参数：column是收盘价这一列的数据
返回数据：涨跌幅
'''
def change(column):
    #买入价格
    buyPrice=column[0]
    #现在股价
    #总共251条数据，序号是从0开始的，所以最后一条数据的序号是251-1
    curPrice=column[251-1]
    #累计涨跌幅
    priceChange=(curPrice-buyPrice)/buyPrice
    #判断股票是上涨，还是下跌
    if(priceChange>0):
        print('股票累计上涨=',priceChange)
    elif(priceChange<0):
        print('股票累计没有变化=',priceChange)
    else:
        print('股票累计下跌=',priceChange)
    
    #返回数据
    return priceChange

In [None]:
#获取收盘价Close这一列的数据
closeCol=babaDf['Close']
#调用函数，获取涨跌幅
babaChange=change(closeCol)

In [None]:
'''
可以在conda中使用命令安装可视化包matplotlib，命令如下：
conda install matplotlib
'''
#导入绘图包
import matplotlib.pyplot as plt

In [None]:
#使用收盘价Close这一列数据绘制
plt.plot(babaDf['Close'])
#图片标题
plt.title('BABA')
#显示网格
plt.grid(True)
#显示图片
plt.show()

In [None]:
'''
这快代码和课程中不一样，因为有的朋友反映绘制出的横轴时间是数值，所以用下面最新的代码代替。
绘制股票走势
横轴x是股票时间
（babaDf.index是Pandas二维数据Dataframe的行索引，会在下次节课中详细讲，这里大概了解即可）
纵轴y是收盘价Close这一列数据
TODO 图片美化先不用管，我们在课程《数据分析可视化》课程中详细学习
'''
babaDf.plot(x=babaDf.index,y='Close')
#图片标题
plt.title('BABA')
#显示网格
plt.grid(True)
plt.show()

## 亚马逊

In [None]:
amazDf=data.get_data_yahoo(gafataDict['亚马逊'],start_date, end_date)

In [None]:
amazDf.describe()

##  Facebook

In [None]:
facebookDf=data.get_data_yahoo(gafataDict['Facebook'],start_date, end_date)
facebookDf.describe()

## 苹果

In [None]:
#获取苹果股票数据
appleDf=data.get_data_yahoo(gafataDict['苹果'],start_date, end_date)
appleDf.describe()

## 谷歌

In [None]:
googDf=data.get_data_yahoo(gafataDict['谷歌'],start_date, end_date)
googDf.describe()

## 腾讯

In [None]:
hkDf=data.get_data_yahoo(gafataDict['腾讯'],start_date, end_date)
hkDf.describe()