## 特斯拉股票趋势分析
特斯拉（Tesla）是一家美国的电动车及能源公司，产销电动车、太阳能板、及储能设备，美股代码TSLA。总部位于美国加利福尼亚州硅谷的帕罗奥多（Palo Alto），2003年最早由马丁·艾伯哈德（Martin Eberhard）和马克·塔彭宁（Marc Tarpenning）共同创立，2004年埃隆·马斯克（Elon Musk）进入公司并领导了A轮融资。创始人将公司命名为“特斯拉汽车（Tesla Motors）”，以纪念物理学家尼古拉·特斯拉（Nikola Tesla）。4月21日，摩根大通最新研究报告称，由于来自宝马和奥迪等德国汽车制造商的竞争加剧，特斯拉电动汽车的销量将受严重影响。摩根大通重申其对特斯拉股票的“减持”评级，原因是梅赛德斯奔驰、宝马和奥迪将推出一大批电动汽车。“我很难过地告诉大家，特斯拉已经彻底破产了。”4月1日特斯拉CEO马斯克发布了上述推特，还附上了一张伤心状照片。然而更令人伤心的是，上述愚人节的玩笑或一语成谶。与此同时，特斯拉官方再次宣布将暂停加州佛利蒙的Mode 3组装线4至5天，以提升自动化以此解决导致其多次推迟产量目标的生产瓶颈。事实上，今年2月份，特斯拉Model 3曾于20日至24日期间停产。由于彼时宣称的停产整修后产能翻倍未能实现，所以此次再度宣布停产后，尽管特斯拉CEO马斯克作出了整修后每月产能6000辆的承诺，仍没能阻止公司股票的应声下跌。面对众说纷纭的措辞和潜在的各路竞争对手，TSLA的未来崎岖起伏，那么有可能预测TSLA股票的走势吗？

雅虎财经提供了大量的股价数据，可以使用此数据进行分析，Python中的pandas-datareader包提供了一些列的api可以动态的获取数据。因此，可以使用该包来获取特斯拉的股票数据。在使用之前，首先需要按照pandas-datareader包。在这里使用pip进行安装，命令如下：

<code>pip install pandas-datareader</code>

安装完成后，首先导入需要的类库，并获取数据。

In [88]:
import pandas as pd
import datetime
import pandas_datareader.data as web
import os

# 设定开始，结束日期
start = datetime.datetime(2016, 1, 1)
end = datetime.date.today()

# 获取特斯拉的股票价格数据
filename = 'data/tasl/tasl.csv'
tsla_prices = web.get_data_yahoo('TSLA', start, end)
tsla_prices.to_csv(filename)
    
tsla_prices.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-12-31,243.449997,238.369995,238.509995,240.009995,2715000,240.009995
2016-01-04,231.380005,219.0,230.720001,223.410004,6827100,223.410004
2016-01-05,226.889999,220.0,226.360001,223.429993,3186800,223.429993
2016-01-06,220.050003,215.979996,220.0,219.039993,3779100,219.039993
2016-01-07,218.440002,213.669998,214.190002,215.649994,3554300,215.649994


然后，获取股利收入信息，得到也是一个DataFrame，包含action和value两个字断，action表示证券所进行的操作，如派发股利，或股票分割等等，而value则表示操作值。如果，没有数据会返回一个空的DataFrame。

In [89]:
filename = 'data/tasl/tasl_actions.csv'
tsla_actions = web.get_data_yahoo_actions('TSLA', start, end)
tsla_actions.to_csv(filename)
    
tsla_actions.head()

Unnamed: 0,action,value


可以看到，特斯拉在这个时间段没有任何分红或者拆分信息。因为，这里没有action数据，因此不需要对这两个DataFrame进行合并。如果，需要何必可以使用DataFrame的merge函数，它可以根据一定规则将两个DataFrame变量合并。

<code>prices = pd.merge(tsla_prices, tsla_actions, how='outer', left_index=True, right_index=True)</code>

为了处理的统一，在这里既是没有数据，也将这两个数据集进行合并。

In [90]:
prices = pd.merge(tsla_prices, tsla_actions, how='outer', left_index=True, right_index=True)
prices.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close,action,value
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2015-12-31,243.449997,238.369995,238.509995,240.009995,2715000,240.009995,,
2016-01-04,231.380005,219.0,230.720001,223.410004,6827100,223.410004,,
2016-01-05,226.889999,220.0,226.360001,223.429993,3186800,223.429993,,
2016-01-06,220.050003,215.979996,220.0,219.039993,3779100,219.039993,,
2016-01-07,218.440002,213.669998,214.190002,215.649994,3554300,215.649994,,


接下来通过K线图来看一下特斯拉的股票的走势情况，在K线图中只需要开盘价，收盘价，最高价和最低价这四个数据

In [91]:
data = prices[['Open', 'Close', 'Low', 'High']]
x_axis = data.index.tolist()
y_axis = []
for index in x_axis:
    values = [value for value in data.loc[index]]
    y_axis.append(values)

x_axis = [value.strftime('%Y-%m-%d') for value in x_axis]

In [92]:
from pyecharts import Kline
kline = Kline("TSLA K线")
kline.add("日K", x_axis, y_axis, is_datazoom_show=True)
kline

对于股票数据来说，还有很重要的一点，每天的成交量也会对分析造成影响。在这里通过柱状图来看一下成交量的状况。

In [93]:
data = prices['Volume']
x_axis = data.index.tolist()
y_axis = [data[index] for index in x_axis]
x_axis = [value.strftime('%Y-%m-%d') for value in x_axis]

In [94]:
from pyecharts import Bar
bar = Bar('交易量')
bar.add('日交易量', x_axis, y_axis, is_datazoom_show=True)
bar

K线图可以很好的看出股票价格走势，柱状图可以看出成交量的变化。那么相对前一天，股票价格是增长还是下跌呢？

In [95]:
data = prices[['Open', 'Close', 'Volume']]
# axis : {0 or ‘index’, 1 or ‘columns’}
newdata = data.diff(periods=1, axis=0)
newdata.dropna(inplace=True)
x_axis = newdata.index.tolist()
columuns = data.columns.tolist()
show_datas = []
for columun in columuns:
    data = newdata[columun]
    if columun == 'Volume':
        # 转换Volume到百万级，目的是让数据的现实尺度大概一致
        y_axis = [data[index] / 1000000 for index in x_axis]
    else:
        y_axis = [data[index] for index in x_axis]
    show_datas.append((columun, y_axis))
# print(show_datas)

x_axis = [value.strftime('%Y-%m-%d') for value in x_axis]

In [96]:
from pyecharts import Overlap
bar = Bar('前日差额')
for title, y_axis in show_datas:
    bar.add(title, x_axis, y_axis, is_datazoom_show=True)
bar

通过柱状图没有看到明显的变化规律，改成折线图重新观察一下。

In [97]:
from pyecharts import Line
line = Line('前日差额')
for title, y_axis in show_datas:
    line.add(title, x_axis, y_axis, is_datazoom_show=True)
line

图表给出的规律还不是很明显。需要更近一步的分析。接下来看一下当日开盘是高开还是低开，并比较该值与前日成交量的关系。

In [124]:
op = prices[['Open']]
cl = prices[['Close']]
# 获取前日收盘价
cl = cl.shift(1)
data = pd.concat([cl, op], axis=1)
data['Diff'] = data['Open'] - data['Close']
# 获取前日交易量，百万级
data['Volume'] = prices['Volume'].shift(1) / 1000000
data.dropna(inplace=True)
data.drop(['Close', 'Open'], axis=1, inplace=True)
data.head()

Unnamed: 0_level_0,Diff,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2016-01-04,-9.289993,2.715
2016-01-05,2.949997,6.8271
2016-01-06,-3.429993,3.1868
2016-01-07,-4.849991,3.7791
2016-01-08,2.210007,3.5543


In [130]:
show_datas = []
x_axis = data.index.tolist()
show_datas = []
for columun in data.columns.tolist():
    tmp = data[columun]
    y_axis = [tmp[index] for index in x_axis]
    show_datas.append((columun, y_axis))
x_axis = [value.strftime('%Y-%m-%d') for value in x_axis]

In [131]:
line = Line('前日成交量与开盘涨跌')
for title, y_axis in show_datas:
    line.add(title, x_axis, y_axis, is_datazoom_show=True)
line

从图上看一看到，变化的规律基本一致，当然，这里边也有完全不一致的值，这些特殊值需要更近一步的分析，时候有特殊的事件发生。这也许对我们股票的买卖有一定的指导作用。