In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
import numpy as np

In [None]:
# Excel ファイルの読み込み
df = pd.read_excel('./analyze.xlsx', index_col=0) 
df.head()

日本の経済成長(仮)とは平成11年を100として前年比を表す経済成長率から導出した値である。  
また、グラフ描画等の関係上平成11年のデータは欠損させている。

In [None]:
# 基本統計量の算出
df.describe()

* count : データ数
* mean : 平均値
* std : 標準偏差
* min : 最小値
* 25% : 第１四分位数(下から２５%に位置する値)
* 50% : 中央値
* 75% : 第３四分位数(下から７５%に位置する値)
* max : 最大値

### データのスライス（分割）

In [None]:
# 平均収入
annual_income = df.iloc[:, 0]
# 訪日外国人数
foreign_visiter = df.iloc[:, 1]
# 日本の経済成長(仮)
GDP = df.iloc[:, 3] 

In [None]:
fp = FontProperties(fname=r'C:/WINDOWS/Fonts/msgothic.ttc')
# 横軸：平均年収、縦軸：訪日外国人数の散布図
fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.scatter(annual_income, foreign_visiter, color="red")
ax1.set_xlabel("平均年収", fontproperties=fp)
ax1.set_ylabel("訪日外国人数", fontproperties=fp)

In [None]:
# 横軸：経済成長(仮)、縦軸：訪日外国人数の散布図
fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.scatter(GDP, foreign_visiter, color="red")
ax1.set_xlabel(u"経済成長(仮)", fontproperties=fp)
ax1.set_ylabel(u"訪日外国人数", fontproperties=fp)

In [None]:
# 横軸：平均年収、縦軸：経済成長(仮)の散布図
fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.scatter(annual_income, GDP, color="red")
ax1.set_xlabel(u"平均年収", fontproperties=fp)
ax1.set_ylabel(u"経済成長(仮)", fontproperties=fp)

In [None]:
# 平成11年度のデータを削除
GDP = GDP.drop(11)
foreign_visiter = foreign_visiter.drop(11)
annual_income = annual_income.drop(11)

In [None]:
# 3つのデータのリストを連結
x = np.vstack([GDP, foreign_visiter, annual_income])

In [None]:
# 経済成長(仮)・訪日外国人数・平均年収の相関行列
np.corrcoef(x)

In [None]:
# ２軸（縦軸：経済成長, 訪日外国人数   横軸：和暦）の線グラフ
fig = plt.figure()

ax1 = fig.add_subplot(111)
ax1.plot(df.index.drop(11), GDP, 'red', label='経済成長(仮)')
ax1.set_xticks(df.index.drop(11))
ax2 = ax1.twinx()
ax2.plot(df.index.drop(11), foreign_visiter, 'blue', label='訪日外国人数')

h1, l1 = ax1.get_legend_handles_labels()
h2, l2 = ax2.get_legend_handles_labels()
ax1.legend(h1+h2, l1+l2, prop=fp, loc='upper left')

ax1.set_xlabel('和暦', fontproperties=fp)
ax1.set_ylabel('経済成長(仮)', fontproperties=fp)
ax2.set_ylabel('訪日外国人数', fontproperties=fp)

In [None]:
# 平成19年度以降の平均収入
annual_income = df.iloc[8:, 0]
# 平成19年度以降の訪日外国人数
foreign_visiter = df.iloc[8:, 1]
# 平成19年度以降の日本の経済成長(仮)
GDP = df.iloc[8:, 3]

In [None]:
# 平成19年度以降における3つのデータののリストを連結
x = np.vstack([GDP, foreign_visiter, annual_income])

In [None]:
np.corrcoef(x)