# Pythonによるデータ分析

リアルタイム分析につながる一歩としてグラフやインターネットからデータを取得する方法を確認します。




## グラフ入門

### matplotlib
matplotlibを使ってグラフを書くことができます。

詳しい情報は以下のサイトがまとまっています。

https://qiita.com/DeepTama/items/dfb714f155b529711109

https://qiita.com/nkay/items/d1eb91e33b9d6469ef51

https://qiita.com/Shmwa2/items/8f0d337c0bfb75a8716f


最初に環境設定をしておきます。

In [None]:
# 日本語グラフを表示するために必要なライブラリのインストール
!pip install japanize_matplotlib
import japanize_matplotlib

シンプルに棒グラフ（bar）を作成してみましょう。
Excelと同じくグラフの装飾をしていきます。

ここでは横軸の軸ラベルと値を指定してグラフ化してみます。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
plt.bar(x = ['一番','二番','三番','四番'],height = [10,50,80,30])

plt.show()

折れ線グラフ(plot)

In [None]:
import matplotlib.pyplot as plt

# 折れ線グラフ
# x,y軸の値のセットを渡します。
plt.plot([1, 2, 3, 4] ,[10 ,50 ,80 ,30])

plt.show()

円グラフ（pie）

In [None]:
import matplotlib.pyplot as plt

# 円グラフ
# 開始位置の設定とラベル付けを行う
plt.pie([10 ,50 ,80 ,30],startangle=90, labels = ['少ない','','多い',''] )

plt.show()

散布図（scatter）

In [None]:
import matplotlib.pyplot as plt

# 散布図
# x,y軸のデータを提供します。
plt.scatter([10 ,50 ,80 ,30],[40, 50, 20, 80] )

plt.show()

ほかにもグラフがありますが、「matplotlib グラフ種類」で検索すると情報が得られます。


次に棒グラフに戻り、詳細設定を行います。

まずは軸ラベルの設定から行います。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
plt.bar(x = ['one','two','three','four'],height = [10,50,80,30])

# X軸ラベルの表示
# plt.xlabel('X軸')
# Y軸ラベルの表示
# plt.ylabel('Y軸')

plt.show()

凡例の表示を行います。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
# 凡例はlabel引数で指定します。
plt.bar(x = ['one','two','three','four'],height = [10,50,80,30],label='first')

# X軸ラベルの表示
plt.xlabel('X labels')
# Y軸ラベルの表示
plt.ylabel('Y labels')

# 凡例の表示をします。
# plt.legend()

plt.show()

グラフにタイトルを設定します。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
# 凡例はlabel引数で指定します。
plt.bar(x = ['one','two','three','four'],height = [10,50,80,30],label='first')

# タイトルの設定
# plt.title('Graph Title')

# X軸ラベルの表示
plt.xlabel('X labels')
# Y軸ラベルの表示
plt.ylabel('Y labels')

# 凡例の表示をします。
plt.legend()

plt.show()

複数系列を追加するにはラベルの見出しとデータを設定します。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
# 凡例はlabel引数で指定します。
# first系列の指定、基準に対してマイナス位置とします。
plt.bar(x = ['one','two','three','four'],height = [10,50,80,30],
        align = 'edge', width = -0.3,label = 'first')
# second系列の指定、基準に対してプラス位置とします。
plt.bar(x = ['one','two','three','four'],height = [20,30,40,50],
        align = 'edge' , width = 0.3,label = 'second')

# タイトルの設定
plt.title('Graph Title')

# X軸ラベルの表示
plt.xlabel('X labels')
# Y軸ラベルの表示
plt.ylabel('Y labels')

# 凡例の表示をします。
plt.legend()

plt.show()


積み上げ棒グラフ

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
# 凡例はlabel引数で指定します。
# first系列の指定
plt.bar(x = ['one','two','three','four'],height = [10,50,80,30],
        label = 'first')

# second系列の指定(開始位置（bottom）を第一系列にします。)
plt.bar(x = ['one','two','three','four'],height = [20,30,40,50],
        bottom = [10,50,80,30] ,label = 'second')

# タイトルの設定
plt.title('Graph Title')

# X軸ラベルの表示
plt.xlabel('X labels')
# Y軸ラベルの表示
plt.ylabel('Y labels')

# 凡例の表示をします。
plt.legend()

plt.show()

データ系列の値を表示します。

In [None]:
import matplotlib.pyplot as plt

# 棒グラフをx軸のラベルを設定して表示します。
# 棒グラフにはグラフの軸ラベル（x）とデータ(height)が必須となります。
# 凡例はlabel引数で指定します。
# first系列の指定
one = plt.bar(x = ['one','two','three','four'],height = [10,50,80,30],
        label = 'first')
# second系列の指定(開始位置を第一系列にします。)

two = plt.bar(x = ['one','two','three','four'],height = [20,30,40,50],
        bottom = [10,50,80,30] ,label = 'second')

# タイトルの設定
plt.title('Graph Title')

# X軸ラベルの表示
plt.xlabel('X labels')
# Y軸ラベルの表示
plt.ylabel('Y labels')

# 凡例の表示をします。
plt.legend()

# label_typeに'center'以外どんなものがあるか調べてみましょう。
# plt.bar_label(one , padding=0, fontsize=14, label_type='edge')
# plt.bar_label(two , padding=0, fontsize=14, label_type='edge')

plt.show()

