# 0-1 Seabornの導入

In [None]:
import piplite
import pyodide
await piplite.install("seaborn")

import seaborn as sns
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline
sns.set_theme(style="darkgrid")

最初の設定を回す

In [None]:
data = pd.read_csv(pyodide.http.open_url("https://raw.githubusercontent.com/ChungWookyung/kg-jupyterlite-data-analysis/main/content/DATA/flights.csv"))
data.head()

折れ線グラフを描くためのサンプルデータを読み込んだ

In [None]:
sns.lineplot(data = data, x = "year", y = "passengers")

Seabornで折れ線グラフを描くための関数は sns.lineplot である

In [None]:
sns.lineplot(data = data, x = "year", y = "passengers", color = "red")

今までの図と同じくcolorオプションで色を変えることができる

In [None]:
sns.lineplot(data = data, x = "year", y = "passengers", hue = "month")

hueオプションは指定した列によって違う色の線を描くために用いられる

In [None]:
ax = sns.lineplot(data = data, x = "year", y = "passengers")
ax.axvspan(1952, 1956, alpha=0.5, color='grey')

折れ線グラフと共に、グラフの特定の期間に色を塗ることもおすすめである

# 0-2 プロットの設定

In [None]:
sns.lineplot(data = data, x = "year", y = "passengers")
plt.title("Lineplot")
plt.xlabel("YEAR")
plt.ylabel("Kyaku")

- plt.title()でタイトルの設定
- plt.ylabel()で縦軸のラベル設定
- plt.xlabel()で横軸のラベル設定

注意：日本語を対応させるにはものすごくややこしい作業が必要なので、英語だけ使う

# 1. 株価指数の折れ線グラフ

In [None]:
data = pd.read_csv(pyodide.http.open_url("https://raw.githubusercontent.com/ChungWookyung/kg-jupyterlite-data-analysis/main/content/DATA/index.csv"))
data["time"] = pd.to_datetime(data["time"])
data.head()

- SPI : 米国S&P指数
- KOSPI : 韓国KOSPI指数
- STOXX : ヨーロッパSTOXX指数
- NIKKEI : 日本日経225指数

In [None]:
sns.lineplot(data = data, x = "time", y = "SPI")

飛躍的に増加していることが分かる

In [None]:
sns.lineplot(data = data, x = "time", y = "STOXX")

好きな指数一つを描いてみよう

In [None]:
data2 = data.melt(id_vars="time", value_vars=data.columns[1:])
data2.head()

In [None]:
sns.lineplot(data = data2, x = "time", y = "value", hue = "variable")

同時に描くと比較できないことがわかった。

In [None]:
data3 = data2.copy(deep=True)
data3["value"] = np.log1p(data2.value.pct_change())
data3 = data3[data3["time"] >= "2010-01-01"]
data3.head()

In [None]:
sns.lineplot(data = data3, x = "time", y = "value", hue = "variable")

対数差分で見ると、大体同じくらいの動きをしていることがわかる

In [None]:
ax = sns.lineplot(data = data, x = "time", y = "NIKKEI")
ax.axvspan(pd.to_datetime("1990"), pd.to_datetime("2020"), alpha=0.5, color='grey')

失われた30年をグレーに塗ってみた

# 2. 国データの折れ線グラフ

In [None]:
gdp = pd.read_csv(pyodide.http.open_url("https://raw.githubusercontent.com/ChungWookyung/kg-jupyterlite-data-analysis/main/content/DATA/gdp_per_capita90to20.csv"))
pop = pd.read_csv(pyodide.http.open_url("https://raw.githubusercontent.com/ChungWookyung/kg-jupyterlite-data-analysis/main/content/DATA/population90to20.csv"))
gdp.head()

ドル単位の一人当たりGDPデータと人口データを読み込んだ(1990-2020)

In [None]:
sns.lineplot(data = gdp, x = "time", y = "Japan")

日本のGDPを描いてみた

In [None]:
gdp2 = gdp.loc[:,["time", "Japan","United States", "South Korea", "Vietnam", "China"]].melt(id_vars="time",value_vars=["Japan","United States", "South Korea", "Vietnam", "China"])
gdp2.head()

In [None]:
sns.lineplot(data = gdp2, x = "time", y = "value", hue="variable")

アメリカ、日本、韓国、ベトナム、中国の一人当たりGDPの折れ線グラフである

In [None]:
sns.lineplot(data = pop, x = "time", y = "Japan")

日本の人口が減っていることが分かる

In [None]:
ax = sns.lineplot(data = pop, x = "time", y = "Japan")
ax.axvspan(2010, 2020, alpha=0.5, color='grey')

日本の人口が減ったところからグレーの領域を描いてみた

In [None]:
pop2 = pop.loc[:,["time", "Japan","United States", "South Korea", "Vietnam", "China"]].melt(id_vars="time",value_vars=["Japan","United States", "South Korea", "Vietnam", "China"])
pop2.head()

In [None]:
sns.lineplot(data = pop2, x = "time", y = "value", hue="variable")

アメリカ、日本、韓国、ベトナム、中国の人口の折れ線グラフである

In [None]:
pop3 = pop2[pop2["variable"] != "China"]
sns.lineplot(data = pop3, x = "time", y = "value", hue="variable")

中国が人口が多すぎたので、のぞいて描いたら、このようになる

# ３. 暗号通貨の折れ線グラフ

In [None]:
data = pd.read_csv(pyodide.http.open_url("https://raw.githubusercontent.com/ChungWookyung/kg-jupyterlite-data-analysis/main/content/DATA/crypto.csv"))
data["time"] = pd.to_datetime(data["time"])
data.head()

暗号通貨とそれ以外の資産の価格データを読み込んだ
- BTCUSD : ビットコインの価格
- ETHUSD : イーサリウムの価格
- SPX : S&P500指数
- USOIL : 原油価格
- GOLD : 金の価格

In [None]:
sns.lineplot(data = data, x = "time", y = "BTCUSD")

ビットコインの折れ線グラフ

In [None]:
ax = sns.lineplot(data = data, x = "time", y = "BTCUSD")
ax.axvspan(pd.to_datetime("2016-07-09"), pd.to_datetime("2017-12-01"), alpha=0.5, color='grey')
ax.axvspan(pd.to_datetime("2020-05-11"), pd.to_datetime("2021-12-01"), alpha=0.5, color='grey')

ビットコインの半減期をグレーに塗ってみた

In [None]:
sns.lineplot(data = data, x = "time", y = "ETHUSD")

イーサリウムの折れ線グラフ

In [None]:
data2 = data.melt(id_vars="time", value_vars=data.columns[1:])
data2.head()

In [None]:
sns.lineplot(data = data2, x = "time", y = "value", hue = "variable")

全てを一つの図に描いたら、ビットコインの価格が大きすぎて、あまり見えない

In [None]:
sns.lineplot(data = data2[data2["time"] < "2018-01-01"], x = "time", y = "value", hue = "variable")
plt.xticks(rotation=45)

2018年1月1日以前に絞ったら、どれくらいビットコインが激しく成長するのかが分かる