# 입문자를 위한, 파이썬/R 데이터 분석  

]

## Today's mission

- FDR를 통한 여러 종목 수익률 비교
- 네이버 금융 개별종목 수집
- plotly로 일별 시세 시각화

]

## plotly로 일별 시세 시각화

### Plotly 는?
* 파이썬의 대표적인 인터랙티브 시각화 도구
* [Plotly Python Graphing Library | Python | Plotly](https://plotly.com/python/)
* [Financial Charts | Python | Plotly](https://plotly.com/python/financial-charts/)
* [Time Series and Date Axes | Python | Plotly](https://plotly.com/python/time-series/)
* [OHLC Charts | Python | Plotly](https://plotly.com/python/ohlc-charts/)
* [Python API reference for plotly — 4.14.3 documentation](https://plotly.com/python-api-reference/)

###  Plotly Express: high-level interface for data visualization
* https://plotly.com/python-api-reference/plotly.express.html
* seaborn 과 비슷한 사용법
* 사용법이 plotly.graph_objects 에 비해 비교적 간단한 편 

### Pandas와 쉽게 호환되는 cufflinks
* [santosjorge/cufflinks: Productivity Tools for Plotly + Pandas](https://github.com/santosjorge/cufflinks)

## 필요한 라이브러리 로드

In [None]:
# plotly 최신버전을 사용해 주세요. 최신버전이 아닐 때 동작하지 않을 수 있습니다.
#!pip install plotly --upgrade

In [None]:
import pandas as pd
import plotly.express as px
import plotly.offline as pyo
pyo.init_notebook_mode()

## plotly 예제 따라하기
* [Time Series and Date Axes | Python | Plotly](https://plotly.com/python/time-series/)

In [None]:
# px 에서 내장하고 있는 data.stocks 데이터를 불러옵니다.
df = px.data.stocks()
df.shape

In [None]:
df

## 일별 수익률 선그래프 그리기

In [None]:
# px.line 으로 특정 종목("GOOG")에 대해 선그래프를 그립니다.
px.line(df, x="date", y="GOOG")

## 일별 수익률 막대그래프 그리기

In [None]:
# 일별 수익률에서 -1을 빼줍니다.
df_1 = df.set_index("date") - 1
df_1.head()

In [None]:
# 수익률을 막대그래프로 그립니다.
px.bar(df_1, x=df_1.index, y="GOOG")

## facet_col을 사용한 서브플롯 그리기

In [None]:
df_1.columns

In [None]:
# df_1.columns 의 name을 "company"로 지정하기
df_1.columns.name = "company"
df_1.columns

In [None]:
# px.area 로 수익률 분포를 그립니다.
# facet_col 을 통해 서브플롯을 그릴 수 있습니다.
px.area(df_1, facet_col="company", facet_col_wrap=2)

## 여러 종목을 하나의 그래프로 표현하기

In [None]:
df_1.head()

In [None]:
df_1.columns

In [None]:
df_1 = df_1.reset_index()

In [None]:
df_1

In [None]:
# px.line 으로 전체 데이터의 수익률을 구합니다.
# hover_data={"date": "|%Y-%m-%d"} 로 시간을 표현할 수 있습니다.
fig = px.line(df, x="date", y=df.columns, hover_data={"date": "|%Y-%m-%d"})
fig.update_xaxes(
    dtick="M1",
    tickformat="%b\n%Y")

##  Range Slider와 함께 시계열 그래프 그리기
* [Time Series and Date Axes | Python | Plotly](https://plotly.com/python/time-series/)

In [None]:
fig = px.line(df, x="date", y="AAPL")
fig.update_xaxes(rangeslider_visible=True)

## Simple Candlestick with Pandas

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/92/Candlestick_chart_scheme_01-en.svg/1280px-Candlestick_chart_scheme_01-en.svg.png" width="300">

캔들스틱 차트(영어: Candlestick chart) 또는 봉차트, 일본식 캔들스틱 차트는 주식을 비롯한 유가증권과 파생상품, 환율의 가격 움직임을 보여주는 금융 차트이다. 각각의 "캔들스틱" 또는 "봉"은 일반적으로 "하루"의 가격 움직임을 나타내며, 따라서 20일간의 거래를 보여주는 차트에는 20개의 캔들스틱이 있다.

캔들스틱 차트는 기술 통계학에서 사용되는 상자 수염 그림과 외적으로 유사하지만, 상자 수염 그림은 캔들스틱과 달리 금융이 아닌 다른 정보들을 표시한다.

출처 : [캔들스틱 차트 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EC%BA%94%EB%93%A4%EC%8A%A4%ED%8B%B1_%EC%B0%A8%ED%8A%B8)

<img src="https://i.imgur.com/8hS43K1.png">

* [Candlestick Charts | Python | Plotly](https://plotly.com/python/candlestick-charts/)

In [None]:
# plotly.graph_objects 를 go라는 별칭으로 불러옵니다.
import plotly.graph_objects as go

In [None]:
# go.Candlestick 을 그립니다.
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/finance-charts-apple.csv')
df.head()

In [None]:
fig = go.Figure(data=[go.Candlestick(x=df['Date'],
                open=df['AAPL.Open'],
                high=df['AAPL.High'],
                low=df['AAPL.Low'],
                close=df['AAPL.Close'])])
fig.show()

## OHLC(Open-High-Low-Close)


<img src="https://i.imgur.com/7str78U.png">


* [OHLC Charts | Python | Plotly](https://plotly.com/python/ohlc-charts/)

In [None]:
# go.Ohlc를 그립니다.

fig = go.Figure(data=[go.Ohlc(x=df['Date'],
                open=df['AAPL.Open'],
                high=df['AAPL.High'],
                low=df['AAPL.Low'],
                close=df['AAPL.Close'],
                increasing_line_color='red', # 상승봉
                decreasing_line_color='blue' # 하락봉
                )])
fig.show()

## Candlestick without Rangeslider
* [candlestick Traces | Python | Plotly](https://plotly.com/python/reference/candlestick/)

In [None]:
# Rangeslider를 제외하고 Candlestick을 그립니다.
fig = go.Figure(data=[go.Ohlc(x=df['Date'],
                open=df['AAPL.Open'],
                high=df['AAPL.High'],
                low=df['AAPL.Low'],
                close=df['AAPL.Close'],
                increasing_line_color='red', # 상승봉
                decreasing_line_color='blue' # 하락봉
                )])
fig.update_layout(xaxis_rangeslider_visible=False)
fig.show()

## 직접 수집한 주가 데이터로 시각화 해보기

In [None]:
#pip install finance-datareader

In [None]:
# FinanceDataReader 로드하기
import FinanceDataReader as fdr

In [None]:
# 특정 주가 불러오기
# FinanceDataReader의 DataReader는 미국 주식의 경우 종목코드대신 티커(Ticker)를 사용합니다.
# 티커는 약자와 비슷합니다.(마이크로소프트:MSFT, 스타벅스:SBUX 등)
sbux = fdr.DataReader("MSFT", "2015")
sbux.shape

In [None]:
sbux.head()

In [None]:
sbux.tail()

### 선그래프 그리기

In [None]:
# px.line
px.line(sbux, y="Close", title="SBUX 일별 종가")

In [None]:
# 전일비에 대한 선 그래프를 그립니다.
px.line(sbux, y="Volume", title="SBUX 거래량")

In [None]:
# 전일비에 대한 히스토그램을 그립니다.
# marginal="box" 옵션을 사용해 봅니다.
px.histogram(sbux, x="Change", marginal="violin", title="SBUX 전일비")

###  Range Slider와 함께 Candlestick 그리기
* [Time Series and Date Axes | Python | Plotly](https://plotly.com/python/time-series/)

In [None]:
sbux.head(1)

In [None]:
fig = go.Figure(data=[go.Candlestick(x=sbux.index,
                open=sbux['Open'],
                high=sbux['High'],
                low=sbux['Low'],
                close=sbux['Close'],
                increasing_line_color='red', # 상승봉
                decreasing_line_color='blue' # 하락봉
                                    )])
fig.show()

### OHLC(Open-High-Low-Close)

In [None]:
fig = go.Figure(data=[go.Ohlc(x=sbux.index,
                open=sbux['Open'],
                high=sbux['High'],
                low=sbux['Low'],
                close=sbux['Close'],
                increasing_line_color='red', # 상승봉
                decreasing_line_color='blue' # 하락봉
                )])
fig.show()

### 여러 종목의 수익률 보기

In [None]:
FAANG = ["X", "AMZN", "AAPL", "NFLX", "GOOGL"]
FAANG

In [None]:
# faang_list 의 종가 가져오기
faang_list = [fdr.DataReader(code, '2019', '2023')['Close'] for code in FAANG]

In [None]:
faang_list

In [None]:
# concat 으로 데이터 병합하기
df_faang = pd.concat(faang_list, axis=1)
df_faang

In [None]:
df_faang.columns = FAANG
df_faang

In [None]:
df_faang.shape

In [None]:
# 수집한 데이터 확인하기
df_faang.head()

In [None]:
df_faang.tail()

In [None]:
df_faang.iloc[0]

In [None]:
# 일별 수익률 구하기
df_ratio = df_faang / df_faang.iloc[0] - 1
df_ratio

In [None]:
# 서브플롯을 그리기 위해 columns.name 을 설정하기
df_ratio.columns.name = "company"
df_ratio.columns

### 선그래프 그리기

In [None]:
# px.line 으로 선 그래프 그리기
px.line(df_ratio, title="FAANG 일별 수익률")

### areaplot 그리기

In [None]:
# px.area 로 수익률 그래프 그리기
px.area(df_ratio)

In [None]:
px.area(df_ratio, facet_col="company", facet_col_wrap=2)

### 막대그래프 그리기

In [None]:
px.bar(df_ratio, facet_col="company", facet_col_wrap=2)

In [None]:
#px.histogram?

In [None]:
px.bar(df_ratio, x=df_ratio.index, y="X")

### scatterplot 그리기

In [None]:
px.scatter(df_ratio, 
           x="GOOGL", y="AAPL", 
           marginal_x="box", marginal_y="violin")

### distribution 그리기

In [None]:
df_ratio.describe()

In [None]:
# px.box
px.box(df_ratio, points="all")

In [None]:
# px.violin
#px.violin(df_ratio, points="all")

In [None]:
# px.strip
px.strip(df_ratio)

In [None]:
# px.histogram
px.histogram(df_ratio, facet_col="company", 
             facet_col_wrap=2,
            nbins=50)

## Plotly 공식문서 더 보기

[Plotly Python Graphing Library | Python | Plotly](https://plotly.com/python/)