# 9장 대시보드로 웹 앱(Web App) 만들기
- dash 는 python으로 데이터 분석을 위한 웹앱을 쉽게 만들어주는 라이브러리이다.
- 대시 모듈 설치: pip3 install dash
- 대시 모듈 설치 확인: pip3 show dash
```
Name: dash
Version: 2.8.1
Summary: A Python framework for building reactive web-apps. Developed by Plotly.
Home-page: https://plotly.com/dash
Author: Chris Parmer
Author-email: chris@plotly.com
License: MIT
Location: /usr/local/lib/python3.7/site-packages
Requires: dash-html-components, dash-core-components, Flask, dash-table, plotly
위 처럼 필요한 라이브러리들이 자동으로 설치된다. 파이썬에서 아래 5가지를 사용하여 웹 페이지 앱을 구성할 수 있다.
dash-html/core-components는 웹 컨텐츠 사용, Fask는 웹 서버, dash-table은 표 데이터 사용, plotly는 대화형 챠트 사용
```
- 관련도서 : 파이썬을 이용한 인터랙티브 대시보드 만들기 https://www.bookk.co.kr/book/view/111629
- 기술참조 : http://bigdata.dongguk.ac.kr/lectures/datascience/_book/a4.-dash%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%9C-python-dashboard.html

## 9.1 대시보드 둘러보기[dash 구성요소]
### 대시 레이아웃(layout) : react-entry-point 라는 div.id명 영역에 컴파일된 html이 렌더링(출력)된다.
- 애플리케이션의 외형(UI)에 필요한 구성 요소들로 구성되며. 구성 요소 라이브러리로 아래와 같은 라이브러리를 제공
```
 dash_html_components: 대부분의 HTML 태그에 대한 구성요소
 dash_core_components: 버튼, 입력필드, 그래프 및 드롭다운과 같은 고급 대화형(인터렉티브) 구성 요소가 포함
 dash_table: 데이터에 대한 테이블 뷰어
 ```
- 대시 콜백(callback) 인터랙티브한 화면 처리
```
 callback은 Dash앱을 대화형으로 만드는 함수로 입력요소의 속성이 변경될 때마다 하단에 위치한 함수가 자동으로 호출된다.
 @app.callback(매개인자,파리미터)함수는 매개 파라미터에 입력(Input)객체와 출력(Output) 객체로 구성된다.
 @app.callback()함수 하단에 위치한 함수를 통해 화면이 리로딩 재생된다.
 
 ```

### 9.1.1 데모 웹 앱으로 대시보드 맛보기 [layout 으로만 작성된 코드]
![아래 대시보드 앱 코드 실행 미리보가](./image/dashboard.jpg)

### 9.1.2 웹 앱을 위한 코드 실행 방법
- %%writefile ./data/dash_app.py 아래 코드 상단에 파일을 생성하는 명령으로 파일을 생성할 수 도 있다.
- 또는 위 명령어 없이 아래 코드로 주피터 노트북에서 바로 실행 가능하다.

In [None]:
#%%writefile ./data/dash_app.py
from dash import Dash, html, dcc #dcc(dash_core_components)
import plotly.express as px
import pandas as pd

df = px.data.iris() # 판다스에 내장된 iris함수로 data 불러오기: 분꽃 종류별 데이터
display(df) #sepal(꽃받침)과 petal(꽃잎)의 길이,너비 크기로 setosa, versicolor, virginica 3가지 종류로 구분
# plotly를 이용한 산점도(스캐터) 그래프 객체 생성
fig = px.scatter(df, x="sepal_length", y="sepal_width", color="species")

app = Dash(__name__) #Dash클래스에 프로그램 이름 내장변수로 app 객체 생성.파이썬 파일이 메인 프로그램으로 사용될 때는 __main__ 이 기본값
# app layout: html과 dcc 모듈을 이용
app.layout = html.Div(children=[
    # Dash HTML Components module로 HTML 작성 
    html.H1(children='첫번째 Dash 연습'),
    html.Div(children='''
        대시를 이용하여 웹어플리케이션 작성 연습...
    '''),
    # dash.core.components(dcc)의 그래프컴포넌트로 plotly 그래프 렌더링
    dcc.Graph(
        id='graph1',
        figure=fig
    )
])

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

In [None]:
# 위에서 파이썬 파일을 생성했을 경우 bash shell 명령어를 !기호를 붙여서 바로 실행 할 수 있다.(아래)
# 우리 실습에서는 파일에서 실행이 아닌 주피터 노트묵에서 실행한다.
# !python ./data/dash_app.py

## 9.2 대시보드 기본 사용법

### 9.2.1 html(dash_html_components) 모듈

[html.H1(), html.Div(), html.Br(), html.A(), …] 기술 참조: https://dash.plotly.com/dash-html-components
```
<div style="margin-bottom: 50px; margin-top: 25px;">
    <div style="color: blue; font-size: 14px">
        샘플 Div
    </div>
    <p class="my-class", id="my-p-element">
        샘플 P
    </p>
</div>
```
- 위 태그를 아래 html 객체를 사용하여 코딩한다.

In [None]:
from dash import Dash, html

app = Dash(__name__)
app.layout = html.Div(
    [
        html.Div('샘플 Div', style={'color': 'blue', 'fontSize': 14}),
        html.P('샘플 P', className='my-class', id='my-p-element')
    ],
    style={'marginBottom': 50, 'marginTop': 25}
)

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

### 9.2.2 dcc(dash_core_components) 모듈

[기본서식]
```
Dropdown : dcc.Dropdown(id, options=[“a”, “b”, “c”], value=[“a”], multi=True, …)
Checklist : dcc.Checklist(id, options=[“a”, “b”, “c”], value=[“a”], inline=True)
Input : dcc.Input(id=‘range’, type=‘number’, min=2, max=10, step=1)
Graph : dcc.Graph(id=’’, figure=, …)
Slider : ddcc.Slider(min=0, max=20, step=5, value=10, id=‘my-slider’)
```

[Dropdown 모듈] 소스 참조 : https://dash.plotly.com/dash-core-components/dropdown

In [None]:
from dash import Dash, dcc, html, Input, Output

app = Dash(__name__)
app.layout = html.Div([
    html.Div(id='dd-output-container'),
    html.Div(dcc.Dropdown(['선택1', '선택2', '선택3'], '선택1', id='demo-dropdown')),
    html.Div([
        html.Span(id='dd-output-container2'),
        dcc.Dropdown(
            options=[
                {'label': '선택1', 'value': 'D1'},
                {'label': '선택2', 'value': 'D2'},
                {'label': '선택3', 'value': 'D3'},
            ],
            value='D2',
            id='demo-dropdown2'
        )
    ]),
])
# 아래 콜백 함수에서 항상 Output 이 먼저 와야 한다.
@app.callback(
    Output('dd-output-container', 'children'),
    Input('demo-dropdown', 'value'),
)
@app.callback(
    Output('dd-output-container2', 'children'),
    Input('demo-dropdown2', 'value'),
)
# update_output 는 콜백으로 자동실행된다.
def update_output(value):
    return f'You have selected {value}'

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

[Checklist 모듈] 소스 참조 : https://dash.plotly.com/dash-core-components/checklist

In [None]:
from dash import Dash, dcc, html, Input, Output
# 위 Dropdown 소스를 그대로 사용하고 아래 판다스 부분만 추가한다. ['선택1'],['D2'] 초기값 만 배열로 만든다.
import pandas as pd
from plotly.express import data
df =  data.medals_long()

app = Dash(__name__)
app.layout = html.Div([
    html.Div(id='dd-output-container'),
    html.Div(dcc.Checklist(['선택1', '선택2', '선택3'], ['선택1'], id='demo-dropdown')),
    html.Div([
        html.Span(id='dd-output-container2'),
        dcc.Checklist(
            options=[
                {'label': '선택1', 'value': 'D1'},
                {'label': '선택2', 'value': 'D2'},
                {'label': '선택3', 'value': 'D3'},
            ],
            value=['D2'],
            id='demo-dropdown2'
        ),
        dcc.Checklist(df.columns, df.columns[0:2].values)
    ]),
])
# 아래 콜백 함수에서 항상 Output 이 먼저 와야 한다.
@app.callback(
    Output('dd-output-container', 'children'),
    Input('demo-dropdown', 'value'),
)
@app.callback(
    Output('dd-output-container2', 'children'),
    Input('demo-dropdown2', 'value'),
)
# update_output 는 콜백으로 자동실행된다.
def update_output(value):
    return f'You have selected {value}'

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

[Input 모듈] 소스 참조 : https://dash.plotly.com/dash-core-components/input

In [None]:
from dash import Dash, dcc, html, Input, Output

app = Dash(__name__)

ALLOWED_TYPES = (
    "text", "number", "password", "email", "search",
    "tel", "url", "range", "hidden",
)

app.layout = html.Div(
    [
        dcc.Input(
            id="input_{}".format(one_type),
            type=one_type,
            placeholder="input type {}".format(one_type),
        )
        for one_type in ALLOWED_TYPES
    ]
    + [html.Div(id="out-all-types")] #최상위 [영역]은 1개만 존재할 수 있다. 그래서, 1개로 합친다.
)
# 아래 콜백 함수에서 항상 Output 이 먼저 와야 한다.
@app.callback(
    Output("out-all-types", "children"),
    [Input("input_{}".format(one_type), "value") for one_type in ALLOWED_TYPES],
)
# cb_render 는 콜백으로 자동실행된다.
def cb_render(*vals):
    return " | ".join((str(val) for val in vals if val))


if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

[Graph 모듈] 소스 참조 : https://dash.plotly.com/dash-core-components/graph

In [None]:
from dash import Dash, dcc, html
import plotly.graph_objs as go

# 선 그래프
trace1 = go.Scatter(x=['기준1', '기준2', '기준3'], y=[4, 1, 2], name = '데이터A')
trace2 = go.Scatter(x=['기준1', '기준2', '기준3'], y=[2, 4, 5], name = '데이터B')
# 막대 그래프
fig2={
        'data': [
            {'x': ['기준1', '기준2', '기준3'], 'y': [4, 1, 2], 'type': 'bar', 'name': '데이터A'},
            {'x': ['기준1', '기준2', '기준3'], 'y': [2, 4, 5], 'type': 'bar', 'name': '데이터B'},
        ],
        'layout': {
            'title': '막대 그래프'
        }
    }

# 선 그래프 : 다른 방법 : 분류가 썩여 있는 데이터를 구분 할 때 유리하다.
import pandas as pd
import plotly.express as px
df = pd.DataFrame({
    "기준": ["기준1", "기준2", "기준3", "기준1", "기준2", "기준3"],
    "값": [4, 1, 2, 2, 4, 5],
    "분류": ["데이터A", "데이터A", "데이터A", "데이터B", "데이터B", "데이터B"]
})
fig3 = px.line(df, x="기준", y="값", color="분류")
fig4 = px.bar(df, x="기준", y="값", color="분류", barmode="group")
# fig3 = px.line(x=['기준1', '기준2', '기준3'], y=[4, 1, 2], title = '단일 그래프 표현')

# 주피터 노트북에 출력 matplotlib.pyplot 사용하는 대신에 좀더 직관적이다.
import plotly.offline as pyo
pyo.iplot([trace1,trace2])
pyo.iplot(fig2)

# 웹 대시보드에 출력
fig = go.Figure(data=[trace1,trace2])
external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']
app = Dash(__name__, external_stylesheets=external_stylesheets)
# app = Dash(__name__)
app.layout = html.Div(children=[
    html.H1(children='그래프 Dash'),
    html.Div(children='''
        스캐터(라인) 그래프
    ''', style={'text-align': 'center'}),
    dcc.Graph(
        id='example-graph',
        figure=fig
    ),
    dcc.Graph(
        id='example-graph2',
        figure=fig2
    ),
    dcc.Graph(
        id='example-graph3',
        figure=fig3
    ),
    dcc.Graph(
        id='example-graph4',
        figure=fig4
    )
])

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

[slider 모듈] 소스 참조 : https://dash.plotly.com/dash-core-components/slider

In [None]:
from dash import Dash, dcc, html, Input, Output

external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']
app = Dash(__name__, external_stylesheets=external_stylesheets)

# my-slider의 값 접근 시 다음 함수 사용 - 콜백에서 display_value함수로 10의 value 제곱 값을 변환
def transform_value(value):
    return 10 ** value

app.layout = html.Div([
    dcc.Slider(0, 3, 0.01,
        id='slider-updatemode',
        marks={i: '{}'.format(10 ** i) for i in range(4)},
        value=2,
        updatemode='drag'
    ),
    html.Div(id='updatemode-output-container', style={'margin-top': 20})
])

@app.callback(
    Output('updatemode-output-container', 'children'),
    Input('slider-updatemode', 'value')
)
# display_value 는 콜백으로 자동실행된다
def display_value(value):
    return 'Linear Value: {} | \
            Log Value: {:0.2f}'.format(value, transform_value(value))

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

### 9.2.3 dash_table 모듈

[대시보드 앱용 부트스트랩 디자인 콤포넌트 사용] pip3 install dash_bootstrap_components
- 기술참조: https://formattable.pythonanywhere.com/

In [None]:
import pandas as pd
import requests, json
response = requests.get("https://kobis.or.kr/kobisopenapi/webservice/rest/boxoffice/searchDailyBoxOfficeList.json?key=f5eef3421c602c6cb7ea224104795888&targetDt=20230101")
display(response.status_code)
display(response.headers['content-type'])
display(response.encoding)
#display(response.text)
#json_Data = json.loads(response.text, encoding="utf_8")
json_Data = response.json() #응답받은 json모양의 text를 json 객체로 변경
# pd.set_option('display.float_format', '{:,}'.format) #천의 자리에 ,찍기 pd.set_option('display.float_format', None) 문자라서 안됨
df = pd.DataFrame(json_Data['boxOfficeResult']['dailyBoxOfficeList'])
#df = df[pd.to_numeric(df['audiAcc'])>=3000000] #총 관객수가 300만이상 데이터 조회조건 추가
#df[['movieNm','openDt','salesAmt','salesAcc','audiCnt','audiAcc']]
df.rename(columns={'rank':'순위','movieNm':'영화명','openDt':'개봉일','salesAmt':'일별수입','salesAcc':'총 수입','audiCnt':'일별관객수','audiAcc':'총 관객수'}, inplace=True)
# df.rename(index = lambda y: "순위_" + str(y+1), inplace = True)
# print(len(df))
print(type(df))
blankIndex=[''] * len(df)
df.index=blankIndex
df = df[['순위','영화명','개봉일','일별수입','총 수입','일별관객수','총 관객수']] #컬럼명 변경 후 출력
# 일별슈입 부터 총 관객수 컬럼까지 숫자에 콤마 붙이기(아래)
df2 = df.copy() #그냥 copy() 없이 객체를 복사하면, 값이 공유된다. copy()해야 신규 객체가 생성된다.
for i in df2.columns[3:7]:
    df2[i] = df2[i].astype(int).map('{:,}'.format)
display(df2)
# 대시보드 앱 시작(아래)
from dash import Dash, dcc, Input, Output, callback, dash_table, State, html
import dash_bootstrap_components as dbc # 부트 스트랩 디자인 사용
from dash.dash_table.Format import Format, Group # , type:'numeric', format:Format(group=True, groups=[4])

app = Dash(external_stylesheets=[dbc.themes.BOOTSTRAP]) # __name__ 사용하지 않는 대신에 하단에 @callback 처럼 사용
# formatted = Format()
# formatted = formatted.group(Group.yes)
# formatted = {'locale': {}, 'nully': '', 'prefix': None, 'specifier': ','}
app.layout = dbc.Container([
    dcc.Checklist(['콤마찍기'], ['콤마찍기'], id='demo-dropdown'),
    dbc.Label('Click a cell in the table:'),
    dash_table.DataTable(
        columns=[{"name": i, "id": i} for i in df.columns[0:3]]
#         +[{"name": i, "id": i, "type":"numeric", "format":Format(group=True, groups=[3]} for i in df.columns[3:7]],
        +[
            {
                "name": i,
                "id": i,
                "type": "numeric",  # 필수
                "format": Format(group=True, groups=[3])
            }
            for i in df.columns[3:7]
        ],
        id='tbl',
        data=df.to_dict("records"),
        editable=True,
        row_deletable=True,
        style_header={'textAlign': 'center'},
        style_cell={'textAlign': 'center'}
    ),
    dbc.Alert(id='tbl_out'),
    html.Div(id='updatemode-output-container', style={'margin-top': 20})
])

@callback (
    [Output('tbl', 'data'), Output('tbl', 'columns'),Output('updatemode-output-container', 'children')],
    [Input('demo-dropdown', 'value')],
    [State('tbl', 'data'), State('tbl', 'columns')]
)
def update_table(value,data,columns):
    print(type(data))
    if '콤마찍기' in value:
        df = pd.DataFrame(data)
        blankIndex=[''] * len(df)
        df.index=blankIndex
        for i in df.columns[3:7]:
            df[i] = df[i].astype(int).map('{:,}'.format)
        data=df.to_dict("records")
    else:
        df = pd.DataFrame(data)
        blankIndex=[''] * len(df)
        df.index=blankIndex
        for i in df.columns[3:7]:
            df[i] = df[i].str.replace(",", "") # replace는 컴럼단위, str.replace는 문자단위
        display(df)
        data=df.to_dict("records")
    return data, columns, value
    
# def update_table(value):
#     # 테이블 내용 업데이트
#     value = df.to_dict("records")
#     return (value)

@callback(
    Output('tbl_out', 'children'),
    Input('tbl', 'active_cell')
)
def update_graphs(active_cell):
    # 셀을 클릭 했을 때 선택한 데이터 변화 시도 예정...
    return str(active_cell) if active_cell else "Click the table"

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

### 9.2.4 callback 연습. iris 붓꽃 종류 그래프에 인터랙티브 액션 사용

[9장: 436페이지]

In [None]:
#%%writefile ./data/dash_app.py
from dash import Dash, Input, Output, html, dcc #dcc(dash_core_components)
import plotly.express as px
import pandas as pd

df = px.data.iris() # 판다스에 내장된 iris함수로 data 불러오기: 분꽃 종류별 데이터
display(df) #sepal(꽃받침)과 petal(꽃잎)의 길이,너비 크기로 setosa, versicolor, virginica 3가지 종류로 구분
# plotly를 이용한 산점도(스캐터) 그래프 객체 생성
# fig = px.scatter(df, x="sepal_length", y="sepal_width", color="species")
col_names = ["sepal_length", "sepal_width", "petal_length", "petal_width"]
app = Dash(__name__) #Dash클래스에 프로그램 이름 내장변수로 app 객체 생성.파이썬 파일이 메인 프로그램으로 사용될 때는 __main__ 이 기본값
# app layout: html과 dcc 모듈을 이용
app.title = "콜백 Dash 연습"
app.layout = html.Div(children=[
    # Dash HTML Components module로 HTML 작성 
    html.H1(children='콜백 Dash 연습'),
    html.Div([
        'X-변수:',
        dcc.Dropdown(id="xvar_name",
                    options=col_names,
                    value=col_names[0],
                    placeholder="X축을 컬럼을 선택하세요"),
    ], style={'width':'30%', 'display':'inline-block'}),
    html.Div([
        'Y-변수:',
        dcc.Dropdown(id="yvar_name",
                    options=col_names,
                    value=col_names[1],
                    placeholder="Y축을 컬럼을 선택하세요"),
    ], style={'width':'30%', 'display':'inline-block'}),
    html.Br(),
    # dash.core.components(dcc)의 그래프컴포넌트로 plotly 그래프 렌더링
    html.Div([
        dcc.Graph(
            id='update_graph'
        )
    ])
])

@app.callback(
    Output(component_id='update_graph', component_property='figure'),
    Input(component_id='xvar_name', component_property='value'),
    Input('yvar_name', 'value')
)
def update_graphs(xvar, yvar):
    # 여기에 figure 객체 생성
    fig = px.scatter(df, x=xvar, y=yvar, color="species", width=1000, height=700)
    fig.update_layout(title_text="스캐터 Plot of"+xvar+" vs "+yvar, title_font_size=30)
    return (fig)

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)

## 9.3 웹스크래핑과 대시보드를 활용해 웹 앱 만들기

### 9.3.1 주식 데이터 대시보드

[9장: 469페이지]

In [None]:
# %%writefile ./data/stock_info_app.py
# %%writefile C:\myPyScraping\code\ch09\stock_info_app.py
# 주식 데이터를 가져오는 웹 앱
import pandas as pd
import yfinance as yf
import datetime
import matplotlib.pyplot as plt
import matplotlib
from io import BytesIO

#----------------------------------------
# 한국 주식 종목 코드를 가져오는 함수
#----------------------------------------
def get_stock_info(maket_type=None):
    # 한국거래소(KRX)에서 전체 상장법인 목록 가져오기
    base_url =  "http://kind.krx.co.kr/corpgeneral/corpList.do"
    method = "download"
    if maket_type == 'kospi':
        marketType = "stockMkt"  # 주식 종목이 코스피인 경우
    elif maket_type == 'kosdaq':
        marketType = "kosdaqMkt" # 주식 종목이 코스닥인 경우
    elif maket_type == None:
        marketType = ""
    url = "{0}?method={1}&marketType={2}".format(base_url, method, marketType)

    df = pd.read_html(url, header=0)[0]
    
    # 종목코드 열을 6자리 숫자로 표시된 문자열로 변환
    df['종목코드']= df['종목코드'].apply(lambda x: f"{x:06d}")
    
    # 회사명과 종목코드 열 데이터만 남김
    df = df[['회사명','종목코드']]
    
    return df
#----------------------------------------------------
# yfinance에 이용할 Ticker 심볼을 반환하는 함수
#----------------------------------------------------
def get_ticker_symbol(company_name, maket_type):
    df = get_stock_info(maket_type)
    code = df[df['회사명']==company_name]['종목코드'].values
    code = code[0]
    
    if maket_type == 'kospi':
        ticker_symbol = code +".KS" # 코스피 주식의 심볼
    elif maket_type == 'kosdaq':
        ticker_symbol = code +".KQ" # 코스닥 주식의 심볼
    
    return ticker_symbol
#---------------------------------------------------------
ticker_symbol = get_ticker_symbol("삼성전자", "kospi") # 삼성전자, 주식 종류는 코스피로 지정
start_date = "2022-01-01"
end_date = "2022-01-31"
# ticker_data = yf.Ticker(ticker_symbol)
# df = ticker_data.history(start='2022-06-13', end='2022-06-18') # 시작일과 종료일 지정
df = yf.download(ticker_symbol, start=start_date, end=end_date)
display(df.head())
from matplotlib import font_manager as fm
font_path = "/usr/share/fonts/truetype/nanum/NanumGothic.ttf"
font_prop = fm.FontProperties(fname=font_path)
# matplotlib을 이용한 그래프 그리기
matplotlib.rcParams['font.family'] = 'NanumGothic' # 기본은 sans-serif로 전역 설정됨
matplotlib.rcParams['axes.unicode_minus'] = False # 마이너스(-) 폰트 깨짐 방지
# Axes : 보통 plot으로 생각하는 하나의 그래프. 각각의 Axes는 개별적으로 제목 및 x/y 레이블을 가질 수 있다.
# Axis : 번역하면 '축'인데, 그려지는 축을 말하는 것이 아니라 정확히는 x, y 의 제한 범위를 말한다
# pyplog로 간단하게 그래프 그리기
ax = df['Close'].plot(grid=True, figsize=(15, 5)) #여기서는 Axes 출력
ax.set_title("주가(종가) 그래프", fontsize=30, fontproperties=font_prop) # 그래프 제목을 지정
ax.set_xlabel("기간", fontsize=20, fontproperties=font_prop)             # x축 라벨을 지정
ax.set_ylabel("주가(원)", fontsize=20, fontproperties=font_prop)         # y축 라벨을 지정
plt.xticks(fontsize=15)                        # X축 눈금값의 폰트 크기 지정
plt.yticks(fontsize=15)                        # Y축 눈금값의 폰트 크기 지정    
display(type(ax.get_figure()))
# display(df['Close'].index)
plt.show()

import plotly.offline as pyo
import plotly.graph_objs as go
# 2개의 선 그래프
trace1 = go.Scatter(x=df['Open'].index, y=df['Open'], name = '시작가')
trace2 = go.Scatter(x=df['Close'].index, y=df['Close'], name = '종가')
# pyo.iplot([trace1,trace2])
layout = go.Layout(
    title="주가(종가) 그래프",
    xaxis=dict(
        title="기간"
    ),
    yaxis=dict(
        title="주가(원)"
    ) 
)
pyo.iplot({'data': [trace1,trace2], 'layout': layout})

#----------------------------------------------------
# 대시보드 앱 시작(아래)
#----------------------------------------------------
from datetime import date # 날짜 계산 기술 참조 https://jsikim1.tistory.com/143
from dateutil.relativedelta import relativedelta
from dash import Dash, Input, Output, html, dcc #dcc(dash_core_components)
import plotly.express as px
import dash_bootstrap_components as dbc # 부트 스트랩 디자인 사용
from dash.dash_table.Format import Format, Group # , type:'numeric', format:Format(group=True, groups=[4])

# fig = px.line(df['Close'], title="주가(종가) 그래프")

app = Dash(external_stylesheets=[dbc.themes.BOOTSTRAP]) # __name__ 사용하지 않는 대신에 하단에 @callback 처럼 사용
app.title = "주식 정보를 가져오는 웹 앱"

col_names = ["sepal_length", "sepal_width", "petal_length", "petal_width"]
app = Dash(__name__) #Dash클래스에 프로그램 이름 내장변수로 app 객체 생성.파이썬 파일이 메인 프로그램으로 사용될 때는 __main__ 이 기본값
# app layout: html과 dcc 모듈을 이용
app.title = "주식 정보를 가져오는 웹 앱"
app.layout = html.Div(children=[
    # Dash HTML Components module로 HTML 작성 
    html.H1(children='주식 정보를 가져오는 웹 앱'),
    html.Div([
        '검색시작일:',
        dcc.DatePickerSingle(
            id='start-date-picker',
            min_date_allowed=date(2000, 1, 1),
            max_date_allowed=date(2050, 12, 31),
            initial_visible_month=date.today() - relativedelta(months=1),
            display_format='YYYY-MM-DD',
            date=str(date.today() - relativedelta(months=1))
        ),
    ], style={'display':'inline-block'}),
    html.Div([
        '검색종료일:',
        dcc.DatePickerSingle(
            id='end-date-picker',
            min_date_allowed=date(2000, 1, 1),
            max_date_allowed=date(2050, 12, 31),
            initial_visible_month=date.today(),
            display_format='YYYY-MM-DD',
            date=str(date.today())
        ),
    ], style={'display':'inline-block'}),
    html.Div(id='output-container-date-picker-single'),
    html.Br(),
    # dash.core.components(dcc)의 그래프컴포넌트로 plotly 그래프 렌더링
    html.Div([
        dcc.Graph(
            id='update_graph',
#             figure=fig
        )
    ]),
    html.Br(),
    html.Div([
        '검색시작일:',
        dcc.DatePickerSingle(
            id='start-date-picker2',
            min_date_allowed=date(2000, 1, 1),
            max_date_allowed=date(2050, 12, 31),
            initial_visible_month=date.today() - relativedelta(months=1),
            display_format='YYYY-MM-DD',
            date=str(date.today() - relativedelta(months=1))
        ),
    ], style={'display':'inline-block'}),
    html.Div([
        '검색종료일:',
        dcc.DatePickerSingle(
            id='end-date-picker2',
            min_date_allowed=date(2000, 1, 1),
            max_date_allowed=date(2050, 12, 31),
            initial_visible_month=date.today(),
            display_format='YYYY-MM-DD',
            date=str(date.today())
        ),
    ], style={'display':'inline-block'}),
    html.Div([
        dcc.Graph(
            id='update_graph2',
#             figure=fig
        )
    ]),
])
# 그래프 1개 출력(아래)
@app.callback(
    Output(component_id='update_graph', component_property='figure'),
    [Input('start-date-picker', 'date'),Input('end-date-picker', 'date')]
     )
def update_output(start_date_value, end_date_value):
    if start_date_value is not None:
        start_date_object = date.fromisoformat(start_date_value)
        end_date_object = date.fromisoformat(end_date_value)
        start_date = start_date_object.strftime('%Y-%m-%d')
        end_date = end_date_object.strftime('%Y-%m-%d')
        # 여기에 figure 객체 생성
        df = yf.download(ticker_symbol, start=start_date, end=end_date)
        fig = px.line(df['Close'], title="주가(종가) 그래프")
        fig.update_layout(xaxis_title="기간", yaxis_title="주가(원)",title_text="주가(종가)그래프"+start_date+" ~ "+end_date, title_font_size=20)
        return (fig)
# 그래프 2개 출력(아래)
@app.callback(
    Output(component_id='update_graph2', component_property='figure'),
#     Output('output-container-date-picker-single', 'children'),
    [Input('start-date-picker2', 'date'),Input('end-date-picker2', 'date')]
     )
def update_output(start_date_value, end_date_value):
    if start_date_value is not None:
        start_date_object = date.fromisoformat(start_date_value)
        end_date_object = date.fromisoformat(end_date_value)
        start_date = start_date_object.strftime('%Y-%m-%d')
        end_date = end_date_object.strftime('%Y-%m-%d')
        # 여기에 figure 객체 생성
        df = yf.download(ticker_symbol, start=start_date, end=end_date)
        trace1 = go.Scatter(x=df['Open'].index, y=df['Open'], name = '시작가')
        trace2 = go.Scatter(x=df['Close'].index, y=df['Close'], name = '종가')
        fig = go.Figure(data=[trace1,trace2])
        fig.update_layout(xaxis_title="기간", yaxis_title="주가(원)",title_text="주가(시작가,종가)그래프"+start_date+" ~ "+end_date, title_font_size=20)
        return (fig)
#         date_string = start_date_object.strftime('%Y-%m-%d') +" | "+ end_date_object.strftime('%Y-%m-%d')
#         return date_string

if __name__ == '__main__': #파이썬 파일이 메인 프로그램으로 사용될 때와 모듈로 사용될 때를 구분하기 위한 용도
    app.run_server(debug=False, host='0.0.0.0', port=8888)
    
#     # 3) 파일 다운로드
#     st.markdown("**주가 데이터 파일 다운로드**")
#     # DataFrame 데이터를 CSV 데이터(csv_data)로 변환
#     csv_data = df.to_csv()  # DataFrame 데이터를 CSV 데이터로 변환해 반환

#     # DataFrame 데이터를 엑셀 데이터(excel_data)로 변환
#     excel_data = BytesIO()  # 메모리 버퍼에 바이너리 객체 생성
#     df.to_excel(excel_data) # DataFrame 데이터를 엑셀 형식으로 버퍼에 쓰기

#     columns = st.columns(2) # 2개의 세로단으로 구성
#     with columns[0]:
#         st.download_button("CSV 파일 다운로드", csv_data, file_name='stock_data.csv')
#     with columns[1]:
#         st.download_button("엑셀 파일 다운로드", excel_data, file_name='stock_data.xlsx')

### 9.3.2 환율 데이터 대시보드

[9장: 473페이지]

In [None]:
%%writefile C:\myPyScraping\code\ch09\exchange_rate_app.py
# 환율 데이터를 가져오는 웹 앱

import streamlit as st
import pandas as pd
import datetime
import time
import matplotlib.pyplot as plt
import matplotlib
from io import BytesIO

# -----------------------------------------------------------------------------
# 날짜별 환율 데이터를 반환하는 함수
# - 입력 인수: currency_code(통화코드), last_page_num(페이지 수)
# - 반환: 환율 데이터
# -----------------------------------------------------------------------------
def get_exchange_rate_data(currency_code, last_page_num):
    base_url = "https://finance.naver.com/marketindex/exchangeDailyQuote.nhn"
    df = pd.DataFrame()
    
    for page_num in range(1, last_page_num+1):
        url = f"{base_url}?marketindexCd={currency_code}&page={page_num}"
        dfs = pd.read_html(url, header=1)
        
        # 통화 코드가 잘못 지정됐거나 마지막 페이지의 경우 for 문을 빠져나옴
        if dfs[0].empty:
            if (page_num==1):
                print(f"통화 코드({currency_code})가 잘못 지정됐습니다.")
            else:
                print(f"{page_num}가 마지막 페이지입니다.")
            break
            
        # page별로 가져온 DataFrame 데이터 연결
        df = pd.concat([df, dfs[0]], ignore_index=True)
        time.sleep(0.1) # 0.1초간 멈춤
        
    return df
# -----------------------------------------------------------------------------
  
st.title("환율 정보를 가져오는 웹 앱")

# 사이드바의 폭을 조절. {width:250px;}로 지정하면 폭을 250픽셀로 지정
st.markdown(
    """
    <style>
    [data-testid="stSidebar"][aria-expanded="true"] > div:first-child{width:250px;}
    </style>
    """, unsafe_allow_html=True
)

currency_name_symbols = {"미국 달러":"USD", "유럽연합 유로":"EUR",
                         "일본 엔(100)":"JPY", "중국 위안":"CNY"}
currency_name = st.sidebar.selectbox('통화 선택', currency_name_symbols.keys())

clicked = st.sidebar.button("환율 데이터 가져오기")

if(clicked==True):

    currency_symbol = currency_name_symbols[currency_name] # 환율 심볼 선택
    currency_code = f"FX_{currency_symbol}KRW"

    last_page_num = 20 # 네이버 금융에서 가져올 최대 페이지 번호 지정
    
    # 지정한 환율 코드를 이용해 환율 데이터 가져오기
    df_exchange_rate = get_exchange_rate_data(currency_code, last_page_num)
    
    # 원하는 열만 선택
    df_exchange_rate = df_exchange_rate[['날짜', '매매기준율','사실 때',
                                         '파실 때', '보내실 때', '받으실 때']]
    
    # 최신 데이터와 과거 데이터의 순서를 바꿔 df_exchange_rate2에 할당
    df_exchange_rate2 = df_exchange_rate[::-1].reset_index(drop=True)

    # df_exchange_rate2의 index를 날짜 열의 데이터로 변경
    df_exchange_rate2 = df_exchange_rate2.set_index('날짜')

    # df_exchange_rate2의 index를 datetime 형식으로 변환
    df_exchange_rate2.index = pd.to_datetime(df_exchange_rate2.index,
                                             format='%Y-%m-%d')

    # 1) 환율 데이터 표시
    st.subheader(f"[{currency_name}] 환율 데이터")
    st.dataframe(df_exchange_rate.head())  # 환율 데이터 표시(앞의 일부만 표시)
    
    # 2) 차트 그리기
    # matplotlib을 이용한 그래프에 한글을 표시하기 위한 설정
    matplotlib.rcParams['font.family'] = 'Malgun Gothic'
    matplotlib.rcParams['axes.unicode_minus'] = False
    
    # 선 그래프 그리기 (df_exchange_rate2 이용)
    ax = df_exchange_rate2['매매기준율'].plot(grid=True, figsize=(15, 5))
    ax.set_title("환율(매매기준율) 그래프", fontsize=30) # 그래프 제목을 지정
    ax.set_xlabel("기간", fontsize=20)                   # x축 라벨을 지정
    ax.set_ylabel(f"원화/{currency_name}", fontsize=20)  # y축 라벨을 지정
    plt.xticks(fontsize=15)             # X축 눈금값의 폰트 크기 지정
    plt.yticks(fontsize=15)             # Y축 눈금값의 폰트 크기 지정
    fig = ax.get_figure()               # fig 객체 가져오기
    st.pyplot(fig)                      # 스트림릿 웹 앱에 그래프 그리기
    
    # 3) 파일 다운로드
    st.markdown("**환율 데이터 파일 다운로드**")
    # DataFrame 데이터를 CSV 데이터(csv_data)로 변환
    csv_data = df_exchange_rate.to_csv()

    # DataFrame 데이터를 엑셀 데이터(excel_data)로 변환
    excel_data = BytesIO() # 메모리 버퍼에 바이너리 객체 생성
    df_exchange_rate.to_excel(excel_data) # 엑셀 형식으로 버퍼에 쓰기

    columns = st.columns(2) # 2개의 세로단으로 구성
    with columns[0]:
        st.download_button("CSV 파일 다운로드", csv_data,
                           file_name='exchange_rate_data.csv')
    with columns[1]:
        st.download_button("엑셀 파일 다운로드", excel_data,
                           file_name='exchange_rate_data.xlsx')

### 9.3.3 부동산 데이터 대시보드

[9장: 478페이지]

In [None]:
%%writefile C:\myPyScraping\code\ch09\land_info_app.py
# 부동산 데이터를 가져오는 웹 앱

import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib

# 원본 DataFrame의 제목 열에 있는 문자열을 분리해
# 전국, 서울, 수도권의 매매가 변화율 열이 있는 DataFrame 반환하는 함수
#----------------------------------------------------------------------------------
def split_title_to_rates(df_org):
    df_new = df_org.copy()

    df_temp = df_new['제목'].str.replace('%', '') # 제목 문자열에서 % 제거
    df_temp = df_temp.str.replace('보합', '0')    # 제목 문자열에서 보합을 0으로 바꿈
    df_temp = df_temp.str.replace('보합세', '0')  # 제목 문자열에서 보합세를 0으로 바꿈
    
    regions = ['전국', '서울', '수도권']
    for region in regions:
        df_temp = df_temp.str.replace(region, '') # 문자열에서 전국, 서울, 수도권 제거

    df_temp = df_temp.str.split(']', expand=True) # ]를 기준으로 열 분리
    df_temp = df_temp[1].str.split(',', expand=True) # ,를 기준으로 열 분리
    
    df_temp = df_temp.astype(float)
    
    df_new[regions] = df_temp # 전국, 서울, 수도권 순서대로 DataFrame 데이터에 할당

    return df_new[['등록일'] + regions + ['번호']] # DataFrame에서 필요한 열만 반환
#----------------------------------------------------------------------------------

st.title("부동산 정보를 가져오는 웹 앱")

# 사이드바의 폭을 조절. {width:250px;} 으로 지정하면 폭을 250픽셀로 지정함
st.markdown(
    """
    <style>
    [data-testid="stSidebar"][aria-expanded="true"] > div:first-child{width:250px;}
    </style>
    """, unsafe_allow_html=True
)

# 선택을 위한 체크박스를 생성
checked_1 = st.sidebar.checkbox('전국')
checked_2 = st.sidebar.checkbox('서울')
checked_3 = st.sidebar.checkbox('수도권')

clicked = st.sidebar.button("부동산 데이터 가져오기") # 버튼 생성
      
if(clicked==True):
    st.subheader("아파트의 매매가 변화율 데이터")
    
    base_url = "https://land.naver.com/news/trendReport.naver"

    df_rates = pd.DataFrame() # 전체 데이터가 담길 DataFrame 데이터
    last_page_num = 2 # 가져올 데이터의 마지막 페이지

    for page_num in range(1, last_page_num+1):

        url = f"{base_url}?page={page_num}"
        dfs = pd.read_html(url)

        df_page = dfs[0] # 리스트의 첫 번째 항목에 동향 보고서 제목 데이터가 있음
        df_rate = split_title_to_rates(df_page)

        # 세로 방향으로 연결 (기존 index를 무시)
        df_rates = pd.concat([df_rates, df_rate], ignore_index=True)

    # 최신 데이터와 과거 데이터의 순서를 바꿈. index도 초기화함
    df_rates_for_chart = df_rates[::-1].reset_index(drop=True)
    
    selected_regions = []
    
    if(checked_1==True):
        selected_regions.append("전국")
    if(checked_2==True):
        selected_regions.append("서울")
    if(checked_3==True):
        selected_regions.append("수도권")

    if(selected_regions == []):
        st.subheader("지역을 선택하세요.")
    else:
        # 1) 매매가 변화율 표시. 환율 데이터를 앞의 일부만 표시
        st.dataframe(df_rates[['등록일']+selected_regions].head())
    
        # 2) 차트 그리기
        # matplotlib을 이용한 그래프에 한글을 표시하기 위한 설정
        matplotlib.rcParams['font.family'] = 'Malgun Gothic'
        matplotlib.rcParams['axes.unicode_minus'] = False

        # 선 그래프 그리기 (df_exchange_rate2 이용)
        ax = df_rates_for_chart.plot(x='등록일', y=selected_regions, figsize=(15, 6),
                                     style = '-o', grid=True) # 그래프 그리기
        
        ax.set_title("아파트 매매가 변화율", fontsize=30) # 그래프 제목을 지정
        ax.set_xlabel("날짜", fontsize=20)                # x축 라벨을 지정
        ax.set_ylabel("변화율(%)", fontsize=20)           # y축 라벨을 지정
        plt.xticks(fontsize=15)             # X축 눈금값의 폰트 크기 지정
        plt.yticks(fontsize=15)             # Y축 눈금값의 폰트 크기 지정
        fig = ax.get_figure()               # fig 객체 가져오기
        st.pyplot(fig)                      # 스트림릿 웹 앱에 그래프 그리기

### 9.3.4 구글 뉴스에서 기사 검색 

[9장: 481페이지]

In [None]:
%%writefile C:\myPyScraping\code\ch09\gnews_search_app.py
# 구글 뉴스에서 기사를 검색하는 웹 앱

from datetime import datetime, timedelta
import streamlit as st
import pandas as pd
import feedparser

# RSS 피드 제공 일시를 한국 날짜와 시간으로 변경하는 함수
def get_local_datetime(rss_datetime):    
    # 전체 값 중에서 날짜와 시간만 문자열로 추출 
    date_time_str = ' '.join(rss_datetime.split()[1:5])
    
    # 문자열의 각 자리에 의미를 부여해 datetime 객체로 변경 
    date_time_GMT = datetime.strptime(date_time_str, '%d %b %Y %H:%M:%S') 
    
    # GMT에 9시간을 더해 한국 시간대로 변경
    date_time_KST = date_time_GMT + timedelta(hours=9) 
    
    return date_time_KST # 변경된 시간대의 날짜와 시각 반환 
#---------------------------------------------------------

# 구글 뉴스 RSS 피드에서 검색 결과를 가져와 DataFrame 데이터로 반환하는 함수 
def get_gnews(query):
    # RSS 서비스 주소
    rss_url = f'https://news.google.com/rss/search?q={query}&&hl=ko&gl=KR&ceid=KR:ko' 
    rss_news = feedparser.parse(rss_url) # RSS 형식의 데이터를 파싱
    
    title = rss_news['feed']['title']
    updated = rss_news['feed']['updated']
    updated_KST = get_local_datetime(updated) # 한국 날짜와 시각으로 변경   
    
    df_gnews = pd.DataFrame(rss_news.entries) # 구글 뉴스 아이템을 판다스 DataFrame으로 변환

    selected_columns = ['title', 'published', 'link'] # 관심있는 열만 선택
    df_gnews2 = df_gnews[selected_columns].copy()     # 선택한 열만 다른 DataFrame으로 복사

    # published 열의 작성 일시를 한국 시간대로 변경
    df_gnews2['published'] = df_gnews2['published'].apply(get_local_datetime) 

    df_gnews2.columns = ['제목', '제공 일시', '링크'] # 열 이름 변경
    
    return title, updated_KST, df_gnews2
#---------------------------------------------------------

# 구글 뉴스 검색 결과를 Table로 정리한 HTML 코드를 반환하는 함수
def create_gnews_html_code(title, updated_KST, df):
    # DataFrame 데이터를 HTML 코드로 변환 (justify='center' 옵션을 이용해 열 제목을 중간에 배치)
    html_table = df.to_html(justify='center', escape=False, render_links=True) 

    # HTML 기본 구조를 갖는 HTML 코드
    html_code = '''
    <!DOCTYPE html>
    <html>
      <head>
        <title>구글 뉴스 검색</title>
      </head>
      <body>
        <h1>{0}</h1>
        <h3> *검색 날짜 및 시각: {1}</h3>
        {2}
      </body>
    </html>    
    '''.format(title, updated_KST, html_table)
    
    return html_code
# -----------------------------------

st.title("구글 뉴스 기사를 검색하는 웹 앱")

query = st.text_input('검색어 입력', value="메타버스")

# 구글 뉴스 검색 결과 가져오기
[title_gnews, updated_KST_gnews, df_gnews] = get_gnews(query)

# 웹 앱에 표시할 HTML 테이블 생성 (DataFrame 데이터 중 처음 일부만 HTML 테이블로 생성)
html_table = df_gnews.head().to_html(justify='center', escape=False, render_links=True)

# HTML 파일 다운로드를 위한 HTML code 생성
gnews_html_code = create_gnews_html_code(title_gnews, updated_KST_gnews, df_gnews)

st.markdown("**기사 검색 결과**")
st.write(html_table, unsafe_allow_html=True) # HTML 테이블 표시
st.markdown("") # 빈 줄 생성

columns = st.columns(3) # 3개의 세로단으로 구성 (2개의 세로단에만 필요한 내용 표시)
with columns[0]:        
    st.markdown("**HTML 파일 다운로드**")
with columns[1]:
    st.download_button("다운로드", gnews_html_code, file_name='gnews_search_results.html')

### 9.3.5 멀티페이지 웹 앱

[9장: 487페이지]

In [None]:
%%writefile C:\myPyScraping\code\ch09\my_app\Multipage_Home.py
# 멀티페이지 웹 앱

import streamlit as st

st.title("경제 정보를 가져오는 웹 앱")

st.subheader("사이드바에서 페이지를 선택하세요.")
st.subheader("- Multipage Home: 경제 정보 홈 페이지")
st.subheader("- Stock Info: 주식 정보 페이지")
st.subheader("- Exchange Rate: 환율 정보 페이지")
st.subheader("- Land Info: 부동산 정보 페이지")

# 사이드바의 폭을 조절. {width:250px;} 으로 지정하면 폭을 250픽셀로 지정함
st.markdown(
    """
    <style>
    [data-testid="stSidebar"][aria-expanded="true"] > div:first-child{width:250px;}
    </style>
    """, unsafe_allow_html=True
)

### 9.3.6 스트림릿 클라우드에 웹 앱 배포

## 9.4 정리