### 네이버 증권 사이트에서 주가 데이터 수집

- 네이버 증권 사이트에서 주가 데이터 수집
- 수집할 데이터 : 일별 kospi, kosdaq 주가, 일별 환율(exchange rate) 데이터
- 데이터 수집 절차
    - 웹서비스 분석 : url
    - 서버에 데이터 요청 : request(url) > response : json(str)
    - 서버에서 받은 데이터 파싱(데이터 형태를 변경) : json(str) > list, dict > DataFrame

In [33]:
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import requests

##### 1. 웹 서비스 분석 : url

In [34]:
page, pagesize = 1, 20
url = f'https://m.stock.naver.com/api/index/KOSPI/price?pageSize={pagesize}&page={page}'
url

'https://m.stock.naver.com/api/index/KOSPI/price?pageSize=20&page=1'

<!-- ![네이버 코스피 일별 데이터](./img/naver_daily_stock.png) -->

<img src="./img/naver_daily_stock.png" height="30%" width="30%">

#### 2. 서버에 데이터 요청 : request(url) > response : json(str)
- response의 status code가 200이 나오는지 확인
- 403이나 500이 나오면 request가 잘못되거나 web server에서 수집이 안되도록 설정이 된것임
    - header 설정 또는 selenium 사용
- 200이 나오더라도 response 안에 있는 내용을 확인 > 확인하는 방법 : response.text

In [35]:
response = requests.get(url)
response

<Response [200]>

#### 3. 서버에서 받은 데이터 파싱(데이터 형태를 변경) : json(str) > list, dict > DataFrame

In [36]:
data = response.json()

In [49]:
kospi_df = pd.DataFrame(data)[['localTradedAt','closePrice']]
kospi_df

Unnamed: 0,localTradedAt,closePrice
0,2023-08-24,1322.3
1,2023-08-23,1335.0
2,2023-08-22,1339.5
3,2023-08-21,1341.0
4,2023-08-18,1343.0
5,2023-08-17,1339.5
6,2023-08-16,1339.5
7,2023-08-14,1335.5
8,2023-08-11,1332.0
9,2023-08-10,1315.0


#### 4. 함수로 만들기

1. 웹서비스 분석  : URL
2. request(URL) > response(JSON(str))
3. JSON(str) > list, dict > DataFrame

In [50]:
def stock_crawling(code='KOSPI', page=1, pagesize=60):
    
    url = f'https://m.stock.naver.com/api/index/{code}/price?pageSize={pagesize}&page={page}'
    response = requests.get(url)
    data = response.json()
    return pd.DataFrame(data)[['localTradedAt','closePrice']]

In [51]:
kospi_df = stock_crawling()
kospi_df.tail(2)

Unnamed: 0,localTradedAt,closePrice
58,2023-06-01,2569.17
59,2023-05-31,2577.12


In [52]:
kosdaq_df = stock_crawling(code='KOSDAQ', page=1, pagesize=60)
kosdaq_df.tail(2)

Unnamed: 0,localTradedAt,closePrice
58,2023-06-01,863.78
59,2023-05-31,856.94


### 원달러 환율 데이터 수집 : 실습

1. 웹서비스 분석  : URL
2. request(URL) > response(JSON(str))
3. JSON(str) > list, dict > DataFrame

In [57]:

page, pagesize = 1, 60

url = f'https://m.stock.naver.com/front-api/v1/marketIndex/prices?page={page}&category=exchange&reutersCode=FX_USDKRW&pageSize={pagesize}'

response = requests.get(url)
data = response.json()['result']

usd_df = pd.DataFrame(data)
usd_df = usd_df[['localTradedAt', 'closePrice']]

In [58]:
usd_df.tail(2)

Unnamed: 0,localTradedAt,closePrice
58,2023-06-01,1320.0
59,2023-05-31,1328.0


### 데이터 분석

코스피, 코스닥, 원달러 환율의 상관분석  
  
가설 : 코스피가 높으면 원달러 환율은 낮고, 코스피가 낮으면 원달러 환율은 높다.  
- 가설이 맞을 경우  
    - 환율이 낮으면 달러를 산다.  
    - 환율이 높으면 달러를 팔아 코스피를 산다.  
    

#### 전처리 및 시각화

- 전처리
    - DATE, KOSPI, KOSDAQ, USD 컬럼이 있는 데이터 프레임으로 변경 -> df

In [59]:
df = kospi_df.copy()
df.columns = ['date','kospi'] # kospi 데이터 

df['kosdaq'] = kosdaq_df['closePrice']
df['usd'] = usd_df['closePrice']

df.tail(2)

Unnamed: 0,date,kospi,kosdaq,usd
58,2023-06-01,2569.17,863.78,1320.0
59,2023-05-31,2577.12,856.94,1328.0
