In [14]:
import pandas as pd
import plotly.offline as offline 
import plotly.graph_objs as go
from plotly import subplots

# 일자(n,m,t)에 따른 Stochastic(KDJ)의 값을 구하기 위해 함수형태로 만듬 
def get_stochastic(df, n=15, m=5, t=3):
    
    # 입력받은 값이 dataframe이라는 것을 정의해줌
    df = pd.DataFrame(df)
    
    # n일중 최고가
    ndays_high = df.high.rolling(window=n, min_periods=1).max()
    # n일중 최저가
    ndays_low = df.low.rolling(window=n, min_periods=1).min()
 
    # Fast%K 계산
    kdj_k = ((df.close - ndays_low) / (ndays_high - ndays_low))*100
    # Fast%D (=Slow%K) 계산
    kdj_d = kdj_k.ewm(span=m).mean()
    # Slow%D 계산
    kdj_j = kdj_d.ewm(span=t).mean()
 
    # dataframe에 컬럼 추가
    df = df.assign(kdj_k=kdj_k, kdj_d=kdj_d, kdj_j=kdj_j).dropna()
    
    return df

In [33]:

 
code_df = pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download&searchType=13', header=0)[0]
 
# 종목코드가 6자리이기 때문에 6자리를 맞춰주기 위해 설정해줌
code_df.종목코드 = code_df.종목코드.map('{:06d}'.format)
 
# 우리가 필요한 것은 회사명과 종목코드이기 때문에 필요없는 column들은 제외해준다.
code_df = code_df[['회사명', '종목코드']]
 
# 한글로된 컬럼명을 영어로 바꿔준다.
code_df = code_df.rename(columns={'회사명': 'name', '종목코드': 'code'})
# code_df.head()

# 종목 이름을 입력하면 종목에 해당하는 코드를 불러와
# 네이버 금융(http://finance.naver.com)에 넣어줌
def get_url(item_name, code_df):

    code = code_df.query("name=='{}'".format(item_name))['code'].to_string(index=False).strip()
    url = 'http://finance.naver.com/item/sise_day.nhn?code={code}'.format(code=code)
    
    print("요청 URL = {}".format(url))
    return url

# for i in code_df.index:
for i in range(10):
    code = code_df.iloc[i]['code'].strip()
    url = 'http://finance.naver.com/item/sise_day.nhn?code={code}'.format(code=code)
    print("요청 URL = {}".format(url), code_df.iloc[i]['name'].strip())
    df = pd.DataFrame()
    
    for page in range(1, 11):
        pg_url = '{url}&page={page}'.format(url=url, page=page)
        df = df.append(pd.read_html(pg_url, header=0)[0], ignore_index=True)
    
    # df.dropna()를 이용해 결측값 있는 행 제거
    df = df.dropna()
    
    # 한글로 된 컬럼명을 영어로 바꿔줌
    df = df.rename(columns= {'날짜': 'date', '종가': 'close', '전일비': 'diff', 
                         '시가': 'open', '고가': 'high', '저가': 'low', '거래량': 'volume'})
    
    # 데이터의 타입을 int형으로 바꿔줌
    df[['close', 'diff', 'open', 'high', 'low', 'volume']] = \
    df[['close', 'diff', 'open', 'high', 'low', 'volume']].astype(int)
 
    # 컬럼명 'date'의 타입을 date로 바꿔줌
    df['date'] = pd.to_datetime(df['date'])
 
    # 일자(date)를 기준으로 오름차순 정렬
    df = df.sort_values(by=['date'], ascending=True)
    df = get_stochastic(df)
    print(df.loc[1:1, ['date', 'volume', 'kdj_k']])

요청 URL = http://finance.naver.com/item/sise_day.nhn?code=155660 DSR
        date  volume  kdj_k
1 2020-02-24  124615    0.0
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=001250 GS글로벌
        date  volume    kdj_k
1 2020-02-24  496645  4.83871
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=082740 HSD엔진
        date  volume     kdj_k
1 2020-02-24  306469  4.487179
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=011070 LG이노텍
        date  volume     kdj_k
1 2020-02-24  163537  2.857143
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=010120 LS산전
        date  volume     kdj_k
1 2020-02-24  103685  4.109589
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=010060 OCI
        date  volume  kdj_k
1 2020-02-24  250782    0.0
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=100840 S&TC
        date  volume      kdj_k
1 2020-02-24   22506  16.666667
요청 URL = http://finance.naver.com/item/sise_day.nhn?code=064960 S&T모티브
        date  volume   