# 증권데이터수집

In [46]:
%matplotlib inline
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

import warnings
warnings.filterwarnings('ignore')

from matplotlib import rc 

rc('font', family='NanumMyeongjo')
plt.rcParams['axes.unicode_minus'] = False

pd.set_option('display.max_columns', None)

## #1. 한국거래소 상장 법인 목록 

In [2]:
krx_list = pd.read_html('상장법인목록.xls')

In [7]:
krx_list # 리스트 

[             회사명    종목코드                   업종  \
 0           나우코스  257990          기타 화학제품 제조업   
 1          에이스캠퍼  322190    자동차 차체 및 트레일러 제조업   
 2       유안타제7호스팩  367460           금융 지원 서비스업   
 3            루트락  253610            기타 전문 도매업   
 4     ESR켄달스퀘어리츠  365550         부동산 임대 및 공급업   
 ...          ...     ...                  ...   
 2406      CJ대한통운     120            도로 화물 운송업   
 2407       메리츠화재      60                  보험업   
 2408          경방      50               종합 소매업   
 2409       유수홀딩스     700  회사 본부 및 경영 컨설팅 서비스업   
 2410    한진중공업홀딩스    3480    연료용 가스 제조 및 배관공급업   
 
                                                    주요제품         상장일  결산월  \
 0                                          화장품, 동물용의약외품  2020-12-30  12월   
 1                                                   캠핑카  2020-12-29  12월   
 2                                              금융지원 서비스  2020-12-28  12월   
 3                             인공슬관절, 척추 임플란트(의료기기 도·소매)  2020-12-24  12월   
 4           

In [13]:
krx_list[0]

Unnamed: 0,회사명,종목코드,업종,주요제품,상장일,결산월,대표자명,홈페이지,지역
0,나우코스,257990,기타 화학제품 제조업,"화장품, 동물용의약외품",2020-12-30,12월,노향선,http://www.nowcos.com/,세종특별자치시
1,에이스캠퍼,322190,자동차 차체 및 트레일러 제조업,캠핑카,2020-12-29,12월,김민성,http://acecamper.co.kr/,충청남도
2,유안타제7호스팩,367460,금융 지원 서비스업,금융지원 서비스,2020-12-28,12월,임율표,,서울특별시
3,루트락,253610,기타 전문 도매업,"인공슬관절, 척추 임플란트(의료기기 도·소매)",2020-12-24,12월,박종진,http://rootloc.com/,서울특별시
4,ESR켄달스퀘어리츠,365550,부동산 임대 및 공급업,부동산투자,2020-12-23,05월,박래익,http://www.esrks-reit.com,서울특별시
...,...,...,...,...,...,...,...,...,...
2406,CJ대한통운,120,도로 화물 운송업,"Contract Logistics, 포워딩, 항만하역, 해운, 택배국제특송, SCM...",1956-07-02,12월,박근희,http://www.cjlogistics.com,서울특별시
2407,메리츠화재,60,보험업,"손해보험(화재,해상,운송보험)",1956-07-02,12월,김용범,http://www.meritzfire.com,서울특별시
2408,경방,50,종합 소매업,"섬유류(면사,면혼방사,면직물,면혼방직물,화섬사,화섬직물) 제조,도매,수출입",1956-03-03,12월,"김준, 김담",http://www.kyungbang.co.kr,서울특별시
2409,유수홀딩스,700,회사 본부 및 경영 컨설팅 서비스업,지주사업,1956-03-03,12월,송영규,http://www.eusu-holdings.com,서울특별시


In [14]:
krx_list[0].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2411 entries, 0 to 2410
Data columns (total 9 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   회사명     2411 non-null   object
 1   종목코드    2411 non-null   int64 
 2   업종      2411 non-null   object
 3   주요제품    2392 non-null   object
 4   상장일     2411 non-null   object
 5   결산월     2411 non-null   object
 6   대표자명    2411 non-null   object
 7   홈페이지    2239 non-null   object
 8   지역      2411 non-null   object
dtypes: int64(1), object(8)
memory usage: 169.6+ KB


In [15]:
# 종목코드를 숫자로 인식하면서 6자리 중 0으로 시작된 앞자리가 사라짐 

krx_list[0].종목코드 = krx_list[0].종목코드.map('{:06d}'.format)
krx_list[0]

Unnamed: 0,회사명,종목코드,업종,주요제품,상장일,결산월,대표자명,홈페이지,지역
0,나우코스,257990,기타 화학제품 제조업,"화장품, 동물용의약외품",2020-12-30,12월,노향선,http://www.nowcos.com/,세종특별자치시
1,에이스캠퍼,322190,자동차 차체 및 트레일러 제조업,캠핑카,2020-12-29,12월,김민성,http://acecamper.co.kr/,충청남도
2,유안타제7호스팩,367460,금융 지원 서비스업,금융지원 서비스,2020-12-28,12월,임율표,,서울특별시
3,루트락,253610,기타 전문 도매업,"인공슬관절, 척추 임플란트(의료기기 도·소매)",2020-12-24,12월,박종진,http://rootloc.com/,서울특별시
4,ESR켄달스퀘어리츠,365550,부동산 임대 및 공급업,부동산투자,2020-12-23,05월,박래익,http://www.esrks-reit.com,서울특별시
...,...,...,...,...,...,...,...,...,...
2406,CJ대한통운,000120,도로 화물 운송업,"Contract Logistics, 포워딩, 항만하역, 해운, 택배국제특송, SCM...",1956-07-02,12월,박근희,http://www.cjlogistics.com,서울특별시
2407,메리츠화재,000060,보험업,"손해보험(화재,해상,운송보험)",1956-07-02,12월,김용범,http://www.meritzfire.com,서울특별시
2408,경방,000050,종합 소매업,"섬유류(면사,면혼방사,면직물,면혼방직물,화섬사,화섬직물) 제조,도매,수출입",1956-03-03,12월,"김준, 김담",http://www.kyungbang.co.kr,서울특별시
2409,유수홀딩스,000700,회사 본부 및 경영 컨설팅 서비스업,지주사업,1956-03-03,12월,송영규,http://www.eusu-holdings.com,서울특별시


## #2. [네이버 금융](https://finanace.naver.com)

In [47]:
from bs4 import BeautifulSoup as bs
from urllib.request import urlopen 

In [48]:
url = 'https://finance.naver.com/item/sise_day.nhn?code=068270&page=2' #셀트리온 ( 068270 )의 일별시세 첫번째 페이지 

In [51]:
with urlopen(url) as doc : 
    html = bs(doc, 'lxml')
    pgrr = html.find('td', class_ ='pgRR')
    
    #print(pgrr.a['href'])

In [None]:
html