# 종목 가져오기

패키지 가져오기 및 headers 선언

In [1]:
import requests # HTTP 호출 패키지
import json # json 형식의 파일 관련 패키지
import pandas as pd # 데이터 분석 및 연산 패키지

In [2]:
# headers 선언
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36',
    'X-Requested-With': 'XMLHttpRequest'
}

가져올 데이터 속성 값 p_data에 할당

In [3]:
# payload 데이터 설정 (데이터 속성)
p_data = {
    'bld': 'dbms/MDC/STAT/standard/MDCSTAT00601', # 화면번호
    'tboxindIdx_finder_equidx0_0': '코스피', # 지수명(한글)
    'indIdx': '1', # 지수코드1
    'indIdx2': '001', # 지수코드2
    'codeNmindIdx_finder_equidx0_0': '코스피', # 지수명(한글)
    'param1indIdx_finder_equidx0_0': '', # (blank)
    'trdDd': '20220503', # 조회 날짜
    'money': '3', # 금액 단위
    'csvxls_isNo': 'false' # (false)
}

* 데이터의 URL을 설정한 뒤, HTTP 서버에 데이터를 요청
* 요청한 데이터를 json 형식으로 변환해 html_json에 할당해줌

In [4]:
# 데이터의 url 설정
# header-general-Request URL 확인
url = 'http://data.krx.co.kr/comm/bldAttendant/getJsonData.cmd'

In [5]:
# HTTP 서버에 데이터 요청
# header-general-Request Method 확인
res = requests.post(url, headers=headers, data=p_data)

In [6]:
# 요청한 데이터를 json 형식으로 html_json에 할당
html_json = json.loads(res.content)

In [7]:
html_json

{'output': [{'ISU_SRT_CD': '005930',
   'ISU_ABBRV': '삼성전자',
   'TDD_CLSPRC': '67,500',
   'FLUC_TP_CD': '1',
   'STR_CMP_PRC': '200',
   'FLUC_RT': '0.30',
   'MKTCAP': '402,960,322,125,000'},
  {'ISU_SRT_CD': '373220',
   'ISU_ABBRV': 'LG에너지솔루션',
   'TDD_CLSPRC': '407,500',
   'FLUC_TP_CD': '2',
   'STR_CMP_PRC': '-1,000',
   'FLUC_RT': '-0.24',
   'MKTCAP': '95,355,000,000,000'},
  {'ISU_SRT_CD': '000660',
   'ISU_ABBRV': 'SK하이닉스',
   'TDD_CLSPRC': '110,000',
   'FLUC_TP_CD': '2',
   'STR_CMP_PRC': '-500',
   'FLUC_RT': '-0.45',
   'MKTCAP': '80,080,260,150,000'},
  {'ISU_SRT_CD': '207940',
   'ISU_ABBRV': '삼성바이오로직스',
   'TDD_CLSPRC': '832,000',
   'FLUC_TP_CD': '2',
   'STR_CMP_PRC': '-6,000',
   'FLUC_RT': '-0.72',
   'MKTCAP': '59,216,768,000,000'},
  {'ISU_SRT_CD': '035420',
   'ISU_ABBRV': 'NAVER',
   'TDD_CLSPRC': '282,000',
   'FLUC_TP_CD': '1',
   'STR_CMP_PRC': '1,000',
   'FLUC_RT': '0.36',
   'MKTCAP': '46,261,841,970,000'},
  {'ISU_SRT_CD': '006400',
   'ISU_ABBRV': '삼성S

* 할당된 json 파일을 df에 DataFrame 형식으로 할당하면 끝
* 비록 하루 동안의 구성 종목이지만 그 수는 매우 많음
* 따라서 상위 5개의 종목만 확인하고 제대로 데이터가 수집됐는지 검증하기

In [8]:
# json 형태의 결과값을 DataFrame 형식으로 df에 할당
df = pd.json_normalize(html_json['output'])
df.head()

Unnamed: 0,ISU_SRT_CD,ISU_ABBRV,TDD_CLSPRC,FLUC_TP_CD,STR_CMP_PRC,FLUC_RT,MKTCAP
0,5930,삼성전자,67500,1,200,0.3,402960322125000
1,373220,LG에너지솔루션,407500,2,-1000,-0.24,95355000000000
2,660,SK하이닉스,110000,2,-500,-0.45,80080260150000
3,207940,삼성바이오로직스,832000,2,-6000,-0.72,59216768000000
4,35420,NAVER,282000,1,1000,0.36,46261841970000


'날짜', '종목 코드', '종목 이름', '지수 종류'만 수집하도록 데이터를 변경

In [9]:
html_json = html_json['output']
html_json

[{'ISU_SRT_CD': '005930',
  'ISU_ABBRV': '삼성전자',
  'TDD_CLSPRC': '67,500',
  'FLUC_TP_CD': '1',
  'STR_CMP_PRC': '200',
  'FLUC_RT': '0.30',
  'MKTCAP': '402,960,322,125,000'},
 {'ISU_SRT_CD': '373220',
  'ISU_ABBRV': 'LG에너지솔루션',
  'TDD_CLSPRC': '407,500',
  'FLUC_TP_CD': '2',
  'STR_CMP_PRC': '-1,000',
  'FLUC_RT': '-0.24',
  'MKTCAP': '95,355,000,000,000'},
 {'ISU_SRT_CD': '000660',
  'ISU_ABBRV': 'SK하이닉스',
  'TDD_CLSPRC': '110,000',
  'FLUC_TP_CD': '2',
  'STR_CMP_PRC': '-500',
  'FLUC_RT': '-0.45',
  'MKTCAP': '80,080,260,150,000'},
 {'ISU_SRT_CD': '207940',
  'ISU_ABBRV': '삼성바이오로직스',
  'TDD_CLSPRC': '832,000',
  'FLUC_TP_CD': '2',
  'STR_CMP_PRC': '-6,000',
  'FLUC_RT': '-0.72',
  'MKTCAP': '59,216,768,000,000'},
 {'ISU_SRT_CD': '035420',
  'ISU_ABBRV': 'NAVER',
  'TDD_CLSPRC': '282,000',
  'FLUC_TP_CD': '1',
  'STR_CMP_PRC': '1,000',
  'FLUC_RT': '0.36',
  'MKTCAP': '46,261,841,970,000'},
 {'ISU_SRT_CD': '006400',
  'ISU_ABBRV': '삼성SDI',
  'TDD_CLSPRC': '624,000',
  'FLUC_TP_CD':

* 빈 DataFrame을 만들어주고 거기에 날짜, 종목 코드, 종목 이름 등을 추가해줌
* 모든 지수 구성 종목이 추가되었다면 그 지수가 KOSPI였음을 표시해줌
* 모든 과정을 마쳤다면 원하는대로 데이터가 구성됐는지 확인해줌

In [None]:
name_hs = pd.DataFrame()

if len(html_json) > 0:
    name_h = []