## FinanceDataReader 란?

* 한국 주식 가격, 미국주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리

* [FinanceDataReader 사용자 안내서 | FinanceData](https://financedata.github.io/posts/finance-data-reader-users-guide.html)
* https://pandas-datareader.readthedocs.io/en/latest/readers/index.html

## 설치

In [3]:
# 주석을 풀고 설치해 주세요. 주석을 푸는 방법은 아래 코드의 맨 앞에 있는 #을 지워주시면 됩니다.
# !pip install -U finance-datareader

Collecting finance-datareader
  Downloading https://files.pythonhosted.org/packages/ed/10/1f819839aae5d08e6cc7b29425d278c10104a18e0155282aa2ce552e3fa2/finance_datareader-0.9.10-py3-none-any.whl
Collecting requests-file
  Downloading https://files.pythonhosted.org/packages/77/86/cdb5e8eaed90796aa83a6d9f75cfbd37af553c47a291cd47bc410ef9bdb2/requests_file-1.5.1-py2.py3-none-any.whl
Installing collected packages: requests-file, finance-datareader
Successfully installed finance-datareader-0.9.10 requests-file-1.5.1


## 라이브러리 불러오기

In [4]:
import FinanceDataReader as fdr
# module의 version을 확인하고 싶을 때는 .__version__ 으로 확인합니다. 다른 module도 마찬가지 입니다.
fdr.__version__

'0.9.10'

In [5]:
# 데이터 분석을 위해 pandas 불러오기
import pandas as pd

In [6]:
# 도움말을 보고자 할때는 ? 를 사용하고 소스코드를 볼 때는 ??를 사용합니다.
# 주피터 노트북에서는 함수나 메소드의 괄호 안에서 shift + tab 키를 누르면 도움말을 볼 수 있습니다.

# fdr.StockListing??

In [7]:
# 한국거래소 상장종목 전체 가져오기
df_krx = fdr.StockListing('KRX')
df_krx.head()

Unnamed: 0,Symbol,Market,Name,Sector,Industry,ListingDate,SettleMonth,Representative,HomePage,Region
0,60310,KOSDAQ,3S,특수 목적용 기계 제조업,반도체 웨이퍼 캐리어,2002-04-23,03월,"박종익, 김세완 (각자 대표이사)",http://www.3sref.com,서울특별시
1,95570,KOSPI,AJ네트웍스,산업용 기계 및 장비 임대업,"렌탈(파렛트, OA장비, 건설장비)",2015-08-21,12월,이현우,http://www.ajnet.co.kr,서울특별시
2,6840,KOSPI,AK홀딩스,기타 금융업,지주사업,1999-08-11,12월,"채형석, 이석주(각자 대표이사)",http://www.aekyunggroup.co.kr,서울특별시
3,54620,KOSDAQ,APS홀딩스,기타 금융업,인터넷 트래픽 솔루션,2001-12-04,12월,정기로,http://www.apsholdings.co.kr,경기도
4,265520,KOSDAQ,AP시스템,특수 목적용 기계 제조업,디스플레이 제조 장비,2017-04-07,12월,김영주,http://www.apsystems.co.kr,경기도


In [8]:
# 행과 열의 크기를 봅니다.(행, 열) 순
df_krx.shape

(2594, 10)

In [9]:
# 전체 데이터프레임의 요약정보를 봅니다.
df_krx.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 2594 entries, 0 to 2593
Data columns (total 10 columns):
 #   Column          Non-Null Count  Dtype         
---  ------          --------------  -----         
 0   Symbol          2594 non-null   object        
 1   Market          2594 non-null   object        
 2   Name            2594 non-null   object        
 3   Sector          2393 non-null   object        
 4   Industry        2373 non-null   object        
 5   ListingDate     2393 non-null   datetime64[ns]
 6   SettleMonth     2393 non-null   object        
 7   Representative  2393 non-null   object        
 8   HomePage        2224 non-null   object        
 9   Region          2393 non-null   object        
dtypes: datetime64[ns](1), object(9)
memory usage: 222.9+ KB


In [10]:
# 기술통계 값을 요약합니다.
df_krx.describe()

  


Unnamed: 0,Symbol,Market,Name,Sector,Industry,ListingDate,SettleMonth,Representative,HomePage,Region
count,2594.0,2594,2594,2393,2373,2393,2393,2393,2224,2393
unique,2594.0,3,2594,156,2227,1761,8,2279,2202,21
top,267810.0,KOSDAQ,신한소재부품장비A1,특수 목적용 기계 제조업,기업인수합병,1996-07-03 00:00:00,12월,-,http://www.greencross.com,서울특별시
freq,1.0,1454,1,141,37,8,2334,4,2,961
first,,,,,,1956-03-03 00:00:00,,,,
last,,,,,,2020-11-26 00:00:00,,,,


## 하나의 범주형 변수에 대한 빈도수 구하기

* KONEX(Korea New Exchange) : https://terms.naver.com/entry.nhn?docId=1006691&cid=43667&categoryId=43667
    * 일정 요건을 갖춘 비상장 기업에 문호를 개방하기 위해 개설하는 유가증권시장, 코스닥시장에 이은 제3의 주식시장을 일컫는다. 코넥스시장은 우수한 기술력을 보유하고 있음에도 불구하고, 짧은 경력 등을 이유로 자금 조달에 어려움을 겪는 초기 중소기업과 벤처기업이 자금을 원활하게 조달할 수 있도록 하기 위해 설립된 자본시장으로, 2013년 7월 1일 개장되었다. [네이버 지식백과] 코넥스 (시사상식사전, pmg 지식엔진연구소)

In [11]:
# Market column에 어떤 데이터들이 있는지 확인합니다.
df_krx["Market"].value_counts()

KOSDAQ    1454
KOSPI      997
KONEX      143
Name: Market, dtype: int64

In [12]:
# Sector column에 어떤 데이터들 있는지 확인합니다.
# value_counts()는 기본으로 데이터가 많은 순으로 정렬이 되기때문에 head(10)을 통해 상위 10개의 데이터를 확인할 수 있습니다.
df_krx["Sector"].value_counts().head(10)

특수 목적용 기계 제조업     141
소프트웨어 개발 및 공급업    134
전자부품 제조업          122
자동차 신품 부품 제조업      96
의약품 제조업            92
기타 금융업             90
기타 화학제품 제조업        87
금융 지원 서비스업         74
통신 및 방송 장비 제조업     72
반도체 제조업            57
Name: Sector, dtype: int64

In [13]:
# Industry column 도 마찬가지로 확인할 수 있습니다.
df_krx["Industry"].value_counts().head(10)

기업인수합병        37
지주회사          18
지주사업           9
모바일게임          7
화장품            7
기업 인수 및 합병     6
기업인수 및 합병      5
벤처캐피탈          4
도급공사           3
증권업            3
Name: Industry, dtype: int64

In [14]:
# Region column도 value_counts()통해 지역별 상장회사의 빈도수를 봅니다.
df_krx["Region"].value_counts()

서울특별시      961
경기도        671
충청남도        91
경상남도        89
인천광역시       84
충청북도        83
부산광역시       76
경상북도        62
대구광역시       56
대전광역시       52
전라북도        28
강원도         27
울산광역시       25
광주광역시       24
전라남도        23
제주특별자치도     10
홍콩           9
세종특별자치시      9
케이맨 제도       5
미국           5
일본           3
Name: Region, dtype: int64

In [15]:
# 케이맨 제도에 있는 회사 찾기


## 파일로 저장하기

In [16]:
# to_csv로 Dataframe을 데이터 저장용 파일인 CSV 파일로 바꿀 수 있습니다.
df_krx.to_csv("krx.csv", index=False)

In [17]:
# CSV로 저장된 파일을 다시 DataFrame으로 읽어서 확인해 봅니다.
df_csv = pd.read_csv("krx.csv")
df_csv.head()

Unnamed: 0,Symbol,Market,Name,Sector,Industry,ListingDate,SettleMonth,Representative,HomePage,Region
0,60310,KOSDAQ,3S,특수 목적용 기계 제조업,반도체 웨이퍼 캐리어,2002-04-23,03월,"박종익, 김세완 (각자 대표이사)",http://www.3sref.com,서울특별시
1,95570,KOSPI,AJ네트웍스,산업용 기계 및 장비 임대업,"렌탈(파렛트, OA장비, 건설장비)",2015-08-21,12월,이현우,http://www.ajnet.co.kr,서울특별시
2,6840,KOSPI,AK홀딩스,기타 금융업,지주사업,1999-08-11,12월,"채형석, 이석주(각자 대표이사)",http://www.aekyunggroup.co.kr,서울특별시
3,54620,KOSDAQ,APS홀딩스,기타 금융업,인터넷 트래픽 솔루션,2001-12-04,12월,정기로,http://www.apsholdings.co.kr,경기도
4,265520,KOSDAQ,AP시스템,특수 목적용 기계 제조업,디스플레이 제조 장비,2017-04-07,12월,김영주,http://www.apsystems.co.kr,경기도
