In [2]:
from tqdm import tqdm
import warnings
warnings.filterwarnings('ignore')

import numpy as np

import pandas as pd
# 모든 행을 출력하도록 설정
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

# 기본값으로 설정 (처음 5개와 마지막 5개 행만 출력)
pd.reset_option('display.max_rows')

# 출력 포맷 설정 (소수점 4자리까지)
pd.options.display.float_format = '{:.4f}'.format

import platform
import seaborn as sns

import matplotlib.pyplot as plt

# 운영 체제 확인
if platform.system() == 'Darwin':  # Mac
    print('apple gothic')
    font_name = 'AppleGothic'
elif platform.system() == 'Windows':  # Windows
    font_name = 'NanumGothic'
else:
    font_name = None

# 한글 폰트 설정
if font_name:
    plt.rcParams['font.family'] = font_name

# 마이너스 부호 설정
plt.rcParams['axes.unicode_minus'] = False

apple gothic


In [3]:
# 데이터 로드
df = pd.read_csv(
    '../data/3_이자보상배율계산.csv', 
    dtype = {'거래소코드' : 'object'}
)
df.columns

Index(['회사명', '거래소코드', '회계년도', '상장일', '상장폐지일', '결산년도', '상장년도', 'market', '자산',
       '유형자산', '유동자산', '재고자산', '자본', '매출액', '매출원가', '판매비와 관리비(물류원가 등 포함)',
       '기타(영업)비용', '당기제조원가', '급여', '퇴직급여', '상품매출원가', '제품매출원가', '감가상각비',
       '대손상각비', '개발비상각', '기타무형자산상각비', '외환차익1', '외화환산이익1', '외환차손1', '외화환산손실1',
       '외환차익2', '외화환산이익2', '외환차손2', '외환환산손실2', '무형자산', '건설중인자산', '토지', '자본잉여금',
       '이익잉여금(결손금)', '미처분이익잉여금(결손금)', '기타임의적립금', '(연차배당)', '(중간배당)',
       '배당금지급(-)', '단기차입금', '매입채무 및 기타유동채무', '매출채권 및 기타유동채권', '비유동자산', '사채',
       '유동금융자산', '유동부채', '유동성장기부채', '장기매입채무 및 기타비유동채무', '장기매출채권 및 기타비유동채권',
       '장기차입금', '현금및현금성자산', '영업활동으로 인한 현금흐름', '유형자산의 증가', '무형자산의 증가', '연구개발비',
       '종업원1인당 매출액(IFRS)(백만원)', '종업원1인당 부가가치(IFRS)(백만원)',
       '종업원1인당 인건비(IFRS)(백만원)', '종업원수(IFRS)', '판매비와 관리비', '비유동부채', '영업활동현금흐름',
       '부채', '유형자산의증가', '유형자산의감소', '(투자활동으로 인한 현금유출액)', '투자활동으로 인한 현금유입액',
       '자본금', '관계기업 등 지분관련 투자자산', '영업손익', '이자보상배율'],
      dtype='object')

In [4]:
# 시가총액 다운로드

from pykrx import stock

# 연말 시가총액, 상장주식수 가져오기
for i in tqdm(df.index):
    year = df.at[i, '결산년도']
    ticker = df.at[i, '거래소코드']
    
    cap = stock.get_market_cap(
        fromdate = f'{year}1201',
        todate = f'{year}1231',
        ticker = ticker,
        freq = 'y'
    )
    
    try:
        df.loc[i, ['시가총액', '상장주식수']] = cap[['시가총액', '상장주식수']].values
    except:
        continue

100%|█████████████████████████████████████| 22245/22245 [45:02<00:00,  8.23it/s]


In [5]:
df[['시가총액', '상장주식수']].isna().sum()

시가총액     4271
상장주식수    4271
dtype: int64

In [6]:
# 파일로 저장    
df.to_csv('../data/3_2_시가총액추가.csv', index=None)