## Financial Statements

재무 데이터는 기업의 경영 성과와 재무 건전성을 평가하기 위해 공시되는 자료로, 주로 재무제표에서 도출된다. 가장 기본적인 형태는 손익계산서(Income Statement), 재무상태표(Balance Sheet), 현금흐름표(Cash Flow Statement)이며, 각각 기업의 수익성과 비용 구조, 자산과 부채의 구성, 그리고 실제 현금 유입과 유출을 보여준다. 이를 통해 투자자는 기업의 이익 창출 능력, 부채 비율, 유동성 수준, 현금창출력 등을 종합적으로 파악할 수 있다. 또한 주당순이익(EPS), 자기자본이익률(ROE), 부채비율(Debt Ratio) 등 재무 비율 분석 역시 재무 데이터의 중요한 활용 형태이다.

그러나 재무 데이터에는 몇 가지 내재적 한계가 존재한다. 

- 첫째, 재무 데이터는 분기 혹은 연 단위로 공시되기 때문에 시의성이 부족하며, 빠르게 변하는 시장 상황을 즉각적으로 반영하지 못한다. 
- 둘째, 회계 기준과 기업의 재량적 판단에 따라 수치가 달라질 수 있어 비교 가능성과 신뢰성이 훼손될 수 있다. 
- 셋째, 재무 데이터는 과거 실적에 기반하기 때문에 미래의 성장 가능성이나 돌발적인 리스크를 충분히 설명하지 못한다. 

따라서 재무 데이터는 기업 분석의 출발점이자 기초 자료로 활용되지만, 단독으로는 한계가 있으며 시장 데이터, 산업 동향, 대체 데이터와 결합해 해석하는 것이 필요하다. 그럼에도 불구하고, 여전히 금융 데이터의 기본적인 형태로 확인하면 좋다.


### 1. Financial Statement Data Source

금융/경제 데이터는 대부분 유료로 구입해 사용해야 한다. 대표적으로 Bloomberg, Reuters가 있으며, 국내에서는 Data Guide, 한국경제 등이 데이터 밴더로 서비스를 운영중이다. 한편, 학습 및 연구 등 비영리적인 목적으로 사용가능한 데이터 밴더가 있는데, 이는 다음과 같다.

| 데이터 소스                         | 커버리지          | 제공 범위                                                | 특징 및 한계                                                                 |
|------------------------------------|-------------------|-------------------------------------------------------|----------------------------------------------------------------------------|
| **DART (전자공시시스템, 한국)**        | 한국 상장기업       | 사업보고서, 분기·반기보고서, 재무제표(XBRL), 공시자료         | 무료, 오픈DART API 제공, 공시 시차 존재, 원시 데이터 가공 필요                 |
| **EDGAR (SEC, 미국)**               | 미국 상장기업       | 10-K(연차보고서), 10-Q(분기보고서), 8-K(주요 공시), XBRL | 무료, 방대한 자료, API 지원, 원시 데이터 구조화 과정 필요                      |
| **Yahoo Finance**                   | 글로벌 (미국/한국 포함) | 기본 재무제표(손익계산서, 재무상태표, 현금흐름표), 시가총액 등  | 무료, 파이썬 라이브러리 `yfinance` 활용 가능, 데이터 품질 불안정                |
| **Google Finance**                  | 글로벌 (미국/한국 포함) | 주요 재무 지표(매출, 순익, 시총 등)                         | 무료, 웹 기반, API 공식 지원 없음, 제공 범위 단순                              |
| **FinanceDataReader (Python 라이브러리)** | 한국/미국/글로벌 혼합 | 주가 및 일부 재무 데이터 (Naver Finance, Yahoo 기반)       | 무료, 설치 및 사용 용이, 데이터 범위 제한                                     |
| **FRED (세인트루이스 연준)**           | 미국 + 글로벌 거시   | 거시경제 지표 (금리, GDP, 신용, 은행 재무 관련 지표 포함)    | 무료, 기업 개별 재무보다는 경제·금융 환경 데이터 중심                           |
| **OpenDART API (한국)**              | 한국 상장기업       | 재무제표(XBRL), 사업보고서 항목별 추출 가능                 | 무료, 회원가입 후 API Key 필요, 초당 호출 제한 존재                            |
| **SEC API (미국, EDGAR 기반)**        | 미국 상장기업       | 10-K/10-Q/XBRL 데이터 JSON 형태                          | 무료, EDGAR 데이터 활용, 구조화된 API 제공, 커버리지는 SEC 등록 기업 한정         |


#### 1.1. DART

한국의 상장기업 재무 데이터는 금융감독원이 운영하는 전자공시시스템(DART)을 통해 무료로 제공된다. OpenDART API는 기업의 사업보고서, 분기·반기보고서, 그리고 재무제표(XBRL 형식)를 손쉽게 수집할 수 있도록 설계되어 있으며, 회원가입을 통해 발급받은 API Key만 있으면 누구나 접근할 수 있다. 특히 삼성전자(005930)와 같은 특정 기업의 종목코드를 지정하고 보고서 유형(1분기, 반기, 3분기, 사업보고서)을 설정하면 해당 연도의 손익계산서, 재무상태표, 현금흐름표 데이터를 JSON 형태로 내려받을 수 있다. 이를 파이썬에서 `requests`와 `pandas` 라이브러리, 혹은 오픈소스 라이브러리인 `OpenDartReader`를 이용해 호출하고 DataFrame으로 변환하면, 학습자가 손쉽게 데이터를 가공·분석할 수 있다.  

```bash
pip install opendartreader
```

OpenDART API를 활용하면 DART 웹사이트에서 수동으로 보고서를 다운로드할 필요 없이 코드 한 줄로 구조화된 데이터를 얻을 수 있다는 장점이 있다. 다만, 공시 데이터는 공시 지연(latency)이 존재하며, XBRL 항목명을 정확히 이해해야 원하는 항목을 추출할 수 있다. 또한 API 호출에는 초당 요청 횟수 제한이 있기 때문에 대량의 기업 데이터를 수집할 경우 적절한 대기 시간을 두거나 데이터베이스에 순차적으로 적재하는 방식이 필요하다. 이러한 과정을 통해 한국 상장기업의 재무제표를 프로그래밍적으로 수집하고, 이를 바탕으로 재무 비율 계산, 기업 간 비교분석, 투자전략 수립 등의 실습을 체계적으로 진행할 수 있다.


In [11]:
import OpenDartReader

with open('../../config/dart_api.key') as file : 
    key = file.readline()

dart = OpenDartReader(key)

In [13]:
dart.list('005930')

Unnamed: 0,corp_code,corp_name,stock_code,corp_cls,report_nm,rcept_no,flr_nm,rcept_dt,rm
0,00126380,삼성전자,005930,Y,최대주주등소유주식변동신고서,20250905800573,삼성전자,20250905,유
1,00126380,삼성전자,005930,Y,주식등의대량보유상황보고서(일반),20250905000524,삼성물산,20250905,
2,00126380,삼성전자,005930,Y,대규모기업집단현황공시[분기별공시(대표회사용)],20250901000065,삼성전자,20250901,공
3,00126380,삼성전자,005930,Y,임원ㆍ주요주주특정증권등소유상황보고서,20250818000049,최병희,20250818,
4,00126380,삼성전자,005930,Y,지급수단별ㆍ지급기간별지급금액및분쟁조정기구에관한사항,20250814004256,삼성전자,20250814,공
...,...,...,...,...,...,...,...,...,...
6774,00126380,삼성전자,005930,Y,채무보증(담보제공포함),20000404000429,삼성전자,20000404,
6775,00126380,삼성전자,005930,Y,최대주주등을위한금전의대여,20000401000031,삼성전자,20000401,
6776,00126380,삼성전자,005930,Y,감사보고서 (1999.12),20000320000124,삼일회계법인,20000320,
6777,00126380,삼성전자,005930,Y,[기재정정]반기보고서 (1999.06),19990824000003,삼성전자,19990824,


#### 1.2 EDGAR

미국 상장기업의 재무 데이터는 SEC(미국 증권거래위원회)가 운영하는 EDGAR(Electronic Data Gathering, Analysis, and Retrieval) 시스템을 통해 무료로 제공된다. EDGAR에는 모든 상장기업이 의무적으로 제출하는 10-K(연차보고서), 10-Q(분기보고서), 8-K(주요 사건 공시) 등의 자료가 축적되어 있으며, 최근에는 XBRL(Extensible Business Reporting Language) 형식으로 구조화된 재무제표 데이터를 제공하고 있다. 이를 통해 **손익계산서, 재무상태표, 현금흐름표** 와 같은 핵심 정보를 기계적으로 수집하고 분석할 수 있다.  

EDGAR는 한국의 DART와 달리 API Key 발급 절차 없이 누구나 접근할 수 있지만, SEC는 이용자 식별을 위해 User-Agent 헤더에 애플리케이션 이름과 이메일 주소를 반드시 포함하도록 규정하고 있다. 또한 방대한 데이터가 JSON 형식으로 제공되기 때문에 파이썬의 `requests`와 `pandas`를 활용하면 손쉽게 DataFrame 형태로 변환할 수 있다. 다만, 데이터 항목명이 XBRL 표준을 따르기 때문에 원하는 항목을 정확히 지정해야 하고, 분기와 연간 보고서를 구분하기 위해 제출 문서 종류(10-K, 10-Q)를 필터링하는 과정이 필요하다. 이러한 절차를 거치면 EDGAR를 활용해 애플(AAPL)과 같은 글로벌 기업의 재무 데이터를 정량적으로 분석할 수 있다.

In [14]:
import requests
import pandas as pd
from datetime import datetime
from time import sleep

HEADERS = {
    "User-Agent": "Thomas Lee (junghun1013@icloud.com)"
} # 필수로 등록 필요

# AAPL CIK 
CIK = "0000320193" 

BASE = "https://data.sec.gov/api/xbrl/companyconcept"

In [None]:
def fetch_concept_df(cik: str, taxonomy: str, concept: str, unit: str = "USD") -> pd.DataFrame:
    """
    EDGAR companyconcept API에서 특정 XBRL 항목을 DataFrame으로 반환.
    """
    url = f"{BASE}/CIK{cik}/{taxonomy}/{concept}.json"
    r = requests.get(url, headers=HEADERS, timeout=30)
    r.raise_for_status()
    j = r.json()

    # 단위(unit)별 시계열 중 USD만 사용 
    vals = j["units"][unit]
    df = pd.DataFrame(vals)

    # end/val/form/fy/fp 등 컬럼 정리
    if "end" in df.columns:
        df["end"] = pd.to_datetime(df["end"])
    if "filed" in df.columns:
        df["filed"] = pd.to_datetime(df["filed"])

    df.rename(columns={"val": concept}, inplace=True)
    return df
