In [1]:
import os
import pandas as pd

In [2]:
# 데이터 폴더 경로
input_folder = "financial_data"
output_folder = "merged_data"

In [3]:
# 저장할 폴더 생성
os.makedirs(output_folder, exist_ok=True)

# 파일 목록 가져오기
files = os.listdir(input_folder)

In [4]:
# 종목명과 연도를 추출하여 정리
data_dict = {}

In [5]:
for file in files:
    parts = file.split("_")
    if len(parts) < 4:
        continue  # 파일 이름 형식이 맞지 않으면 건너뜀
    
    stock_name = parts[0]
    report_type = parts[1] + "_" + parts[2]  # 예: "Balance_Sheet"
    year = parts[3].split(".")[0]  # 연도 추출
    
    key = (stock_name, year)
    if key not in data_dict:
        data_dict[key] = {}

    data_dict[key][report_type] = os.path.join(input_folder, file)


In [6]:
# 종목명과 연도별로 행 방향 병합 수행
for (stock_name, year), file_paths in data_dict.items():
    if "Balance_Sheet" in file_paths and "Cash_Flow" in file_paths and "Income_Statement" in file_paths:
        df_balance = pd.read_csv(file_paths["Balance_Sheet"])
        df_cash = pd.read_csv(file_paths["Cash_Flow"])
        df_income = pd.read_csv(file_paths["Income_Statement"])

        # 행 방향으로 합병 (index는 유지)
        merged_df = pd.concat([df_balance, df_cash, df_income], axis=0)

        # 저장 파일명
        output_file = os.path.join(output_folder, f"{stock_name}_Merged_{year}.csv")

        # CSV 저장
        merged_df.to_csv(output_file, index=False)
        print(f"저장 완료: {output_file}")
    else:
        print(f"파일 누락으로 병합 불가: {stock_name} {year}")

저장 완료: merged_data/AAPL_Merged_2023.csv
저장 완료: merged_data/CAT_Merged_2024.csv
저장 완료: merged_data/CVX_Merged_2023.csv
저장 완료: merged_data/JPM_Merged_2023.csv
저장 완료: merged_data/HD_Merged_2023.csv
저장 완료: merged_data/MCD_Merged_2023.csv
저장 완료: merged_data/TRV_Merged_2024.csv
저장 완료: merged_data/PG_Merged_2023.csv
저장 완료: merged_data/NKE_Merged_2024.csv
저장 완료: merged_data/CAT_Merged_2023.csv
저장 완료: merged_data/BA_Merged_2024.csv
저장 완료: merged_data/MMM_Merged_2024.csv
저장 완료: merged_data/DIS_Merged_2023.csv
저장 완료: merged_data/MSFT_Merged_2023.csv
저장 완료: merged_data/NVDA_Merged_2024.csv
저장 완료: merged_data/JNJ_Merged_2023.csv
저장 완료: merged_data/KO_Merged_2023.csv
저장 완료: merged_data/AMZN_Merged_2023.csv
저장 완료: merged_data/UNH_Merged_2023.csv
저장 완료: merged_data/BA_Merged_2023.csv
저장 완료: merged_data/NKE_Merged_2023.csv
저장 완료: merged_data/PG_Merged_2024.csv
저장 완료: merged_data/TRV_Merged_2023.csv
저장 완료: merged_data/HD_Merged_2024.csv
저장 완료: merged_data/JPM_Merged_2024.csv
저장 완료: merged_data/AAPL_Merg

In [7]:
# 입력 폴더 & 출력 폴더 설정
input_folder = "merged_data"
output_folder = "financial_ratios"

In [8]:
# 저장 폴더 생성
os.makedirs(output_folder, exist_ok=True)

# 모든 CSV 파일 찾기
files = [f for f in os.listdir(input_folder) if f.endswith(".csv")]

# 결과 저장 리스트
all_data = []

In [10]:
for file in files:
    file_path = os.path.join(input_folder, file)

    # CSV 파일 읽기
    df = pd.read_csv(file_path, index_col=0, header=None, names=["Indicator", "Value"])

    # 종목명과 연도 추출
    parts = file.split("_")
    stock_name = parts[0]
    year = parts[-1].split(".")[0]  # "2023.csv"에서 "2023" 추출

    # 필요한 원천 데이터 추출
    data = {
        "TotalAssets": df.loc[df.index.str.contains("TotalAssets", case=False, na=False), "Value"].values,
        "NetPPE": df.loc[df.index.str.contains("NetPPE", case=False, na=False), "Value"].values,
        "TotalRevenue": df.loc[df.index.str.contains("TotalRevenue", case=False, na=False), "Value"].values,
        "OperatingIncome": df.loc[df.index.str.contains("OperatingIncome", case=False, na=False), "Value"].values,
        "NetIncome": df.loc[df.index.str.contains("NetIncome", case=False, na=False), "Value"].values,
        "InterestExpense": df.loc[df.index.str.contains("InterestExpense", case=False, na=False), "Value"].values,
        "EBITDA": df.loc[df.index.str.contains("EBITDA", case=False, na=False), "Value"].values,
        "CurrentAssets": df.loc[df.index.str.contains("CurrentAssets", case=False, na=False), "Value"].values,
        "CurrentLiabilities": df.loc[df.index.str.contains("CurrentLiabilities", case=False, na=False), "Value"].values,
        "CashAndCashEquivalents": df.loc[df.index.str.contains("CashAndCashEquivalents", case=False, na=False), "Value"].values,
        "Receivables": df.loc[df.index.str.contains("Receivables", case=False, na=False), "Value"].values,
        "AccountsReceivable": df.loc[df.index.str.contains("AccountsReceivable", case=False, na=False), "Value"].values,
        "AccountsPayable": df.loc[df.index.str.contains("AccountsPayable", case=False, na=False), "Value"].values,
        "TotalLiabilities": df.loc[df.index.str.contains("TotalLiabilitiesNetMinorityInterest", case=False, na=False), "Value"].values,
        "StockholdersEquity": df.loc[df.index.str.contains("StockholdersEquity", case=False, na=False), "Value"].values,
        "TotalDebt": df.loc[df.index.str.contains("TotalDebt", case=False, na=False), "Value"].values,
        "CostOfRevenue": df.loc[df.index.str.contains("CostOfRevenue", case=False, na=False), "Value"].values,
        "Inventory": df.loc[df.index.str.contains("Inventory", case=False, na=False), "Value"].values,
    }

    # NaN을 방지하고 문자열을 숫자로 변환
    for key in data:
        try:
            data[key] = float(data[key][0]) if len(data[key]) > 0 else 0.0
        except ValueError:
            data[key] = 0.0  # 변환 실패 시 0.0 할당

    # 재무 비율 계산
    ratios = {
        "종목명": stock_name,
        "연도": year,
        "총자산 증가율": "계산 불가 (이전 연도 필요)",  # 이전 연도 데이터 필요
        "유형자산 증가율": "계산 불가 (이전 연도 필요)",  # 이전 연도 데이터 필요
        "매출액 증가율": "계산 불가 (이전 연도 필요)",  # 이전 연도 데이터 필요
        "매출액 영업이익률": data["OperatingIncome"] / data["TotalRevenue"] if data["TotalRevenue"] else None,
        "매출액 순이익률": data["NetIncome"] / data["TotalRevenue"] if data["TotalRevenue"] else None,
        "총자산 영업이익률": data["OperatingIncome"] / data["TotalAssets"] if data["TotalAssets"] else None,
        "총자산 순이익률": data["NetIncome"] / data["TotalAssets"] if data["TotalAssets"] else None,
        "영업이익 이자보상비율": data["OperatingIncome"] / data["InterestExpense"] if data["InterestExpense"] else None,
        "EBITDA대 매출액": data["EBITDA"] / data["TotalRevenue"] if data["TotalRevenue"] else None,
        "유동비율": data["CurrentAssets"] / data["CurrentLiabilities"] if data["CurrentLiabilities"] else None,
        "당좌비율": (data["CashAndCashEquivalents"] + data["Receivables"]) / data["CurrentLiabilities"] if data["CurrentLiabilities"] else None,
        "매출채권/매입채무비율": data["AccountsReceivable"] / data["AccountsPayable"] if data["AccountsPayable"] else None,
        "부채비율": data["TotalLiabilities"] / data["StockholdersEquity"] if data["StockholdersEquity"] else None,
        "유동부채비율": data["CurrentLiabilities"] / data["TotalLiabilities"] if data["TotalLiabilities"] else None,
        "차입금의존도": data["TotalDebt"] / data["TotalAssets"] if data["TotalAssets"] else None,
        "총자산회전율": data["TotalRevenue"] / data["TotalAssets"] if data["TotalAssets"] else None,
        "재고자산회전율": data["CostOfRevenue"] / data["Inventory"] if data["Inventory"] else None,
        "매출채권회전율": data["TotalRevenue"] / data["AccountsReceivable"] if data["AccountsReceivable"] else None,
    }

    # 결과 저장
    all_data.append(ratios)

    # 개별 파일 저장
    output_file = os.path.join(output_folder, f"{stock_name}_Financial_Ratios_{year}.csv")
    pd.DataFrame([ratios]).to_csv(output_file, index=False)
    print(f"📁 저장 완료: {output_file}")

📁 저장 완료: financial_ratios/AAPL_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/DIS_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/MRK_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/PG_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/UNH_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/SHW_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/PG_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/DIS_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/AAPL_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/KO_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/HON_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/V_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/MSFT_Financial_Ratios_2024.csv
📁 저장 완료: financial_ratios/MMM_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/IBM_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/CSCO_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/AMZN_Financial_Ratios_2023.csv
📁 저장 완료: financial_ratios/HD_Financial_Ratios_20

In [11]:
# 전체 데이터 CSV 저장
final_output = os.path.join(output_folder, "All_Financial_Ratios.csv")
pd.DataFrame(all_data).to_csv(final_output, index=False)
print(f"📁 모든 종목 재무 비율 저장 완료: {final_output}")

📁 모든 종목 재무 비율 저장 완료: financial_ratios/All_Financial_Ratios.csv
