In [72]:
import FinanceDataReader as fdr
import pandas as pd
from pykrx import stock
from datetime import datetime

In [73]:
# 날짜 설정
start = "20150101"
end = datetime.now().strftime("%Y%m%d")
start_fdr = "2015-01-01"
end_fdr = datetime.now().strftime("%Y-%m-%d")

In [74]:
# 기초 지수 데이터 수집
# 환율과 코스피 지수는 야후 파이낸스 데이터를 사용합니다
usd_krw = fdr.DataReader('USD/KRW', start_fdr, end_fdr)['Close']
kospi = fdr.DataReader('KS11', start_fdr, end_fdr)['Close']

In [75]:
# 코스피 시장 전체의 일자별 투자자 순매수 대금을 가져옵니다.
investors = stock.get_market_trading_value_by_date(start, end, "KOSPI")

In [76]:
investors.index = pd.to_datetime(investors.index)

In [77]:
# 컬럼명에 '외국인'이 포함된 컬럼을 자동으로 찾아서 할당
target_col = [col for col in investors.columns if '외국인' in col]

In [78]:
# 4. 데이터 통합
# 데이터프레임 합치기
# 확인을 위해 컬럼명을 영어로 변경하여 합칩니다.
if target_col:
        df = pd.DataFrame({
            'USD_KRW': usd_krw,
            'KOSPI': kospi,
            'Foreign_Net_Buy': investors[target_col[0]]
        })

In [79]:
# 5. 결측치 제거 및 CSV 저장
df_final = df.dropna()
df_final.to_csv('foreigner_stock_trading.csv', encoding='utf-8-sig')

print("\n✅ 모든 데이터가 포함된 CSV 파일이 생성되었습니다.")
print(f"파일명: foreigner_stock_trading.csv")
print("\n[데이터셋 상단 5행 확인]")
print(df_final.head())


✅ 모든 데이터가 포함된 CSV 파일이 생성되었습니다.
파일명: foreigner_stock_trading.csv

[데이터셋 상단 5행 확인]
                USD_KRW    KOSPI  Foreign_Net_Buy
2015-01-02  1093.599976  1926.44     2.857386e+10
2015-01-05  1111.000000  1915.75     5.553502e+10
2015-01-06  1108.500000  1882.45    -3.309332e+11
2015-01-07  1097.300049  1883.83    -2.209617e+11
2015-01-08  1097.800049  1904.65     1.937805e+11


In [80]:
# 5. 상관관계 확인
print("\n--- 상관계수 ---")
display(df_final.corr())


--- 상관계수 ---


Unnamed: 0,USD_KRW,KOSPI,Foreign_Net_Buy
USD_KRW,1.0,0.443892,-0.02849
KOSPI,0.443892,1.0,-0.05094
Foreign_Net_Buy,-0.02849,-0.05094,1.0
