In [None]:
pip install pykrx openpyxl

In [4]:
import pandas as pd
import os
from pykrx import stock
from datetime import datetime, timedelta


In [5]:
# 1. 설정: 월 리스트 및 경로
months = ['07', '08', '09', '10', '11', '12']
base_path = "raw_data"
tickers = {}

print("--- 엑셀 데이터 분석 시작 ---")

for m in months:
    # 파일 경로 설정 (xlsx 기준)
    inst_path = os.path.join(base_path, f"기관_{m}.xlsx")
    foreign_path = os.path.join(base_path, f"외국인_{m}.xlsx")
    
    # 파일 존재 여부 확인
    if not os.path.exists(inst_path) or not os.path.exists(foreign_path):
        break
        
    try:
        # 2. 엑셀 파일 로드
        df_inst = pd.read_excel(inst_path)
        df_foreign = pd.read_excel(foreign_path)
        # 정렬 대상 컬럼명 확인 
        sort_col = '거래대금_순매수'
        
        def get_top_100(df, col):
            # 순매수 금액 기준 내림차순 정렬 후 상위 100개
            top_df = df.sort_values(by=col, ascending=False).head(100)
            t_col = '종목코드'
            return set(top_df[t_col].astype(str)) 

        # 4. 상위 100개 종목코드 추출 (Set 활용)
        top_inst_set = get_top_100(df_inst, sort_col)
        top_foreign_set = get_top_100(df_foreign, sort_col)
        
        # 5. 교집합 계산 및 저장
        common_list = list(top_inst_set & top_foreign_set)
        tickers[f"{m}월"] = common_list
        
        print(f"[{m}월] 처리 완료: 공통 종목 {len(common_list)}개")
        
    except Exception as e:
        print(f"[{m}월] 처리 중 에러 발생: {e}")

print("\n--- 분석 완료 ---")


--- 엑셀 데이터 분석 시작 ---


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[07월] 처리 완료: 공통 종목 24개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[08월] 처리 완료: 공통 종목 100개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[09월] 처리 완료: 공통 종목 23개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[10월] 처리 완료: 공통 종목 36개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[11월] 처리 완료: 공통 종목 31개


  warn("Workbook contains no default style, apply openpyxl's default")


[12월] 처리 완료: 공통 종목 26개

--- 분석 완료 ---


  warn("Workbook contains no default style, apply openpyxl's default")


In [6]:
# 결과 확인 (예: 7월 데이터)
if '08월' in tickers:
    print(f"08월 교집합 리스트: {tickers['07월']}")

08월 교집합 리스트: ['005490', '012450', '006280', '039030', '004800', '042660', '079550', '489790', '068270', '207940', '00088K', '267270', '003490', '062040', '028260', '042670', '006800', '004020', '000270', '051910', '012330', '009150', '086280', '035250']


In [None]:
market_cap = 200_000_000_000
m_cap_list = []
filtered_tickers = {}
target_dates = {
    '07월': '20250731', '08월': '20250829', '09월': '20250930',
    '10월': '20251031', '11월': '20251128', '12월': '20251230'
}


print("--- [고속/정확] 시총 및 유동성 필터링 시작 ---")

for month, codes in tickers.items():
    if not codes: continue
    
    end_date = target_dates[month]
    # 정확히 60거래일 전 날짜를 계산하기 위해 넉넉히 100일 전부터 가져옴
    start_date_raw = (datetime.strptime(end_date, '%Y%m%d') - timedelta(days=100)).strftime('%Y%m%d')
    
    # 1. 시가총액 데이터 (기준일 당일)
    df_cap = stock.get_market_cap(end_date)
    
    # 2. 거래대금 합계 데이터 (지정 기간 전체 합계가 나옴)
    df_change = stock.get_market_price_change_by_ticker(start_date_raw, end_date)
    
    final_list = []
    
    for ticker in codes:
        ticker = str(ticker).strip().zfill(6)
        
        try:
            # [조건 1] 시가총액 market_cap 이상
            if ticker not in df_cap.index: continue
            m_cap = df_cap.loc[ticker, '시가총액']
            if m_cap < market_cap: continue
            m_cap_list.append(m_cap)
            # [조건 2] 60일 평균 거래대금 100억 이상
            # df_change['거래대금']은 해당 기간의 "누적 합계"임
            if ticker not in df_change.index: continue
            
            total_val = df_change.loc[ticker, '거래대금']
            avg_val_60 = total_val / 60  # 60일 평균 계산
            if avg_val_60 >= 10_000_000_000:
                final_list.append(ticker)
                
        except Exception as e:
            print("오류 발생: ", e)
            continue
            
    filtered_tickers[month] = final_list
    print(f"[{month}] 필터링 완료: {len(final_list)}개 생존 (대상: {len(codes)}개)")
    print("시총 조건 개수:", len(m_cap_list)) 

print("\n--- 모든 필터링 완료 ---")

--- [고속/정확] 시총 및 유동성 필터링 시작 ---
[07월] 필터링 완료: 20개 생존 (대상: 24개)
24
[08월] 필터링 완료: 57개 생존 (대상: 100개)
124
[09월] 필터링 완료: 17개 생존 (대상: 23개)
147
[10월] 필터링 완료: 31개 생존 (대상: 36개)
183
[11월] 필터링 완료: 19개 생존 (대상: 31개)
214
[12월] 필터링 완료: 17개 생존 (대상: 26개)
240

--- 모든 필터링 완료 ---


In [8]:
# 1. 설정값
FLOATING_RATIO = 0.5  # 유동 시총 비율
TOP_N = 10        # 기간별 선정 개수

# 분석 기간 (기준월 말일 기준)
analysis_periods = {
    '07월': {'1mo': ('20250701', '20250731'), '2mo': ('20250601', '20250731')},
    '08월': {'1mo': ('20250801', '20250829'), '2mo': ('20250701', '20250829')},
    '09월': {'1mo': ('20250901', '20250930'), '2mo': ('20250801', '20250930')},
    '10월': {'1mo': ('20251001', '20251031'), '2mo': ('20250901', '20251031')},
    '11월': {'1mo': ('20251103', '20251128'), '2mo': ('20251001', '20251128')},
    '12월': {'1mo': ('20251201', '20251230'), '2mo': ('20251101', '20251230')}
}

final_rankings = {}

for month, ticker_pool in filtered_tickers.items():
    if not ticker_pool: continue
    
    print(f"--- {month} 분석 중 (종목별 데이터 합산 방식) ---")
    
    p_1m = analysis_periods[month]['1mo']
    p_2m = analysis_periods[month]['2mo']
    base_date = p_1m[1]
    
    # 해당 월 말일 시가총액
    df_cap = stock.get_market_cap(base_date)
    
    res_list = []
    
    for ticker in ticker_pool:
        try:
            # [1단계] 외국인 순매수 합계 구하기 (사용자 제안 방식)
            # get_market_trading_value_by_date는 해당 기간 투자자별 '순매수 대금'을 리턴함
            df_1m_val = stock.get_market_trading_value_by_date(p_1m[0], p_1m[1], ticker)
            net_foreign_1m = df_1m_val['외국인합계'].sum()
            
            df_2m_val = stock.get_market_trading_value_by_date(p_2m[0], p_2m[1], ticker)
            net_foreign_2m = df_2m_val['외국인합계'].sum()
            
            # [2단계] 수급 강도 지표 계산
            # 수급 강도 = 누적 외인 순매수 / 유동 시총
            f_cap = df_cap.loc[ticker, '시가총액'] * FLOATING_RATIO
            s1 = net_foreign_1m / f_cap
            s2 = net_foreign_2m / f_cap
            
            res_list.append({'티커': ticker, 's1': s1, 's2': s2})
        except Exception as e:
            print("오류 발생: ", e)
            continue
    df_res = pd.DataFrame(res_list)
    if df_res.empty: continue
    
    # [3단계] 1개월 상위 6개 및 2개월 상위 10개 후보군 추출
    top_6_1m = df_res.sort_values(by='s1', ascending=False).head(TOP_N)['티커'].tolist()
    top_6_2m = df_res.sort_values(by='s2', ascending=False).head(TOP_N)['티커'].tolist()
    
    # 최대 12개 후보군 (중복 제거)
    candidates = list(set(top_6_1m + top_6_2m))
    
    final_rows = []
    for ticker in candidates:
        row_data = df_res[df_res['티커'] == ticker].iloc[0]
        in_1m = ticker in top_6_1m
        in_2m = ticker in top_6_2m
        
        # [4단계] 가중치 점수 계산 (중복 시 2배)
        # 상위에 뽑히지 않은 기간의 점수는 0으로 처리하여 상위권 변별력 강화
        score = (row_data['s1'] if in_1m else 0) + (row_data['s2'] if in_2m else 0)
        if in_1m and in_2m:
            score *= 2
            
        final_rows.append({
            '티커': ticker,
            '종목명': stock.get_market_ticker_name(ticker),
            '강도_1m': row_data['s1'],
            '강도_2m': row_data['s2'],
            '최종점수': score,
            '비고': '중복(2배)' if in_1m and in_2m else ('1개월상위' if in_1m else '2개월상위')
        })
        
    # [5단계] 점수 기준 내림차순 정렬로 랭킹 확정
    df_rank = pd.DataFrame(final_rows).sort_values(by='최종점수', ascending=False).reset_index(drop=True)
    df_rank.index = df_rank.index + 1
    final_rankings[month] = df_rank

print("\n✨ 모든 월별 랭킹 산출이 완료되었습니다.")

--- 07월 분석 중 (종목별 데이터 합산 방식) ---
--- 08월 분석 중 (종목별 데이터 합산 방식) ---
--- 09월 분석 중 (종목별 데이터 합산 방식) ---
--- 10월 분석 중 (종목별 데이터 합산 방식) ---
--- 11월 분석 중 (종목별 데이터 합산 방식) ---
--- 12월 분석 중 (종목별 데이터 합산 방식) ---

✨ 모든 월별 랭킹 산출이 완료되었습니다.


In [9]:
# 1. 저장할 파일명 설정
file_name = "2025_하반기_수급강도_최종랭킹_시총_2천억.xlsx"

# 2. ExcelWriter 생성
with pd.ExcelWriter(file_name, engine='openpyxl') as writer:
    for month, df in final_rankings.items():
        # 데이터프레임이 비어있지 않은 경우에만 저장
        if not df.empty:
            # sheet_name을 월별 이름(예: '07월')으로 설정하여 저장
            df.to_excel(writer, sheet_name=month, index=True)
            print(f"[{month}] 시트 저장 완료")

print(f"\n✨ 모든 데이터가 '{file_name}' 파일로 저장되었습니다!")

[07월] 시트 저장 완료
[08월] 시트 저장 완료
[09월] 시트 저장 완료
[10월] 시트 저장 완료
[11월] 시트 저장 완료
[12월] 시트 저장 완료

✨ 모든 데이터가 '2025_하반기_수급강도_최종랭킹_시총_2천억.xlsx' 파일로 저장되었습니다!
