In [None]:
pip install pykrx openpyxl

In [1]:
import pandas as pd
import os
from pykrx import stock
from datetime import datetime, timedelta


In [10]:
# 1. 설정: 그룹 별로 (g13~25까지)
groups = [f"g{i}" for i in range(13, 26)]
base_path = "raw_data\per_group"
tickers = {}

print("--- 엑셀 데이터 분석 시작 ---")

for g in groups:
    # 파일 경로 설정 (xlsx 기준)
    inst_path = os.path.join(base_path, f"기관_{g}.xlsx")
    foreign_path = os.path.join(base_path, f"외국인_{g}.xlsx")
    
    # 파일 존재 여부 확인
    if not os.path.exists(inst_path) or not os.path.exists(foreign_path):
        print("파일이 없어요")
        break
        
    try:
        # 2. 엑셀 파일 로드
        df_inst = pd.read_excel(inst_path)
        df_foreign = pd.read_excel(foreign_path)
        # 정렬 대상 컬럼명 확인 
        sort_col = '거래대금_순매수'
        
        def get_top_100(df, col):
            # 순매수 금액 기준 내림차순 정렬 후 상위 100개
            top_df = df.sort_values(by=col, ascending=False).head(100)
            t_col = '종목코드'
            return set(top_df[t_col].astype(str)) 

        # 4. 상위 100개 종목코드 추출 (Set 활용)
        top_inst_set = get_top_100(df_inst, sort_col)
        top_foreign_set = get_top_100(df_foreign, sort_col)
        
        # 5. 교집합 계산 및 저장
        common_list = list(top_inst_set & top_foreign_set)
        tickers[f"{g}"] = common_list
        
        print(f"[{g}그룹] 처리 완료: 공통 종목 {len(common_list)}개")
        
    except Exception as e:
        print(f"[{g}] 처리 중 에러 발생: {e}")

print("\n--- 분석 완료 ---")


--- 엑셀 데이터 분석 시작 ---


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g13그룹] 처리 완료: 공통 종목 19개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g14그룹] 처리 완료: 공통 종목 27개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g15그룹] 처리 완료: 공통 종목 32개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g16그룹] 처리 완료: 공통 종목 30개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g17그룹] 처리 완료: 공통 종목 19개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g18그룹] 처리 완료: 공통 종목 20개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g19그룹] 처리 완료: 공통 종목 27개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g20그룹] 처리 완료: 공통 종목 34개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g21그룹] 처리 완료: 공통 종목 35개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g22그룹] 처리 완료: 공통 종목 20개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g23그룹] 처리 완료: 공통 종목 34개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g24그룹] 처리 완료: 공통 종목 19개


  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


[g25그룹] 처리 완료: 공통 종목 31개

--- 분석 완료 ---


In [11]:
# 결과 확인 
if 'g24' in tickers:
    print(f"g16 교집합 리스트: {tickers['g16']}")

g16 교집합 리스트: ['035720', '006800', '006650', '004370', '089030', '009150', '000150', '010140', '077970', '329180', '138040', '018880', '047810', '336260', '353200', '064350', '277810', '028260', '347850', '195940', '051910', '108490', '018290', '007660', '005380', '011170', '034730', '128940', '001450', '103140']


In [None]:
market_cap = 500_000_000_000
m_cap_list = []
filtered_tickers = {}
target_dates = {
    'g13': '20250716', 'g14': '20250730', 'g15': '20250813',
    'g16': '20250829', 'g17': '20250912', 'g18': '20250926',
    'g19': '20251017', 'g20': '20251031', 'g21': '20251114',
    'g22': '20251128', 'g23': '20251212', 'g24': '20251229',
    'g25': '20260114'
}

print("--- [그룹별] 시총 및 유동성 필터링 시작 ---")

for g_id, codes in tickers.items():
    if not codes: continue
    
    # target_dates에서 'g13' 같은 키가 있는지 확인
    if g_id not in target_dates:
        print(f"⚠️ {g_id}에 해당하는 종료일 설정이 없어 건너뜁니다.")
        continue
    
    end_date = target_dates[g_id]
    
    # 60거래일 전 계산 (pykrx 데이터 수집용)
    start_date_raw = (datetime.strptime(end_date, '%Y%m%d') - timedelta(days=100)).strftime('%Y%m%d')
    
    try:
        # pykrx 데이터 가져오기
        df_cap = stock.get_market_cap(end_date)
        df_change = stock.get_market_price_change_by_ticker(start_date_raw, end_date)
        
        final_list = []
        for ticker in codes:
            ticker = str(ticker).strip().zfill(6)
            
            # [조건 1] 시가총액 필터링 (market_cap 이상)
            if ticker not in df_cap.index: continue
            if df_cap.loc[ticker, '시가총액'] < market_cap: continue
            
            # [조건 2] 60일 평균 거래대금 100억 이상
            if ticker not in df_change.index: continue
            total_val = df_change.loc[ticker, '거래대금']
            if (total_val / 60) >= 10_000_000_000:
                final_list.append(ticker)
        
        filtered_tickers[g_id] = final_list
        print(f"[{g_id}] 필터링 완료: {len(final_list)}개 생존 (기준일: {end_date})")
        
    except Exception as e:
        print(f"[{g_id}] 데이터 불러오기 오류: {e}")

print("\n--- 모든 필터링 완료 ---")

--- [그룹별] 시총 및 유동성 필터링 시작 ---
[g13] 필터링 완료: 15개 생존 (기준일: 20250716)
[g14] 필터링 완료: 24개 생존 (기준일: 20250730)
[g15] 필터링 완료: 22개 생존 (기준일: 20250813)
[g16] 필터링 완료: 22개 생존 (기준일: 20250829)
[g17] 필터링 완료: 13개 생존 (기준일: 20250912)
[g18] 필터링 완료: 14개 생존 (기준일: 20250926)
[g19] 필터링 완료: 25개 생존 (기준일: 20251017)
[g20] 필터링 완료: 24개 생존 (기준일: 20251031)
[g21] 필터링 완료: 24개 생존 (기준일: 20251114)
[g22] 필터링 완료: 12개 생존 (기준일: 20251128)
[g23] 필터링 완료: 24개 생존 (기준일: 20251212)
[g24] 필터링 완료: 15개 생존 (기준일: 20251229)
[g25] 필터링 완료: 24개 생존 (기준일: 20260114)

--- 모든 필터링 완료 ---


In [13]:
# 1. 설정값
FLOATING_RATIO = 0.5  # 유동 시총 비율 
TOP_N = 10           # 각 기간별 상위 종목 선정 개수

# 2. 그룹 일정 매핑 
group_schedules = {
    'g12': ('20250619', '20250702'), # g13의 장기 수급 계산을 위한 '참조용'
    'g13': ('20250703', '20250716'),
    'g14': ('20250717', '20250730'),
    'g15': ('20250731', '20250813'),
    'g16': ('20250814', '20250829'),
    'g17': ('20250901', '20250912'),
    'g18': ('20250915', '20250926'),
    'g19': ('20250929', '20251017'),
    'g20': ('20251020', '20251031'),
    'g21': ('20251103', '20251114'),
    'g22': ('20251117', '20251128'),
    'g23': ('20251201', '20251212'),
    'g24': ('20251215', '20251229'),
    'g25': ('20251230', '20260114')
}

final_rankings = {}

# filtered_tickers는 {"g13": [코드...], "g14": [코드...]} 형태
for g_id, ticker_pool in filtered_tickers.items():
    if not ticker_pool: continue
    if g_id not in group_schedules: continue
    
    print(f"--- {g_id} 분석 중 (단기/장기 수급 합산 방식) ---")
    
    # [날짜 설정]
    # 단기(s1): 현재 그룹 기간 (약 10영업일)
    # 장기(s2): 현재 + 직전 그룹 기간 (약 20영업일)
    curr_start, curr_end = group_schedules[g_id]
    
    # 직전 그룹 ID 계산 (g14 -> g13)
    g_num = int(g_id[1:])
    prev_g_id = f"g{g_num-1}"
    
    # 장기 수급 시작일 결정
    if prev_g_id in group_schedules:
        long_start = group_schedules[prev_g_id][0] # 직전 그룹의 시작일
    else:
        # 직전 데이터가 없는 g13 등은 약 30일 전으로 설정
        long_start = (datetime.strptime(curr_start, '%Y%m%d') - timedelta(days=30)).strftime('%Y%m%d')

    # 해당 그룹 종료일 기준 시가총액
    df_cap = stock.get_market_cap(curr_end)
    
    res_list = []
    
    for ticker in ticker_pool:
        ticker = str(ticker).strip().zfill(6)
        try:
            # [1단계] 외국인 순매수 금액 합계 구하기
            # 단기 (현재 그룹 기간)
            df_s1_val = stock.get_market_trading_value_by_date(curr_start, curr_end, ticker)
            net_foreign_s1 = df_s1_val['외국인합계'].sum()
            
            # 장기 (현재 + 직전 그룹 기간)
            df_s2_val = stock.get_market_trading_value_by_date(long_start, curr_end, ticker)
            net_foreign_s2 = df_s2_val['외국인합계'].sum()
            
            # [2단계] 수급 강도 지표 계산
            if ticker not in df_cap.index: continue
            f_cap = df_cap.loc[ticker, '시가총액'] * FLOATING_RATIO
            
            s1 = net_foreign_s1 / f_cap # 단기 수급 강도
            s2 = net_foreign_s2 / f_cap # 장기 수급 강도
            
            res_list.append({'티커': ticker, 's1': s1, 's2': s2})
        except Exception as e:
            continue
            
    df_res = pd.DataFrame(res_list)
    if df_res.empty: continue
    
    # [3단계] 단기 상위 10개 및 장기 상위 10개 추출
    top_s1 = df_res.sort_values(by='s1', ascending=False).head(TOP_N)['티커'].tolist()
    top_s2 = df_res.sort_values(by='s2', ascending=False).head(TOP_N)['티커'].tolist()
    
    # 후보군 통합 (중복 제거)
    candidates = list(set(top_s1 + top_s2))
    
    final_rows = []
    for ticker in candidates:
        row_data = df_res[df_res['티커'] == ticker].iloc[0]
        in_s1 = ticker in top_s1
        in_s2 = ticker in top_s2
        
        # [4단계] 가중치 점수 계산 (중복 시 2배)
        # 상위권에 들지 못한 기간의 점수는 0으로 처리하여 변별력 유지
        score = (row_data['s1'] if in_s1 else 0) + (row_data['s2'] if in_s2 else 0)
        if in_s1 and in_s2:
            score *= 2
            
        final_rows.append({
            '티커': ticker,
            '종목명': stock.get_market_ticker_name(ticker),
            '강도_단기(10d)': row_data['s1'],
            '강도_장기(20d)': row_data['s2'],
            '최종점수': score,
            '비고': '중복(2배)' if in_s1 and in_s2 else ('단기상위' if in_s1 else '장기상위')
        })
        
    # [5단계] 랭킹 확정 (최종점수 내림차순)
    df_rank = pd.DataFrame(final_rows).sort_values(by='최종점수', ascending=False).reset_index(drop=True)
    df_rank.index = df_rank.index + 1
    final_rankings[g_id] = df_rank
    
    print(f"[{g_id}] 랭킹 산출 완료 (후보군: {len(candidates)}개)")

print("\n--- 모든 그룹별 랭킹 산출 완료 ---")

--- g13 분석 중 (단기/장기 수급 합산 방식) ---
[g13] 랭킹 산출 완료 (후보군: 13개)
--- g14 분석 중 (단기/장기 수급 합산 방식) ---
[g14] 랭킹 산출 완료 (후보군: 11개)
--- g15 분석 중 (단기/장기 수급 합산 방식) ---
[g15] 랭킹 산출 완료 (후보군: 10개)
--- g16 분석 중 (단기/장기 수급 합산 방식) ---
[g16] 랭킹 산출 완료 (후보군: 13개)
--- g17 분석 중 (단기/장기 수급 합산 방식) ---
[g17] 랭킹 산출 완료 (후보군: 10개)
--- g18 분석 중 (단기/장기 수급 합산 방식) ---
[g18] 랭킹 산출 완료 (후보군: 12개)
--- g19 분석 중 (단기/장기 수급 합산 방식) ---
[g19] 랭킹 산출 완료 (후보군: 12개)
--- g20 분석 중 (단기/장기 수급 합산 방식) ---
[g20] 랭킹 산출 완료 (후보군: 12개)
--- g21 분석 중 (단기/장기 수급 합산 방식) ---
[g21] 랭킹 산출 완료 (후보군: 13개)
--- g22 분석 중 (단기/장기 수급 합산 방식) ---
[g22] 랭킹 산출 완료 (후보군: 12개)
--- g23 분석 중 (단기/장기 수급 합산 방식) ---
[g23] 랭킹 산출 완료 (후보군: 13개)
--- g24 분석 중 (단기/장기 수급 합산 방식) ---
[g24] 랭킹 산출 완료 (후보군: 12개)
--- g25 분석 중 (단기/장기 수급 합산 방식) ---
[g25] 랭킹 산출 완료 (후보군: 12개)

--- 모든 그룹별 랭킹 산출 완료 ---


In [15]:
# 1. 저장할 파일명 설정
file_name = "2025_하반기_수급강도_최종랭킹_그룹별.xlsx"

# 2. ExcelWriter 생성
with pd.ExcelWriter(file_name, engine='openpyxl') as writer:
    for month, df in final_rankings.items():
        # 데이터프레임이 비어있지 않은 경우에만 저장
        if not df.empty:
            # sheet_name을 월별 이름(예: '07월')으로 설정하여 저장
            df.to_excel(writer, sheet_name=month, index=True)
            print(f"[{month}] 시트 저장 완료")

print(f"\n✨ 모든 데이터가 '{file_name}' 파일로 저장되었습니다!")

[g13] 시트 저장 완료
[g14] 시트 저장 완료
[g15] 시트 저장 완료
[g16] 시트 저장 완료
[g17] 시트 저장 완료
[g18] 시트 저장 완료
[g19] 시트 저장 완료
[g20] 시트 저장 완료
[g21] 시트 저장 완료
[g22] 시트 저장 완료
[g23] 시트 저장 완료
[g24] 시트 저장 완료
[g25] 시트 저장 완료

✨ 모든 데이터가 '2025_하반기_수급강도_최종랭킹_그룹별.xlsx' 파일로 저장되었습니다!


### 현재 코드가 외국인 수급점수만 파악하고 있어서 기관도 같이 구해봄

In [22]:
# 1. 설정값
FLOATING_RATIO = 0.5  # 유동 시총 비율 
TOP_N = 10           # 각 기간별 상위 종목 선정 개수

# 2. 그룹 일정 매핑 
group_schedules = {
    'g12': ('20250619', '20250702'), # g13의 장기 수급 계산을 위한 '참조용'
    'g13': ('20250703', '20250716'),
    'g14': ('20250717', '20250730'),
    'g15': ('20250731', '20250813'),
    'g16': ('20250814', '20250829'),
    'g17': ('20250901', '20250912'),
    'g18': ('20250915', '20250926'),
    'g19': ('20250929', '20251017'),
    'g20': ('20251020', '20251031'),
    'g21': ('20251103', '20251114'),
    'g22': ('20251117', '20251128'),
    'g23': ('20251201', '20251212'),
    'g24': ('20251215', '20251229'),
    'g25': ('20251230', '20260114')
}

final_rankings = {}

# filtered_tickers는 {"g13": [코드...], "g14": [코드...]} 형태
for g_id, ticker_pool in filtered_tickers.items():
    if not ticker_pool: continue
    if g_id not in group_schedules: continue
    
    print(f"--- {g_id} 분석 중 (단기/장기 수급 합산 방식) ---")
    
    # [날짜 설정]
    # 단기(s1): 현재 그룹 기간 (약 10영업일)
    # 장기(s2): 현재 + 직전 그룹 기간 (약 20영업일)
    curr_start, curr_end = group_schedules[g_id]
    
    # 직전 그룹 ID 계산 (g14 -> g13)
    g_num = int(g_id[1:])
    prev_g_id = f"g{g_num-1}"
    
    # 장기 수급 시작일 결정
    if prev_g_id in group_schedules:
        long_start = group_schedules[prev_g_id][0] # 직전 그룹의 시작일
    else:
        # 직전 데이터가 없는 g13 등은 약 30일 전으로 설정
        long_start = (datetime.strptime(curr_start, '%Y%m%d') - timedelta(days=30)).strftime('%Y%m%d')

    # 해당 그룹 종료일 기준 시가총액
    df_cap = stock.get_market_cap(curr_end)
    
    res_list = []
    
    for ticker in ticker_pool:
        ticker = str(ticker).strip().zfill(6)
        try:
            # [1단계] 외국인+기관 순매수 금액 합계 구하기
            # 단기 (현재 그룹 기간)
            df_s1_val = stock.get_market_trading_value_by_date(curr_start, curr_end, ticker)
            net_major_s1 = df_s1_val['외국인합계'].sum() + df_s1_val['기관합계'].sum()
            
            # 장기 (현재 + 직전 그룹 기간)
            df_s2_val = stock.get_market_trading_value_by_date(long_start, curr_end, ticker)
            net_major_s2 = df_s2_val['외국인합계'].sum() + df_s2_val['기관합계'].sum()
            
            # [2단계] 수급 강도 지표 계산
            if ticker not in df_cap.index: continue
            f_cap = df_cap.loc[ticker, '시가총액'] * FLOATING_RATIO
            
            s1 = net_foreign_s1 / f_cap # 단기 수급 강도
            s2 = net_foreign_s2 / f_cap # 장기 수급 강도
            
            res_list.append({'티커': ticker, 's1': s1, 's2': s2})
        except Exception as e:
            continue
            
    df_res = pd.DataFrame(res_list)
    if df_res.empty: continue
    
    # [3단계] 단기 상위 10개 및 장기 상위 10개 추출
    top_s1 = df_res.sort_values(by='s1', ascending=False).head(TOP_N)['티커'].tolist()
    top_s2 = df_res.sort_values(by='s2', ascending=False).head(TOP_N)['티커'].tolist()
    
    # 후보군 통합 (중복 제거)
    candidates = list(set(top_s1 + top_s2))
    
    final_rows = []
    for ticker in candidates:
        row_data = df_res[df_res['티커'] == ticker].iloc[0]
        in_s1 = ticker in top_s1
        in_s2 = ticker in top_s2
        
        # [4단계] 가중치 점수 계산 (중복 시 2배)
        # 상위권에 들지 못한 기간의 점수는 0으로 처리하여 변별력 유지
        score = (row_data['s1'] if in_s1 else 0) + (row_data['s2'] if in_s2 else 0)
        if in_s1 and in_s2:
            score *= 2
            
        final_rows.append({
            '티커': ticker,
            '종목명': stock.get_market_ticker_name(ticker),
            '강도_단기(10d)': row_data['s1'],
            '강도_장기(20d)': row_data['s2'],
            '최종점수': score,
            '비고': '중복(2배)' if in_s1 and in_s2 else ('단기상위' if in_s1 else '장기상위')
        })
        
    # [5단계] 랭킹 확정 (최종점수 내림차순)
    df_rank = pd.DataFrame(final_rows).sort_values(by='최종점수', ascending=False).reset_index(drop=True)
    df_rank.index = df_rank.index + 1
    final_rankings[g_id] = df_rank
    
    print(f"[{g_id}] 랭킹 산출 완료 (후보군: {len(candidates)}개)")

print("\n--- 모든 그룹별 랭킹 산출 완료 ---")

--- g13 분석 중 (단기/장기 수급 합산 방식) ---
[g13] 랭킹 산출 완료 (후보군: 10개)
--- g14 분석 중 (단기/장기 수급 합산 방식) ---
[g14] 랭킹 산출 완료 (후보군: 10개)
--- g15 분석 중 (단기/장기 수급 합산 방식) ---
[g15] 랭킹 산출 완료 (후보군: 10개)
--- g16 분석 중 (단기/장기 수급 합산 방식) ---
[g16] 랭킹 산출 완료 (후보군: 10개)
--- g17 분석 중 (단기/장기 수급 합산 방식) ---
[g17] 랭킹 산출 완료 (후보군: 10개)
--- g18 분석 중 (단기/장기 수급 합산 방식) ---
[g18] 랭킹 산출 완료 (후보군: 10개)
--- g19 분석 중 (단기/장기 수급 합산 방식) ---
[g19] 랭킹 산출 완료 (후보군: 10개)
--- g20 분석 중 (단기/장기 수급 합산 방식) ---
[g20] 랭킹 산출 완료 (후보군: 10개)
--- g21 분석 중 (단기/장기 수급 합산 방식) ---
[g21] 랭킹 산출 완료 (후보군: 10개)
--- g22 분석 중 (단기/장기 수급 합산 방식) ---
[g22] 랭킹 산출 완료 (후보군: 10개)
--- g23 분석 중 (단기/장기 수급 합산 방식) ---
[g23] 랭킹 산출 완료 (후보군: 10개)
--- g24 분석 중 (단기/장기 수급 합산 방식) ---
[g24] 랭킹 산출 완료 (후보군: 10개)
--- g25 분석 중 (단기/장기 수급 합산 방식) ---
[g25] 랭킹 산출 완료 (후보군: 10개)

--- 모든 그룹별 랭킹 산출 완료 ---


In [23]:
# 1. 저장할 파일명 설정
file_name = "2025_하반기_수급강도_최종랭킹_그룹별_기관포함.xlsx"

# 2. ExcelWriter 생성
with pd.ExcelWriter(file_name, engine='openpyxl') as writer:
    for month, df in final_rankings.items():
        # 데이터프레임이 비어있지 않은 경우에만 저장
        if not df.empty:
            # sheet_name을 월별 이름(예: '07월')으로 설정하여 저장
            df.to_excel(writer, sheet_name=month, index=True)
            print(f"[{month}] 시트 저장 완료")

print(f"\n✨ 모든 데이터가 '{file_name}' 파일로 저장되었습니다!")

[g13] 시트 저장 완료
[g14] 시트 저장 완료
[g15] 시트 저장 완료
[g16] 시트 저장 완료
[g17] 시트 저장 완료
[g18] 시트 저장 완료
[g19] 시트 저장 완료
[g20] 시트 저장 완료
[g21] 시트 저장 완료
[g22] 시트 저장 완료
[g23] 시트 저장 완료
[g24] 시트 저장 완료
[g25] 시트 저장 완료

✨ 모든 데이터가 '2025_하반기_수급강도_최종랭킹_그룹별_기관포함.xlsx' 파일로 저장되었습니다!
