In [4]:
## 국내주식분봉조회: 국내주식 종목의 특정 기간동안의 분봉을 받아서 엑셀로 저장하는 파이썬 샘플코드 (최대 약 1년 기간 분봉 확인 가능)
## config.yaml 파일을 설정한 뒤 본 파일을 실행해서 분봉 데이터 저장 가능
## 국내주식 종목정보 마스터파일 다운로드 : 
### (코스피) https://new.real.download.dws.co.kr/common/master/kospi_code.mst.zip
### (코스닥) https://new.real.download.dws.co.kr/common/master/kosdaq_code.mst.zip
### (코넥스) https://new.real.download.dws.co.kr/common/master/konex_code.mst.zip

In [1]:
# (0) 필요 모듈 임포트
from datetime import datetime, timedelta
import pandas as pd
import requests
import json
import yaml
import time

# (1) 개인정보 파일 가져오기
with open('config.yaml', encoding='UTF-8') as f:
    _cfg = yaml.load(f, Loader=yaml.FullLoader)
APP_KEY = _cfg['APP_KEY']
APP_SECRET = _cfg['APP_SECRET']
ACCESS_TOKEN = ""
ACCESS_TOKEN_EXPIRED = ""
CANO = _cfg['CANO']
ACNT_PRDT_CD = _cfg['ACNT_PRDT_CD']
URL_BASE = _cfg['URL_BASE']
HTS_ID = _cfg['HTS_ID']
print(APP_KEY, APP_SECRET, ACCESS_TOKEN, HTS_ID)

# (2) 함수 정의
## 1. 접근 토큰 발급
def get_access_token():
    """ OAuth 인증 > 접근토큰발급 """
    headers = {"content-type": "application/json"}
    body = {
        "grant_type": "client_credentials",
        "appkey": APP_KEY,
        "appsecret": APP_SECRET
    }
    PATH = "oauth2/tokenP"
    URL = f"{URL_BASE}/{PATH}"

    time.sleep(0.05)  # 유량제한 예방 (REST: 1초당 20건 제한)
    res = requests.post(URL, headers=headers, data=json.dumps(body))

    if res.status_code == 200:
        try:
            access_token = res.json().get("access_token")
            access_token_expired = res.json().get("access_token_token_expired")  # 수정된 키
            return access_token, access_token_expired
        except KeyError as e:
            print(f"토큰 발급 중 키 에러 발생: {e}")
            print(res.json())
            return None, None
    else:
        print("접근 토큰 발급이 불가능합니다. 응답 코드:", res.status_code)
        print("응답 내용:", res.json())
        return None, None

PShp12vxqLPCVLNejlfydRUo4e0hSv5ynDh1 vXpB908NxwdWUpxhilq7l/6LFfGnNOvnGneuVAjg6oiTBciCzZ2Ts5HwXIBuenAZTYI+5yAMUjDHG7ZqOjB/bj+A9ZVjF70MDvdVcnC+ddzEvh0ZAYRs0H5QPEOle9KA2SmqnGKrcqYKgVp4fjCVpQWjhR9MQ1ZDysqAi30PoF6d3tAKkZI=  @1678001


In [2]:
ACCESS_TOKEN, ACCESS_TOKEN_EXPIRED = get_access_token()
ACCESS_TOKEN, ACCESS_TOKEN_EXPIRED

('eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzUxMiJ9.eyJzdWIiOiJ0b2tlbiIsImF1ZCI6ImFhNTM3NmE1LTNhMTItNDA4YS1iMjNmLTBmNzAwYjY4YTU2ZCIsInByZHRfY2QiOiIiLCJpc3MiOiJ1bm9ndyIsImV4cCI6MTczMjMyMDY3OCwiaWF0IjoxNzMyMjM0Mjc4LCJqdGkiOiJQU2hwMTJ2eHFMUENWTE5lamxmeWRSVW80ZTBoU3Y1eW5EaDEifQ.NUa2ppkiv8orYlUcfdcDpOklHSMxFHeZjHYcD2-txHbbjwU61BItOyOXBol2WXFZHUKMmEEQvHDSqMh-vHp7bA',
 '2024-11-23 09:11:18')

In [3]:
# 2. 국내 주식 분봉 조회 함수 정의
def get_domestic_minute_data(stock_code, date, hour, access_token, market_code="J"):
    url = f"{URL_BASE}/uapi/domestic-stock/v1/quotations/inquire-time-dailychartprice"
    params = {
        "FID_COND_MRKT_DIV_CODE": market_code,
        "FID_INPUT_ISCD": stock_code,
        "FID_INPUT_DATE_1": date,
        "FID_INPUT_HOUR_1": hour,
        "FID_PW_DATA_INCU_YN": "Y",
        "FID_FAKE_TICK_INCU_YN": "N"
    }
    headers = {
        'content-type': 'application/json',
        'authorization': f"Bearer {access_token}",
        'appkey': APP_KEY,
        'appsecret': APP_SECRET,
        'tr_id': 'FHKST03010230',
        'custtype': 'P'
    }
    print(params)
    time.sleep(0.1)  # 유량제한 예방 (REST: 1초당 20건 제한)
    response = requests.get(url, headers=headers, params=params)
#     print(response.json())  # 데이터 출력 확인
    if response.status_code == 200:
        return response.json()
    else:
        print(f"API 호출 실패: {response.status_code}")
        return None

# 3. 다음 조회 시 필요한 시간 계산 함수
def get_next_time(output2):
    last_record = output2[-1]
    last_datetime_str = last_record["stck_bsop_date"] + last_record["stck_cntg_hour"]
    last_datetime = datetime.strptime(last_datetime_str, "%Y%m%d%H%M%S")
    next_datetime = last_datetime - timedelta(minutes=1)
    return next_datetime.strftime("%Y%m%d"), next_datetime.strftime("%H%M%S")

# 4. 데이터를 판다스 데이터프레임으로 변환
def convert_to_dataframe(data):
    if "output2" in data and data["output2"]:
        df = pd.DataFrame(data["output2"])
        df = df[['stck_bsop_date', 'stck_cntg_hour', 'stck_prpr', 'stck_oprc', 'stck_hgpr', 'stck_lwpr', 'cntg_vol', 'acml_tr_pbmn']]
        df['datetime'] = pd.to_datetime(df['stck_bsop_date'] + df['stck_cntg_hour'], format='%Y%m%d%H%M%S')
        df = df.sort_values(by='datetime').reset_index(drop=True)
        return df
    else:
        print("출력 데이터가 없습니다.")
        return pd.DataFrame()  # 빈 데이터프레임 반환

# 5. 반복 조회 및 데이터 저장 함수
def fetch_and_save_data(stock_code, start_date, start_hour, period, access_token):
    all_data = pd.DataFrame()
    date, hour = start_date, start_hour

    for _ in range(int(period)):
        data = get_domestic_minute_data(stock_code, date, hour, access_token)
        
        # 데이터가 없거나 응답 데이터가 비어 있는 경우 반복 종료
        if not data or "output2" not in data or not data["output2"]:
            print("더 이상 수집할 데이터가 없습니다. 수집된 데이터로 파일을 저장합니다.")
            break
            
        # 수집된 데이터를 데이터프레임으로 변환 및 추가
        df = convert_to_dataframe(data)
        all_data = pd.concat([all_data, df], ignore_index=True)
        
        # 다음 조회를 위한 시간 설정
        date, hour = get_next_time(data["output2"])
        
    if not all_data.empty and 'datetime' in all_data.columns:
        all_data = all_data.drop_duplicates().sort_values(by='datetime').reset_index(drop=True)
        
        # 데이터프레임에서 맨 처음 일시와 마지막 일시를 파일명에 추가
        start_datetime = all_data['datetime'].iloc[0].strftime('%Y%m%d%H%M%S')
        end_datetime = all_data['datetime'].iloc[-1].strftime('%Y%m%d%H%M%S')
        file_name = f"{stock_code}_minute_data_{start_datetime}_{end_datetime}.xlsx"
        
        # 엑셀 파일로 저장
        all_data.to_excel(file_name, index=False, engine='openpyxl')
        print(f"{stock_code} 데이터가 {file_name}으로 저장되었습니다.")
    else:
        print("수집된 데이터가 없거나 형식이 올바르지 않습니다.")

    return all_data


In [4]:
# (3) 메인 실행 부분
if __name__ == "__main__":
    from datetime import datetime

    # 현재 날짜 가져오기
    today = datetime.now()
    
    # YYYYMMDD 형식으로 출력
    formatted_date = today.strftime("%Y%m%d")
    if ACCESS_TOKEN:
        stock_code = "360200" # ACE 미국 S&P 500
        start_date = formatted_date
        start_hour = "080000"
        period = "200" # 900으로 바꾸면 분봉수집가능 최대기간(약 1년) 수집가능
        
        all_data = fetch_and_save_data(stock_code, start_date, start_hour, period, ACCESS_TOKEN)
        print(all_data)
    else:
        print("토큰 발급 실패로 프로그램이 종료됩니다.")

{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241122', 'FID_INPUT_HOUR_1': '080000', 'FID_PW_DATA_INCU_YN': 'Y', 'FID_FAKE_TICK_INCU_YN': 'N'}
{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241121', 'FID_INPUT_HOUR_1': '132000', 'FID_PW_DATA_INCU_YN': 'Y', 'FID_FAKE_TICK_INCU_YN': 'N'}
{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241121', 'FID_INPUT_HOUR_1': '112000', 'FID_PW_DATA_INCU_YN': 'Y', 'FID_FAKE_TICK_INCU_YN': 'N'}
{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241121', 'FID_INPUT_HOUR_1': '092000', 'FID_PW_DATA_INCU_YN': 'Y', 'FID_FAKE_TICK_INCU_YN': 'N'}
{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241120', 'FID_INPUT_HOUR_1': '134100', 'FID_PW_DATA_INCU_YN': 'Y', 'FID_FAKE_TICK_INCU_YN': 'N'}
{'FID_COND_MRKT_DIV_CODE': 'J', 'FID_INPUT_ISCD': '360200', 'FID_INPUT_DATE_1': '20241120', 'FID_INP

In [5]:
all_data # 20240923 12:12:00 ~ 20241108 15:30:00 기간의 1분봉

Unnamed: 0,stck_bsop_date,stck_cntg_hour,stck_prpr,stck_oprc,stck_hgpr,stck_lwpr,cntg_vol,acml_tr_pbmn,datetime
0,20240819,090000,18860,18905,18905,18845,7672,145991075,2024-08-19 09:00:00
1,20240819,090100,18845,18860,18860,18845,417,153857420,2024-08-19 09:01:00
2,20240819,090200,18840,18845,18860,18835,1882,189320925,2024-08-19 09:02:00
3,20240819,090300,18835,18840,18840,18820,1203,211971930,2024-08-19 09:03:00
4,20240819,090400,18840,18830,18840,18830,1153,233680165,2024-08-19 09:04:00
...,...,...,...,...,...,...,...,...,...
23995,20241121,151600,20750,20755,20755,20750,1938,10322563705,2024-11-21 15:16:00
23996,20241121,151700,20750,20750,20750,20750,534,10333644205,2024-11-21 15:17:00
23997,20241121,151800,20755,20755,20760,20755,481,10343627365,2024-11-21 15:18:00
23998,20241121,151900,20760,20760,20760,20760,315,10350166765,2024-11-21 15:19:00


* 업종 기간별 시세

In [6]:
def get_domestic_index_data(index_code, date, access_token):
    """
    국내 지수 데이터를 조회하는 함수
    :param index_code: 조회할 지수 코드 (예: '0001')
    :param date: 조회 기준 날짜 (예: '20241120')
    :param access_token: 인증 토큰
    :return: API 응답 데이터 (JSON)
    """
    url = f"{URL_BASE}/uapi/domestic-stock/v1/quotations/inquire-index-daily-price"
    params = {
        "FID_COND_MRKT_DIV_CODE": "U",  # 시장 구분 코드 (업종: 'U')
        "FID_INPUT_ISCD": index_code,  # 지수 코드
        "FID_INPUT_DATE_1": date,  # 조회 날짜
        "FID_PERIOD_DIV_CODE": "D"  # 기간 분류 코드 ( D:일별 , W:주별, M:월별 )
    }
    headers = {
        'content-type': 'application/json',
        'authorization': f"Bearer {access_token}",
        'appkey': APP_KEY,
        'appsecret': APP_SECRET,
        'tr_id': 'FHPUP02120000',  # 국내업종 일자별지수 TR_ID
        'custtype': 'P'
    }
    print(params)
    # print(f"API 호출: {url}, 파라미터: {params}")
    time.sleep(0.05)  # 유량 제한 방지를 위한 대기

    response = requests.get(url, headers=headers, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"API 호출 실패: {response.status_code}, 내용: {response.text}")
        return None

In [7]:
# 3. 호출 반복하여 데이터를 데이터프레임에 저장하는 함수
def fetch_multiple_dates(index_code, start_date, num_calls, access_token):
    # 데이터를 저장할 리스트
    all_data = []
    
    # 첫 호출 날짜 설정
    current_date = start_date
    
    for _ in range(num_calls):
        # 데이터 호출
        result = get_domestic_index_data(index_code, current_date, access_token)
        
        # API 호출 성공 시
        if result and 'output2' in result:
            # output2가 비어있는지 체크
            if not result['output2']:
                print(f"데이터가 없습니다. 날짜: {current_date}")
                break  # 데이터가 없으면 종료
            
            all_data.extend(result['output2'])
            
            # 마지막 데이터의 "stck_bsop_date" 값을 추출하여 이전 날짜로 설정
            last_stck_bsop_date = result['output2'][-1]['stck_bsop_date']
            current_date = (datetime.strptime(last_stck_bsop_date, "%Y%m%d") - timedelta(days=1)).strftime("%Y%m%d")
        else:
            print(f"API 호출 실패 또는 예상 외의 응답: {result}")
            break  # 호출 실패 시 종료
    
    # 결과를 데이터프레임으로 변환
    df = pd.DataFrame(all_data)
    return df

# 엑셀 파일로 내보내는 함수
def save_to_excel(df, index_code, start_date, end_date):
    # 파일 이름 설정 (index_code, 시작 날짜, 끝 날짜)
    file_name = f"{index_code}_daily_data_{start_date}_{end_date}.xlsx"
    
    # 데이터프레임을 엑셀 파일로 저장
    df.to_excel(file_name, index=False)
    print(f"파일 저장 완료: {file_name}")

In [8]:
# 실행부분
index_code = '0001'  # 예시 인덱스 코드
start_date = datetime.today().strftime('%Y%m%d')  # 시작 날짜 = 오늘날짜
num_calls = 200  # 호출할 횟수
start_date

'20241122'

In [9]:
# 데이터 수집
df = fetch_multiple_dates(index_code, start_date, num_calls, ACCESS_TOKEN)

# 첫 번째 및 마지막 데이터 일시 가져오기
if not df.empty:
    first_date = df.iloc[0]['stck_bsop_date']
    last_date = df.iloc[-1]['stck_bsop_date']
    save_to_excel(df, index_code, first_date, last_date)
else:
    print("데이터가 없습니다.")

{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20241122', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20240626', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20240128', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20230829', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20230404', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20221109', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20220615', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001', 'FID_INPUT_DATE_1': '20220116', 'FID_PERIOD_DIV_CODE': 'D'}
{'FID_COND_MRKT_DIV_CODE': 'U', 'FID_INPUT_ISCD': '0001'

In [10]:
df

Unnamed: 0,stck_bsop_date,bstp_nmix_prpr,prdy_vrss_sign,bstp_nmix_prdy_vrss,bstp_nmix_prdy_ctrt,bstp_nmix_oprc,bstp_nmix_hgpr,bstp_nmix_lwpr,acml_vol_rlim,acml_vol,acml_tr_pbmn,invt_new_psdg,d20_dsrt
0,20241122,2498.27,2,17.64,0.71,2493.42,2498.67,2492.21,100.00,65864,853504,-13.52,99.05
1,20241121,2480.63,5,-1.66,-0.07,2474.62,2496.97,2474.62,14.60,451119,8356409,-29.23,98.18
2,20241120,2482.29,2,10.34,0.42,2475.76,2489.15,2471.79,16.11,408790,7820085,-18.64,98.05
3,20241119,2471.95,2,2.88,0.12,2469.13,2479.39,2465.15,16.03,410856,9085861,-33.75,97.42
4,20241118,2469.07,2,52.21,2.16,2440.31,2480.01,2437.53,14.84,443926,10621301,-46.05,97.11
...,...,...,...,...,...,...,...,...,...,...,...,...,...
11073,19830108,120.71,5,-0.38,-0.31,120.71,120.71,120.71,73.46,90500,0,0.00,0.00
11074,19830107,121.09,5,-1.72,-1.40,121.09,121.09,121.09,35.31,188310,0,0.00,0.00
11075,19830106,122.81,2,0.25,0.20,122.81,122.81,122.81,26.89,247200,0,0.00,0.00
11076,19830105,122.56,2,0.04,0.03,122.56,122.56,122.56,42.18,157610,0,0.00,0.00


* 금리 종합

In [11]:
# 2. 국내 주식 분봉 조회 함수 정의
def get_domestic_bond_interest_data():
    url = f"{URL_BASE}/uapi/domestic-stock/v1/quotations/comp-interest"
    params = {
        "FID_COND_MRKT_DIV_CODE": "I",
        "FID_COND_SCR_DIV_CODE": "20702",
        "FID_DIV_CLS_CODE": "1",
        "FID_DIV_CLS_CODE1": ""
    }
    headers = {
        'content-type': 'application/json',
        'authorization': f"Bearer {ACCESS_TOKEN}",
        'appkey': APP_KEY,
        'appsecret': APP_SECRET,
        'tr_id': 'FHPST07020000',
        'custtype': 'P'
    }
    print(params)
    time.sleep(0.1)  # 유량제한 예방 (REST: 1초당 20건 제한)
    response = requests.get(url, headers=headers, params=params)
#   print(response.json())  # 데이터 출력 확인
    if response.status_code == 200:
        return response.json()
    else:
        print(f"API 호출 실패: {response.status_code}")
        return None

In [12]:
# (3) 메인 실행 부분
if __name__ == "__main__":
    if ACCESS_TOKEN:
        all_data = get_domestic_bond_interest_data()
        
        if all_data and "output2" in all_data:
            # 'output2' 항목을 pandas 데이터프레임으로 변환
            df = pd.DataFrame(all_data["output2"])
            
            # 엑셀 파일명에 날짜와 시간을 포함하여 저장
            current_time = time.strftime('%Y%m%d_%H%M%S')  # 시간까지 포함한 파일명 생성
            filename = f"금리_{current_time}.xlsx"
            df.to_excel(filename, index=False)
            print(f"데이터가 {filename} 파일로 저장되었습니다.")
        else:
            print("유효한 데이터가 없거나 'output2' 항목이 없습니다.")
    else:
        print("토큰 발급 실패로 프로그램이 종료됩니다.")

{'FID_COND_MRKT_DIV_CODE': 'I', 'FID_COND_SCR_DIV_CODE': '20702', 'FID_DIV_CLS_CODE': '1', 'FID_DIV_CLS_CODE1': ''}
데이터가 금리_20241122_091227.xlsx 파일로 저장되었습니다.


In [13]:
df

Unnamed: 0,bcdt_code,hts_kor_isnm,bond_mnrt_prpr,prdy_vrss_sign,bond_mnrt_prdy_vrss,bstp_nmix_prdy_ctrt,stck_bsop_date
0,Y0101,국고채 3년,2.829,5,-0.044,-1.53,20241121
1,Y0102,회사채 무보증 3년AA-,3.396,5,-0.042,-1.22,20241121
2,Y0103,회사채 3년 BBB-,9.211,5,-0.043,-0.46,20241121
3,Y0104,국고채 1년,2.872,5,-0.014,-0.49,20241121
4,Y0105,국고채 5년,2.883,5,-0.037,-1.27,20241121
5,Y0106,국고채 10년,2.978,5,-0.039,-1.29,20241121
6,Y0107,국민주택1종 (5년),3.038,5,-0.035,-1.14,20241121
7,Y0108,한전채(3년),3.16,5,-0.041,-1.28,20241121
8,Y0109,통안증권(364일),2.817,5,-0.019,-0.67,20241121
9,Y0110,통안증권(2년),2.892,5,-0.038,-1.3,20241121


* 종합 시황 공시

In [14]:
# (3) 반복 조회 구현
def fetch_news_titles(repeat_count):
    """
    뉴스 제목 API를 반복 호출하여 데이터를 가져옴.
    :param repeat_count: 반복 호출 횟수
    :return: 모든 조회 결과 리스트
    """
    global ACCESS_TOKEN
    if not ACCESS_TOKEN:  # 토큰 발급
        ACCESS_TOKEN, _ = get_access_token()

    # 기본 요청 설정
    base_url = f"{URL_BASE}/uapi/domestic-stock/v1/quotations/news-title"
    headers = {
        'content-type': 'application/json',
        'authorization': f'Bearer {ACCESS_TOKEN}',
        'appkey': APP_KEY,
        'appsecret': APP_SECRET,
        'tr_id': 'FHKST01011800',
        'custtype': 'P'
    }

    # 결과 저장 리스트
    all_results = []

    # 첫 번째 호출: FID_INPUT_SRNO를 빈 값으로 설정
    current_srno = ""

    for i in range(repeat_count):
        params = {
            "FID_NEWS_OFER_ENTP_CODE": "",
            "FID_COND_MRKT_CLS_CODE": "",
            "FID_INPUT_ISCD": "",
            "FID_TITL_CNTT": "",
            "FID_INPUT_DATE_1": "",
            "FID_INPUT_HOUR_1": "",
            "FID_RANK_SORT_CLS_CODE": "",
            "FID_INPUT_SRNO": current_srno  # 빈 값 또는 이전 호출의 결과값 참조
        }
        response = requests.get(base_url, headers=headers, params=params)
        data = response.json()

        # 응답 저장
        if "output" in data:
            all_results.extend(data["output"])

            # 다음 호출을 위한 cntt_usiq_srno 계산
            if data["output"]:
                last_srno = data["output"][-1]["cntt_usiq_srno"]
                current_srno = str(int(last_srno) - 1)
            else:
                print("더 이상 데이터가 없습니다.")
                break
        else:
            print("응답 데이터가 없습니다. 응답 내용:", data)
            break

        print(f"{i+1}번째 호출 완료. 데이터 수: {len(data.get('output', []))}")
        time.sleep(0.05)  # 유량제한 예방

    return all_results

def save_to_excel(data, filename):
    """수집한 데이터를 엑셀로 저장합니다."""
    df = pd.DataFrame(data)
    try:
        # ExcelWriter를 사용하여 엑셀 저장
        with pd.ExcelWriter(filename, engine="openpyxl") as writer:
            df.to_excel(writer, index=False, sheet_name="News Titles")
        print(f"데이터가 엑셀 파일로 저장되었습니다: {filename}")
    except Exception as e:
        print(f"엑셀 파일 저장 중 오류 발생: {e}")

def clean_text(text):
    """텍스트에서 엑셀에서 허용되지 않는 문자를 제거합니다."""
    if isinstance(text, str):
        return "".join(c for c in text if c.isprintable())
    return text

In [15]:
if __name__ == "__main__":
    repeat_count = int(input("반복 호출 횟수를 입력하세요: "))
    results = fetch_news_titles(repeat_count)

    if results:
        # 데이터 정제 및 데이터프레임 생성
        cleaned_results = [{key: clean_text(value) for key, value in item.items()} for item in results]
        df = pd.DataFrame(cleaned_results)

        # 파일명 동적 생성
        first_srno = df.iloc[0]["cntt_usiq_srno"] if "cntt_usiq_srno" in df.columns else "unknown"
        last_srno = df.iloc[-1]["cntt_usiq_srno"] if "cntt_usiq_srno" in df.columns else "unknown"
        filename = f"news_title_{first_srno}_{last_srno}.xlsx"

        # 엑셀 저장
        save_to_excel(cleaned_results, filename)
    else:
        print("수집된 데이터가 없어 파일을 저장하지 않았습니다.")

반복 호출 횟수를 입력하세요:  10


1번째 호출 완료. 데이터 수: 40
2번째 호출 완료. 데이터 수: 40
3번째 호출 완료. 데이터 수: 40
4번째 호출 완료. 데이터 수: 40
5번째 호출 완료. 데이터 수: 40
6번째 호출 완료. 데이터 수: 40
7번째 호출 완료. 데이터 수: 40
8번째 호출 완료. 데이터 수: 40
9번째 호출 완료. 데이터 수: 40
10번째 호출 완료. 데이터 수: 40
데이터가 엑셀 파일로 저장되었습니다: news_title_2024112209121996733_2024112208411057908.xlsx


In [16]:
df

Unnamed: 0,cntt_usiq_srno,news_ofer_entp_code,data_dt,data_tm,hts_pbnt_titl_cntt,news_lrdv_code,dorg,iscd1,iscd2,iscd3,...,kor_isnm1,kor_isnm2,kor_isnm3,kor_isnm4,kor_isnm5,kor_isnm6,kor_isnm7,kor_isnm8,kor_isnm9,kor_isnm10
0,2024112209121996733,a,20241122,091219,"[IR일정] 화승엔터프라이즈, 대신증권 주관 NDR 참가",20,IRGO,241590,,,...,화승엔터프라이즈,,,,,,,,,
1,2024112209121817132,6,20241122,091218,尹정부 건전재정 기조에 변화 오나…추경용 국채발행 불가피,02,연합뉴스,,,,...,,,,,,,,,,
2,2024112209120698829,8,20241122,091206,자기 차 부수고 행인에 욕설…20대 벤츠녀에 무슨 일이,F0,아시아 경제,,,,...,,,,,,,,,,
3,2024112209120263428,7,20241122,091202,"제주반도체(080220) 소폭 상승세 +3.93%, 외국계 매수 유입, 4거래일만에 반등",02,인포스탁,080220,,,...,제주반도체,,,,,,,,,
4,2024112209120035525,6,20241122,091200,"코스피, 미국 증시 훈풍에 상승 출발",03,연합뉴스,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
395,2024112208413984506,B,20241122,084139,"강남구, 26일 재건축 정비사업 아카데미 개최",90,헤럴드경제,001680,,,...,대상,,,,,,,,,
396,2024112208413378705,6,20241122,084133,"[게시판] 알스퀘어, 쿠시먼앤드웨이크필드와 강남 삼성동빌딩 매각 자문",02,연합뉴스,,,,...,,,,,,,,,,
397,2024112208411302102,6,20241122,084113,"신기록 행진 대외금융자산, 외환시장 방파제 효과는",03,연합뉴스,,,,...,,,,,,,,,,
398,2024112208411063001,C,20241122,084110,"'정신질환 할머니' 독박육아 하다가..손녀는 베개로 살해, 손자 얼굴 물어뜯었다",10,파이낸셜,,,,...,,,,,,,,,,
