In [2]:
import json
import pandas as pd

# JSON 파일 경로 설정
file_path = "./IPOSTOCK_data.json"  # 파일명을 실제 경로로 변경

# JSON 파일 로드
with open(file_path, "r", encoding="utf-8-sig") as f:
    data = json.load(f)

# 데이터에서 기업명과 상장일 추출
records = []
for entry in data:
    for company_name, details in entry.items():
        listing_date = details.get("공모정보", {}).get("상장일", None)
        records.append({"기업명": company_name, "상장일": listing_date})

# DataFrame 생성
df = pd.DataFrame(records)

# DataFrame 확인
print(df)

         기업명         상장일
0       아이지넷  2025.02.04
1       피아이이  2025.02.04
2      삼양엔씨켐  2025.02.03
3     아스테라시스  2025.01.24
4     데이원컴퍼니  2025.01.24
..       ...         ...
770    화인베스틸  2014.07.22
771      트루윈  2014.07.11
772   캐스텍코리아  2014.05.27
773    오이솔루션  2014.02.27
774  인터파크INT  2014.02.06

[775 rows x 2 columns]


In [3]:
df

Unnamed: 0,기업명,상장일
0,아이지넷,2025.02.04
1,피아이이,2025.02.04
2,삼양엔씨켐,2025.02.03
3,아스테라시스,2025.01.24
4,데이원컴퍼니,2025.01.24
...,...,...
770,화인베스틸,2014.07.22
771,트루윈,2014.07.11
772,캐스텍코리아,2014.05.27
773,오이솔루션,2014.02.27


In [4]:
from datetime import datetime, timedelta

# 상장일을 기준으로 30일 전의 날짜 계산 함수
def calculate_30_days_before(date_str):
    try:
        # 날짜 문자열을 datetime 객체로 변환
        listing_date = datetime.strptime(date_str, "%Y.%m.%d")
        # 30일 전 날짜 계산
        date_30_days_before = listing_date - timedelta(days=30)
        # 다시 문자열로 변환하여 반환 (원본과 같은 형식 유지)
        return date_30_days_before.strftime("%Y.%m.%d")
    except Exception:
        return None  # 변환 실패 시 None 반환

# 새로운 컬럼 추가
df["상장일_30일전"] = df["상장일"].apply(calculate_30_days_before)

# 결과 확인
df

Unnamed: 0,기업명,상장일,상장일_30일전
0,아이지넷,2025.02.04,2025.01.05
1,피아이이,2025.02.04,2025.01.05
2,삼양엔씨켐,2025.02.03,2025.01.04
3,아스테라시스,2025.01.24,2024.12.25
4,데이원컴퍼니,2025.01.24,2024.12.25
...,...,...,...
770,화인베스틸,2014.07.22,2014.06.22
771,트루윈,2014.07.11,2014.06.11
772,캐스텍코리아,2014.05.27,2014.04.27
773,오이솔루션,2014.02.27,2014.01.28


In [5]:
# 상장일을 기준으로 30일 전부터 1일 전까지의 모든 날짜를 리스트로 반환하는 함수
def generate_date_range(date_str):
    try:
        # 날짜 문자열을 datetime 객체로 변환
        listing_date = datetime.strptime(date_str, "%Y.%m.%d")
        start_date = listing_date - timedelta(days=30)  # 30일 전
        end_date = listing_date - timedelta(days=1)  # 1일 전

        # 날짜 범위 생성 (YYYY.MM.DD 형식 유지)
        date_list = [(start_date + timedelta(days=i)).strftime("%Y.%m.%d") for i in range((end_date - start_date).days + 1)]
        return date_list
    except Exception:
        return []  # 변환 실패 시 빈 리스트 반환

# 새로운 컬럼 추가 (30일 전부터 1일 전까지의 날짜 리스트)
df["상장일_30일전_1일전_범위"] = df["상장일"].apply(generate_date_range)

# 결과 확인
df

Unnamed: 0,기업명,상장일,상장일_30일전,상장일_30일전_1일전_범위
0,아이지넷,2025.02.04,2025.01.05,"[2025.01.05, 2025.01.06, 2025.01.07, 2025.01.0..."
1,피아이이,2025.02.04,2025.01.05,"[2025.01.05, 2025.01.06, 2025.01.07, 2025.01.0..."
2,삼양엔씨켐,2025.02.03,2025.01.04,"[2025.01.04, 2025.01.05, 2025.01.06, 2025.01.0..."
3,아스테라시스,2025.01.24,2024.12.25,"[2024.12.25, 2024.12.26, 2024.12.27, 2024.12.2..."
4,데이원컴퍼니,2025.01.24,2024.12.25,"[2024.12.25, 2024.12.26, 2024.12.27, 2024.12.2..."
...,...,...,...,...
770,화인베스틸,2014.07.22,2014.06.22,"[2014.06.22, 2014.06.23, 2014.06.24, 2014.06.2..."
771,트루윈,2014.07.11,2014.06.11,"[2014.06.11, 2014.06.12, 2014.06.13, 2014.06.1..."
772,캐스텍코리아,2014.05.27,2014.04.27,"[2014.04.27, 2014.04.28, 2014.04.29, 2014.04.3..."
773,오이솔루션,2014.02.27,2014.01.28,"[2014.01.28, 2014.01.29, 2014.01.30, 2014.01.3..."


In [None]:
# 리스트 내의 날짜 형식을 "YYYYMMDD"로 변환하는 함수
def convert_date_list_format(date_list):
    try:
        return [datetime.strptime(date, "%Y.%m.%d").strftime("%Y%m%d") for date in date_list]
    except Exception:
        return []  # 변환 실패 시 빈 리스트 반환

# 상장일_30일전_1일전_범위 컬럼의 날짜 형식 변환
df["상장일_30일전_1일전_범위_YYYYMMDD"] = df["상장일_30일전_1일전_범위"].apply(convert_date_list_format)

# 결과 확인
df

Unnamed: 0,기업명,상장일,상장일_30일전,상장일_30일전_1일전_범위,상장일_30일전_1일전_범위_YYYYMMDD
0,아이지넷,2025.02.04,2025.01.05,"[2025.01.05, 2025.01.06, 2025.01.07, 2025.01.0...","[20250105, 20250106, 20250107, 20250108, 20250..."
1,피아이이,2025.02.04,2025.01.05,"[2025.01.05, 2025.01.06, 2025.01.07, 2025.01.0...","[20250105, 20250106, 20250107, 20250108, 20250..."
2,삼양엔씨켐,2025.02.03,2025.01.04,"[2025.01.04, 2025.01.05, 2025.01.06, 2025.01.0...","[20250104, 20250105, 20250106, 20250107, 20250..."
3,아스테라시스,2025.01.24,2024.12.25,"[2024.12.25, 2024.12.26, 2024.12.27, 2024.12.2...","[20241225, 20241226, 20241227, 20241228, 20241..."
4,데이원컴퍼니,2025.01.24,2024.12.25,"[2024.12.25, 2024.12.26, 2024.12.27, 2024.12.2...","[20241225, 20241226, 20241227, 20241228, 20241..."
...,...,...,...,...,...
770,화인베스틸,2014.07.22,2014.06.22,"[2014.06.22, 2014.06.23, 2014.06.24, 2014.06.2...","[20140622, 20140623, 20140624, 20140625, 20140..."
771,트루윈,2014.07.11,2014.06.11,"[2014.06.11, 2014.06.12, 2014.06.13, 2014.06.1...","[20140611, 20140612, 20140613, 20140614, 20140..."
772,캐스텍코리아,2014.05.27,2014.04.27,"[2014.04.27, 2014.04.28, 2014.04.29, 2014.04.3...","[20140427, 20140428, 20140429, 20140430, 20140..."
773,오이솔루션,2014.02.27,2014.01.28,"[2014.01.28, 2014.01.29, 2014.01.30, 2014.01.3...","[20140128, 20140129, 20140130, 20140131, 20140..."


In [7]:
df.to_csv("기업_상장일.csv", index=False, encoding="utf-8-sig")

In [18]:
# 상장일_30일전_1일전_범위 컬럼의 모든 리스트를 하나의 리스트로 합치기
all_dates_list = sum(df["상장일_30일전_1일전_범위_YYYYMMDD"].tolist(), [])

# 중복 제거 및 정렬 (필요 시 적용)
all_dates_list = sorted(set(all_dates_list))

# 결과 확인
len(all_dates_list), all_dates_list

(3809,
 ['20140107',
  '20140108',
  '20140109',
  '20140110',
  '20140111',
  '20140112',
  '20140113',
  '20140114',
  '20140115',
  '20140116',
  '20140117',
  '20140118',
  '20140119',
  '20140120',
  '20140121',
  '20140122',
  '20140123',
  '20140124',
  '20140125',
  '20140126',
  '20140127',
  '20140128',
  '20140129',
  '20140130',
  '20140131',
  '20140201',
  '20140202',
  '20140203',
  '20140204',
  '20140205',
  '20140206',
  '20140207',
  '20140208',
  '20140209',
  '20140210',
  '20140211',
  '20140212',
  '20140213',
  '20140214',
  '20140215',
  '20140216',
  '20140217',
  '20140218',
  '20140219',
  '20140220',
  '20140221',
  '20140222',
  '20140223',
  '20140224',
  '20140225',
  '20140226',
  '20140427',
  '20140428',
  '20140429',
  '20140430',
  '20140501',
  '20140502',
  '20140503',
  '20140504',
  '20140505',
  '20140506',
  '20140507',
  '20140508',
  '20140509',
  '20140510',
  '20140511',
  '20140512',
  '20140513',
  '20140514',
  '20140515',
  '20140516',

In [21]:
len(df["상장일"].unique())

684