In [6]:
import pandas as pd
from IPython.display import display

# CSV 파일 불러오기
value_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_value.csv"
ticker_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_ticker.csv"

# 각각의 파일 불러오기
data = pd.read_csv(value_file_path)
ticker_data = pd.read_csv(ticker_file_path)

# 종목코드를 문자열로 변환하여 데이터 타입을 맞춤
data['종목코드'] = data['종목코드'].astype(str)
ticker_data['종목코드'] = ticker_data['종목코드'].astype(str)

# 지표별 조건 필터링
psr_filtered = data[(data['지표'] == 'PSR') & (data['값'] <= 0.2) & (data['값'] >= 0)]
per_filtered = data[(data['지표'] == 'PER') & (data['값'] <= 8) & (data['값'] >= 0)]
pcr_filtered = data[(data['지표'] == 'PCR') & (data['값'] <= 3) & (data['값'] >= 0)]

# 조건을 모두 만족하는 종목 코드 찾기
growth_stock_codes = set(psr_filtered['종목코드']) & set(per_filtered['종목코드']) & set(pcr_filtered['종목코드'])

# 조건을 만족하는 종목만 선택하고, 필요한 지표만 포함
filtered_data = data[(data['종목코드'].isin(growth_stock_codes)) & (data['지표'].isin(['PSR', 'PER', 'PCR']))]

# 테이블 재구성: 종목코드, 기준일을 인덱스로 두고 지표를 열로 변환
pivoted_data = filtered_data.pivot_table(index=['종목코드', '기준일'], columns='지표', values='값').reset_index()

# 종목코드 기준으로 종목명을 병합
pivoted_data = pivoted_data.merge(ticker_data[['종목코드', '종목명']], on='종목코드', how='left')

# 원하는 열 순서로 재정렬
pivoted_data = pivoted_data[['종목코드', '종목명', '기준일', 'PSR', 'PER', 'PCR']]

# 종목코드를 숫자로 변환한 후 오름차순 정렬
pivoted_data['종목코드'] = pivoted_data['종목코드'].astype(int)
pivoted_data = pivoted_data.sort_values(by='종목코드').reset_index(drop=True)

# 결과 테이블로 출력
display(pivoted_data)

# CSV 파일로 저장
output_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.csv"
pivoted_data.to_csv(output_file_path, index=False, encoding='utf-8-sig')


Unnamed: 0,종목코드,종목명,기준일,PSR,PER,PCR
0,70,삼양홀딩스,2024-07-03,0.1734,2.3314,2.6540
1,140,하이트진로홀딩스,2024-07-03,0.0829,3.0299,1.7353
2,320,노루홀딩스,2024-07-03,0.1386,2.4626,1.9775
3,1040,CJ,2024-07-03,0.0805,3.6413,0.7014
4,1120,LX인터내셔널,2024-07-03,0.0808,6.9922,2.2895
...,...,...,...,...,...,...
84,267250,HD현대,2024-07-03,0.0918,3.8704,1.0587
85,267290,경동도시가스,2024-07-03,0.0644,3.8018,1.7695
86,317400,자이에스앤디,2024-07-03,0.0985,5.1395,1.8210
87,378850,화승알앤에이,2024-07-03,0.1314,2.8460,1.8292


In [7]:
import pandas as pd

# CSV 파일 읽기
csv_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.csv"
data = pd.read_csv(csv_file_path, delimiter="\t")  # 탭 구분자로 읽어오기

# JSON 파일로 저장하기
json_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"
data.to_json(json_file_path, orient="records", force_ascii=False, indent=4)

print(f"JSON 파일이 '{json_file_path}' 이름으로 저장되었습니다.")


JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json' 이름으로 저장되었습니다.


In [8]:
import json
import pandas as pd

# JSON 파일 경로
input_file = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"
output_file = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"

# JSON 파일 읽기
with open(input_file, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

# 문자열로 결합된 데이터를 분리하여 각 열로 변환
processed_data = []
for item in raw_data:
    values = list(item.values())[0].split(',')
    processed_data.append({
        "종목코드": int(values[0]),
        "종목명": values[1],
        "기준일": values[2],
        "PSR": float(values[3]),
        "PER": float(values[4]),
        "PCR": float(values[5])
    })

# DataFrame으로 변환 후 JSON으로 저장
df = pd.DataFrame(processed_data)
df.to_json(output_file, orient="records", force_ascii=False, indent=4)

print(f"필드별로 분리된 JSON 파일이 '{output_file}'에 저장되었습니다.")


필드별로 분리된 JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json'에 저장되었습니다.


In [9]:
import pandas as pd
from IPython.display import display

# CSV 파일 불러오기
value_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_value.csv"
ticker_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_ticker.csv"

# 각각의 파일 불러오기
data = pd.read_csv(value_file_path)
ticker_data = pd.read_csv(ticker_file_path)

# 종목코드를 문자열로 변환하여 데이터 타입을 맞춤
data['종목코드'] = data['종목코드'].astype(str)
ticker_data['종목코드'] = ticker_data['종목코드'].astype(str)

# 지표별 조건 필터링
psr_filtered = data[(data['지표'] == 'PSR') & (data['값'] <= 1) & (data['값'] >= 0)]
per_filtered = data[(data['지표'] == 'PER') & (data['값'] <= 15) & (data['값'] >= 10)]
pcr_filtered = data[(data['지표'] == 'PCR') & (data['값'] <= 10) & (data['값'] >= 0)]
pcr_filtered = data[(data['지표'] == 'PBR') & (data['값'] <= 1) & (data['값'] >= 0)]

# 조건을 모두 만족하는 종목 코드 찾기
growth_stock_codes = set(psr_filtered['종목코드']) & set(per_filtered['종목코드']) & set(pcr_filtered['종목코드'])

# 조건을 만족하는 종목만 선택하고, 필요한 지표만 포함
filtered_data = data[(data['종목코드'].isin(growth_stock_codes)) & (data['지표'].isin(['PSR', 'PER', 'PCR', 'PBR']))]

# 테이블 재구성: 종목코드, 기준일을 인덱스로 두고 지표를 열로 변환
pivoted_data = filtered_data.pivot_table(index=['종목코드', '기준일'], columns='지표', values='값').reset_index()

# 종목코드 기준으로 종목명을 병합
pivoted_data = pivoted_data.merge(ticker_data[['종목코드', '종목명']], on='종목코드', how='left')

# 원하는 열 순서로 재정렬
pivoted_data = pivoted_data[['종목코드', '종목명', '기준일', 'PSR', 'PER', 'PCR', 'PBR']]

# 종목코드를 숫자로 변환한 후 오름차순 정렬
pivoted_data['종목코드'] = pivoted_data['종목코드'].astype(int)
pivoted_data = pivoted_data.sort_values(by='종목코드').reset_index(drop=True)

# 결과 테이블로 출력
display(pivoted_data)

# CSV 파일로 저장
output_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.csv"
pivoted_data.to_csv(output_file_path, index=False, encoding='utf-8-sig')

Unnamed: 0,종목코드,종목명,기준일,PSR,PER,PCR,PBR
0,390,삼화페인트,2024-07-03,0.3259,10.4713,5.0700,0.6732
1,430,대원강업,2024-07-03,0.2975,13.2119,7.7790,0.5260
2,640,동아쏘시오홀딩스,2024-07-03,0.5502,13.3277,5.1710,0.6490
3,850,화천기공,2024-07-03,0.3180,10.0167,9.1819,0.1919
4,1680,대상,2024-07-03,0.2097,12.2542,3.8616,0.6501
...,...,...,...,...,...,...,...
95,286940,롯데이노베이트,2024-07-03,0.3304,11.9850,17.6063,0.8868
96,293480,하나제약,2024-07-03,0.9816,10.7596,13.2227,0.7946
97,310870,디와이씨,2024-07-03,0.2375,11.0332,1.8013,0.5215
98,344820,KCC글라스,2024-07-03,0.3606,10.6204,3.0058,0.4309


In [1]:
import pandas as pd

# CSV 파일 읽기
csv_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.csv"
data = pd.read_csv(csv_file_path, delimiter="\t")  # 탭 구분자로 읽어오기

# JSON 파일로 저장하기
json_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"
data.to_json(json_file_path, orient="records", force_ascii=False, indent=4)

print(f"JSON 파일이 '{json_file_path}' 이름으로 저장되었습니다.")

JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json' 이름으로 저장되었습니다.


In [2]:
import json
import pandas as pd

# JSON 파일 경로
input_file = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"
output_file = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"

# JSON 파일 읽기
with open(input_file, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

# 문자열로 결합된 데이터를 분리하여 각 열로 변환
processed_data = []
for item in raw_data:
    values = list(item.values())[0].split(',')
    processed_data.append({
        "종목코드": int(values[0]),
        "종목명": values[1],
        "기준일": values[2],
        "PSR": float(values[3]),
        "PER": float(values[4]),
        "PCR": float(values[5])
    })

# DataFrame으로 변환 후 JSON으로 저장
df = pd.DataFrame(processed_data)
df.to_json(output_file, orient="records", force_ascii=False, indent=4)

print(f"필드별로 분리된 JSON 파일이 '{output_file}'에 저장되었습니다.")

필드별로 분리된 JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json'에 저장되었습니다.


In [68]:
import pandas as pd
from IPython.display import display

# CSV 파일 불러오기
value_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_value.csv"
ticker_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_ticker.csv"

# 각각의 파일 불러오기
data = pd.read_csv(value_file_path)
ticker_data = pd.read_csv(ticker_file_path)

# 종목코드를 문자열로 변환하여 데이터 타입을 맞춤
data['종목코드'] = data['종목코드'].astype(str)
ticker_data['종목코드'] = ticker_data['종목코드'].astype(str)

# 지표별 조건 필터링
pbr_filtered = data[(data['지표'] == 'PBR') & (data['값'] <= 1) & (data['값'] >= 0)]
per_filtered = data[(data['지표'] == 'PER') & (data['값'] <= 15) & (data['값'] >= 0)]
psr_filtered = data[(data['지표'] == 'PSR') & (data['값'] <= 1) & (data['값'] >= 0)]
dy_filtered = data[(data['지표'] == 'DY') & (data['값'] >= 0.05)]

# 조건을 모두 만족하는 종목 코드 찾기
growth_stock_codes = set(pbr_filtered['종목코드']) & set(per_filtered['종목코드']) & set(psr_filtered['종목코드']) & set(dy_filtered['종목코드'])

# 조건을 만족하는 종목만 선택하고, 필요한 지표만 포함
filtered_data = data[(data['종목코드'].isin(growth_stock_codes)) & (data['지표'].isin(['PBR', 'PER', 'PSR', 'DY']))]

# 테이블 재구성: 종목코드, 기준일을 인덱스로 두고 지표를 열로 변환
pivoted_data = filtered_data.pivot_table(index=['종목코드', '기준일'], columns='지표', values='값').reset_index()

# 종목코드 기준으로 종목명을 병합
pivoted_data = pivoted_data.merge(ticker_data[['종목코드', '종목명']], on='종목코드', how='left')

# 원하는 열 순서로 재정렬
pivoted_data = pivoted_data[['종목코드', '종목명', '기준일', 'PBR', 'PER', 'PSR', 'DY']]

# 종목코드를 숫자로 변환한 후 오름차순 정렬
pivoted_data['종목코드'] = pivoted_data['종목코드'].astype(int)
pivoted_data = pivoted_data.sort_values(by='종목코드').reset_index(drop=True)

# 결과 테이블로 출력
display(pivoted_data)

# CSV 파일로 저장
output_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.csv"
pivoted_data.to_csv(output_file_path, index=False, encoding='utf-8-sig')

Unnamed: 0,종목코드,종목명,기준일,PBR,PER,PSR,DY
0,70,삼양홀딩스,2024-07-03,0.2065,2.3314,0.1734,0.0512
1,140,하이트진로홀딩스,2024-07-03,0.189,3.0299,0.0829,0.0604
2,390,삼화페인트,2024-07-03,0.6732,10.4713,0.3259,0.0522
3,480,CR홀딩스,2024-07-03,0.3517,9.9763,0.3505,0.0665
4,700,유수홀딩스,2024-07-03,0.3332,5.3536,0.3796,0.0633
5,970,한국주철관,2024-07-03,0.4211,8.8908,0.339,0.0607
6,1230,동국홀딩스,2024-07-03,0.1662,0.4557,0.1432,0.0719
7,1430,세아베스틸지주,2024-07-03,0.3542,8.6248,0.1926,0.0593
8,1800,오리온홀딩스,2024-07-03,0.2128,2.7938,0.3004,0.0503
9,2310,아세아제지,2024-07-03,0.4343,6.0497,0.4077,0.059


In [69]:
import pandas as pd

# CSV 파일 읽기
csv_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.csv"
data = pd.read_csv(csv_file_path, delimiter="\t")  # 탭 구분자로 읽어오기

# JSON 파일로 저장하기
json_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.json"
data.to_json(json_file_path, orient="records", force_ascii=False, indent=4)

print(f"JSON 파일이 '{json_file_path}' 이름으로 저장되었습니다.")

JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.json' 이름으로 저장되었습니다.


In [70]:
import json
import pandas as pd

# JSON 파일 경로
input_file = r"C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.json"
output_file = r"C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.json"

# JSON 파일 읽기
with open(input_file, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

# 문자열로 결합된 데이터를 분리하여 각 열로 변환
processed_data = []
for item in raw_data:
    values = list(item.values())[0].split(',')
    processed_data.append({
        "종목코드": int(values[0]),
        "종목명": values[1],
        "기준일": values[2],
        "PSR": float(values[3]),
        "PER": float(values[4]),
        "PCR": float(values[5])
    })

# DataFrame으로 변환 후 JSON으로 저장
df = pd.DataFrame(processed_data)
df.to_json(output_file, orient="records", force_ascii=False, indent=4)

print(f"필드별로 분리된 JSON 파일이 '{output_file}'에 저장되었습니다.")

필드별로 분리된 JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_mixed_stocks.json'에 저장되었습니다.
