In [25]:
import pandas as pd
from IPython.display import display

# CSV 파일 불러오기
value_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_value.csv"
ticker_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_ticker.csv"

# 각각의 파일 불러오기
data = pd.read_csv(value_file_path)
ticker_data = pd.read_csv(ticker_file_path)

# 종목코드를 문자열로 변환하여 데이터 타입을 맞춤
data['종목코드'] = data['종목코드'].astype(str)
ticker_data['종목코드'] = ticker_data['종목코드'].astype(str)

# 지표별 조건 필터링
psr_filtered = data[(data['지표'] == 'PSR') & (data['값'] <= 0.1)]
per_filtered = data[(data['지표'] == 'PER') & (data['값'] <= 10)]
pcr_filtered = data[(data['지표'] == 'PCR') & (data['값'] <= 5)]

# 조건을 모두 만족하는 종목 코드 찾기
growth_stock_codes = set(psr_filtered['종목코드']) & set(per_filtered['종목코드']) & set(pcr_filtered['종목코드'])

# 조건을 만족하는 종목만 선택하고, 필요한 지표만 포함
filtered_data = data[(data['종목코드'].isin(growth_stock_codes)) & (data['지표'].isin(['PSR', 'PER', 'PCR']))]

# 테이블 재구성: 종목코드, 기준일을 인덱스로 두고 지표를 열로 변환
pivoted_data = filtered_data.pivot_table(index=['종목코드', '기준일'], columns='지표', values='값').reset_index()

# 종목코드 기준으로 종목명을 병합
pivoted_data = pivoted_data.merge(ticker_data[['종목코드', '종목명']], on='종목코드', how='left')

# 원하는 열 순서로 재정렬
pivoted_data = pivoted_data[['종목코드', '종목명', '기준일', 'PSR', 'PER', 'PCR']]

# 종목코드를 숫자로 변환한 후 오름차순 정렬
pivoted_data['종목코드'] = pivoted_data['종목코드'].astype(int)
pivoted_data = pivoted_data.sort_values(by='종목코드').reset_index(drop=True)

# 결과 테이블로 출력
display(pivoted_data)

# CSV 파일로 저장
output_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.csv"
pivoted_data.to_csv(output_file_path, index=False, encoding='utf-8-sig')


Unnamed: 0,종목코드,종목명,기준일,PSR,PER,PCR
0,140,하이트진로홀딩스,2024-07-03,0.0829,3.0299,1.7353
1,880,한화,2024-07-03,0.0389,-36.5951,0.5140
2,1040,CJ,2024-07-03,0.0805,3.6413,0.7014
3,1120,LX인터내셔널,2024-07-03,0.0808,6.9922,2.2895
4,1250,GS글로벌,2024-07-03,0.0735,6.8210,3.3179
...,...,...,...,...,...,...
67,143210,핸즈코퍼레이션,2024-07-03,0.0630,-0.5533,1.2587
68,151860,KG에코솔루션,2024-07-03,0.0516,1.7522,1.5160
69,267250,HD현대,2024-07-03,0.0918,3.8704,1.0587
70,267290,경동도시가스,2024-07-03,0.0644,3.8018,1.7695


In [35]:
import pandas as pd

# CSV 파일 읽기
csv_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.csv"
data = pd.read_csv(csv_file_path, delimiter="\t")  # 탭 구분자로 읽어오기

# JSON 파일로 저장하기
json_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"
data.to_json(json_file_path, orient="records", force_ascii=False, indent=4)

print(f"JSON 파일이 '{json_file_path}' 이름으로 저장되었습니다.")


JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json' 이름으로 저장되었습니다.


In [37]:
import json
import pandas as pd

# JSON 파일 경로
input_file = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"
output_file = r"C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json"

# JSON 파일 읽기
with open(input_file, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

# 문자열로 결합된 데이터를 분리하여 각 열로 변환
processed_data = []
for item in raw_data:
    values = list(item.values())[0].split(',')
    processed_data.append({
        "종목코드": int(values[0]),
        "종목명": values[1],
        "기준일": values[2],
        "PSR": float(values[3]),
        "PER": float(values[4]),
        "PCR": float(values[5])
    })

# DataFrame으로 변환 후 JSON으로 저장
df = pd.DataFrame(processed_data)
df.to_json(output_file, orient="records", force_ascii=False, indent=4)

print(f"필드별로 분리된 JSON 파일이 '{output_file}'에 저장되었습니다.")


필드별로 분리된 JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_growth_stocks.json'에 저장되었습니다.


In [None]:
import pandas as pd
from IPython.display import display

# CSV 파일 불러오기
value_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_value.csv"
ticker_file_path = r"C:\Users\82108\Desktop\dataprocess\kor_ticker.csv"

# 각각의 파일 불러오기
data = pd.read_csv(value_file_path)
ticker_data = pd.read_csv(ticker_file_path)

# 종목코드를 문자열로 변환하여 데이터 타입을 맞춤
data['종목코드'] = data['종목코드'].astype(str)
ticker_data['종목코드'] = ticker_data['종목코드'].astype(str)

# 지표별 조건 필터링
psr_filtered = data[(data['지표'] == 'PSR') & (data['값'] <= 1)]
per_filtered = data[(data['지표'] == 'PER') & (data['값'] <= 15) & (data['값'] >= 10)]
pcr_filtered = data[(data['지표'] == 'PCR') & (data['값'] <= 10)]
pcr_filtered = data[(data['지표'] == 'PBR') & (data['값'] <= 1)]

# 조건을 모두 만족하는 종목 코드 찾기
growth_stock_codes = set(psr_filtered['종목코드']) & set(per_filtered['종목코드']) & set(pcr_filtered['종목코드'])

# 조건을 만족하는 종목만 선택하고, 필요한 지표만 포함
filtered_data = data[(data['종목코드'].isin(growth_stock_codes)) & (data['지표'].isin(['PSR', 'PER', 'PCR', 'PBR']))]

# 테이블 재구성: 종목코드, 기준일을 인덱스로 두고 지표를 열로 변환
pivoted_data = filtered_data.pivot_table(index=['종목코드', '기준일'], columns='지표', values='값').reset_index()

# 종목코드 기준으로 종목명을 병합
pivoted_data = pivoted_data.merge(ticker_data[['종목코드', '종목명']], on='종목코드', how='left')

# 원하는 열 순서로 재정렬
pivoted_data = pivoted_data[['종목코드', '종목명', '기준일', 'PSR', 'PER', 'PCR', 'PBR']]

# 종목코드를 숫자로 변환한 후 오름차순 정렬
pivoted_data['종목코드'] = pivoted_data['종목코드'].astype(int)
pivoted_data = pivoted_data.sort_values(by='종목코드').reset_index(drop=True)

# 결과 테이블로 출력
display(pivoted_data)

# CSV 파일로 저장
output_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.csv"
pivoted_data.to_csv(output_file_path, index=False, encoding='utf-8-sig')

In [1]:
import pandas as pd

# CSV 파일 읽기
csv_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.csv"
data = pd.read_csv(csv_file_path, delimiter="\t")  # 탭 구분자로 읽어오기

# JSON 파일로 저장하기
json_file_path = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"
data.to_json(json_file_path, orient="records", force_ascii=False, indent=4)

print(f"JSON 파일이 '{json_file_path}' 이름으로 저장되었습니다.")

JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json' 이름으로 저장되었습니다.


In [2]:
import json
import pandas as pd

# JSON 파일 경로
input_file = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"
output_file = r"C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json"

# JSON 파일 읽기
with open(input_file, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

# 문자열로 결합된 데이터를 분리하여 각 열로 변환
processed_data = []
for item in raw_data:
    values = list(item.values())[0].split(',')
    processed_data.append({
        "종목코드": int(values[0]),
        "종목명": values[1],
        "기준일": values[2],
        "PSR": float(values[3]),
        "PER": float(values[4]),
        "PCR": float(values[5])
    })

# DataFrame으로 변환 후 JSON으로 저장
df = pd.DataFrame(processed_data)
df.to_json(output_file, orient="records", force_ascii=False, indent=4)

print(f"필드별로 분리된 JSON 파일이 '{output_file}'에 저장되었습니다.")

필드별로 분리된 JSON 파일이 'C:\Users\82108\Desktop\dataprocess\filtered_recovery_stocks.json'에 저장되었습니다.
