In [9]:
import os
import pandas as pd

# 현재 작업 디렉토리 경로를 가져옴
current_directory = os.getcwd()

# 사용자가 희망하는 열들 (예: 'like' 관련 열들)
desired_columns = ['view']  # 필요한 열 이름의 일부를 여기에 입력

# 경로에 있는 모든 파일 리스트 가져오기
file_names = [f for f in os.listdir(current_directory) if f.endswith('.csv')]

# 첫 번째 파일을 읽어와 date 열만 가져오기
first_file = pd.read_csv(os.path.join(current_directory, file_names[0]))
merged_df = first_file[['Date']].copy()  # Date 열만 복사

# 각 파일을 순차적으로 처리하며 병합
for file_name in file_names:
    # 파일 읽기
    df = pd.read_csv(os.path.join(current_directory, file_name))
    
    # 파일 이름에서 카테고리 번호 추출
    category_number = file_name.split('_')[1]
    
    # 사용자가 선택한 열들만 필터링 (date 열과 함께)
    filtered_columns = ['Date'] + [col for col in df.columns if any(desired in col for desired in desired_columns)]
    df_filtered = df[filtered_columns]
    
    # 각 열에 "카테고리번호_" 접두사 붙이기
    df_filtered.columns = ['Date'] + [f'{category_number}_{col}' for col in df_filtered.columns if col != 'Date']
    
    # Date를 기준으로 병합
    merged_df = pd.merge(merged_df, df_filtered, on='Date', how='outer')

# 최종 파일을 현재 디렉토리에 내보내기
output_file_path = os.path.join(current_directory, 'merged_output.csv')
merged_df.to_csv(output_file_path, index=False)

print(f"Merged file saved to {output_file_path}")


Merged file saved to C:\Users\saty1\Downloads\Saty_python\project1\result\result2\merged_output.csv


In [13]:
import os
import pandas as pd

# 현재 작업 디렉토리 경로를 가져옴
current_directory = os.getcwd()

# 사용자가 희망하는 열들 (예: 'like', 'view' 관련 열들)
desired_columns = ['view']  # 필요한 열 이름의 일부를 여기에 입력

# 경로에 있는 모든 파일 리스트 가져오기
file_names = [f for f in os.listdir(current_directory) if f.endswith('.csv')]

# 첫 번째 파일을 읽어와 date 열만 가져오기
first_file = pd.read_csv(os.path.join(current_directory, file_names[0]))
merged_df = first_file[['Date']].copy()  # Date 열만 복사

# 각 파일을 순차적으로 처리하며 병합
for file_name in file_names:
    # 파일 읽기
    df = pd.read_csv(os.path.join(current_directory, file_name))
    
    # 파일 이름에서 카테고리 번호 추출
    category_number = file_name.split('_')[1]
    
    # 사용자가 선택한 열들만 필터링 (date 열과 함께)
    filtered_columns = ['Date'] + [col for col in df.columns if any(desired in col for desired in desired_columns)]
    df_filtered = df[filtered_columns]
    
    # 각 열에 "카테고리번호_" 접두사 붙이기
    df_filtered.columns = ['Date'] + [f'{category_number}_{col}' for col in df_filtered.columns if col != 'Date']
    
    # Date를 기준으로 병합
    merged_df = pd.merge(merged_df, df_filtered, on='Date', how='outer')

# 카테고리별로 열을 그룹화하여 정규화
for category_number in set(col.split('_')[0] for col in merged_df.columns if col != 'Date'):
    category_columns = [col for col in merged_df.columns if col.startswith(f'{category_number}_')]
    
    # 그룹 내 최대값으로 정규화
    max_value = merged_df[category_columns].max().max()  # 그룹 내 모든 열에서 최대값 추출
    merged_df[category_columns] = merged_df[category_columns] / max_value  # 정규화

# 최종 파일을 현재 디렉토리에 내보내기
output_file_path = os.path.join(current_directory, 'merged_normalized_output.csv')
merged_df.to_csv(output_file_path, index=False)

print(f"Merged and normalized file saved to {output_file_path}")


Merged and normalized file saved to C:\Users\saty1\Downloads\Saty_python\project1\result\result2\merged_normalized_output.csv


In [26]:
import os
import pandas as pd

# 현재 작업 디렉토리 경로를 가져옴
current_directory = os.getcwd()

# 사용자가 희망하는 열들 (예: 'like', 'view' 관련 열들)
desired_columns = ['view']  # 필요한 열 이름의 일부를 여기에 입력

# 경로에 있는 모든 파일 리스트 가져오기
file_names = [f for f in os.listdir(current_directory) if f.endswith('.csv')]

# 첫 번째 파일을 읽어와 date 열만 가져오기
first_file = pd.read_csv(os.path.join(current_directory, file_names[0]))
merged_df = first_file[['Date']].copy()  # Date 열만 복사

# 카테고리 번호를 정렬하기 위해 딕셔너리로 파일 이름과 번호를 매핑
file_dict = {int(file_name.split('_')[1]): file_name for file_name in file_names}

# 카테고리 번호를 정렬
sorted_categories = sorted(file_dict.keys())

# 각 파일을 순차적으로 처리하며 병합
for category_number in sorted_categories:
    file_name = file_dict[category_number]
    
    # 파일 읽기
    df = pd.read_csv(os.path.join(current_directory, file_name))
    
    # 사용자가 선택한 열들만 필터링 (date 열과 함께)
    filtered_columns = ['Date'] + [col for col in df.columns if any(desired in col for desired in desired_columns)]
    df_filtered = df[filtered_columns]
    
    # 각 열에 "카테고리번호_" 접두사 붙이기
    df_filtered.columns = ['Date'] + [f'{category_number}_{col}' for col in df_filtered.columns if col != 'Date']
    
    # Date를 기준으로 병합
    merged_df = pd.merge(merged_df, df_filtered, on='Date', how='outer')

# 카테고리별로 열을 그룹화하여 정규화
for category_number in sorted_categories:
    category_columns = [col for col in merged_df.columns if col.startswith(f'{category_number}_')]
    
    # 그룹 내 최대값으로 정규화
    max_value = merged_df[category_columns].max().max()  # 그룹 내 모든 열에서 최대값 추출
    merged_df[category_columns] = merged_df[category_columns] / max_value  # 정규화

# 최종 파일을 현재 디렉토리에 내보내기
output_file_path = os.path.join(current_directory, 'merged_normalized_output.csv')
merged_df.to_csv(output_file_path, index=False)

print(f"Merged and normalized file saved to {output_file_path}")


Merged and normalized file saved to C:\Users\saty1\Downloads\Saty_python\project1\result\result2\merged_normalized_output.csv


In [15]:
import os
import pandas as pd

# 현재 작업 디렉토리 경로를 가져옴
current_directory = os.getcwd()

# 경로에 있는 모든 파일 리스트 가져오기
file_names = [f for f in os.listdir(current_directory) if f.endswith('.csv')]

# 첫 번째 파일을 읽어와 date 열만 가져오기
first_file = pd.read_csv(os.path.join(current_directory, file_names[0]))
merged_df = first_file[['Date']].copy()  # Date 열만 복사

# total_view, total_like, total_comments 열을 추가
merged_df['total_view'] = 0
merged_df['total_like'] = 0
merged_df['total_comments'] = 0

# 각 파일을 순차적으로 처리하며 합산
for file_name in file_names:
    # 파일 읽기
    df = pd.read_csv(os.path.join(current_directory, file_name))
    
    # 'original'이 포함된 view, like, comments 관련 열들만 필터링
    view_columns = [col for col in df.columns if 'view_Original' in col]
    like_columns = [col for col in df.columns if 'like_Original' in col]
    comments_columns = [col for col in df.columns if 'num_Original' in col]

    # Date를 기준으로 병합
    merged_df = pd.merge(merged_df, df[['Date']], on='Date', how='outer')
    
    # 합산하여 total 열에 더해줌
    merged_df['total_view'] += df[view_columns].sum(axis=1)
    merged_df['total_like'] += df[like_columns].sum(axis=1)
    merged_df['total_comments'] += df[comments_columns].sum(axis=1)

# 최종 파일을 현재 디렉토리에 내보내기
output_file_path = os.path.join(current_directory, 'merged_total_original_output.csv')
merged_df.to_csv(output_file_path, index=False)

print(f"Merged and summarized original values file saved to {output_file_path}")


Merged and summarized original values file saved to C:\Users\saty1\Downloads\Saty_python\project1\result\result2\merged_total_original_output.csv
