In [1]:
import pandas as pd
import numpy as np

def create_sentiment_dictionary(csv_file):
    sentiment_dict = {}
    df = pd.read_csv(csv_file)
    for index, row in df.iterrows():
        word = row['word']
        polarity = row['polarity']
        sentiment_dict[word] = polarity
    return sentiment_dict

def calculate_sentiment_score(text, sentiment_dict):
    if isinstance(text, str):
        words = text.split()
        sentiment_score = 0
        for word in words:
            if word in sentiment_dict:
                sentiment_score += sentiment_dict[word]
        return sentiment_score
    else:
        return np.nan

# 기존 사전 생성
csv_file_dict = '감성 사전.csv'
sentiment_dictionary = create_sentiment_dictionary(csv_file_dict)

# 새로운 CSV 파일 로드
csv_file_new = 'crawl_pfizer_extract.csv'
df_new = pd.read_csv(csv_file_new)

# "sentiment" 컬럼 추가
df_new['sentiment'] = df_new['댓글 내용'].apply(lambda x: calculate_sentiment_score(x, sentiment_dictionary))

# "긍부정" 열 생성
df_new['긍부정'] = np.where(df_new['sentiment'] > 0, 1, np.where(df_new['sentiment'] < 0, -1, 0))

# 결과를 새로운 CSV 파일로 저장 (UTF-8-SIG 인코딩)
output_csv_file = csv_file_new.split('.')[0] + '_Sentiment.csv'
df_new.to_csv(output_csv_file, index=False, encoding='utf-8-sig')

print("긍부정 열이 추가된 데이터가 {} 파일로 저장되었습니다.".format(output_csv_file))


긍부정 열이 추가된 데이터가 crawl_pfizer_extract_Sentiment.csv 파일로 저장되었습니다.


In [12]:
import pandas as pd
import os

file_path = "crawl_Janssen_extract_Sentiment.csv"
file_name = os.path.splitext(file_path)[0]  # 파일명에서 확장자 제거

data = pd.read_csv(file_path)

data = data.rename(columns={"긍부정": "긍정"})
positive_data = data[data["긍정"] == 1]

new_file_name = file_name + "_pos_data.csv"

positive_data.to_csv(new_file_name, index=False, encoding="utf-8-sig")
