## 감성사전 참조하해서 감성 점수 반영하기

In [22]:
import pandas as pd
import numpy as np

In [23]:
from tqdm import tqdm
tqdm.pandas()

In [24]:
# Review 파일
df_2t = pd.read_csv('./data/review_data_2t_3.csv', encoding='utf-8')

In [25]:
df_adj_sentiment_2t =  pd.read_csv('./data/sentimental/sentimental_2t_adj.csv', encoding='cp949')

In [26]:
# 감성 점수 계산 함수
def calculate_sentiment_score(text):
    if pd.isna(text):
        return 0
    # 감성사전을 사전 형태로 변환
    score_dict = dict(zip(df_adj_sentiment_2t['단어'], df_adj_sentiment_2t['점수']))
    # 텍스트를 단어로 분리
    words = text.split()
    # 각 단어의 점수를 누적하여 합산
    score = sum(score_dict.get(word, 0) for word in words)
    
    # score가 NaN인 경우 0으로 반환
    if np.isnan(score):
        return 0
    else:
        return score
    

In [27]:
calculate_sentiment_score(df_2t.loc[15,'adj_stem'])

0

In [28]:
df_2t

Unnamed: 0,review,label,review2,adj,verb,noun,exclamation,adj_stem,verb_stem
0,?,문화,,,,,,,
1,친절해요,문화,친절해요,친절해요,,,,친절하다,
2,좋아요 만족스러워요,문화,좋아요 만족스러워요,좋아요 만족스러워요,,,,좋다 만족스럽다,
3,와우~~,문화,와우,,,와우,,,
4,굿,문화,굿,,,굿,,,
...,...,...,...,...,...,...,...,...,...
141249,설사를해서 병원갔어요 배를 만져보고 꼼꼼히 살펴보시더니 약은 안먹어도 되겠다고 하셔...,동물병원,설사를해서 병원갔어요 배를 만져보고 꼼꼼히 살펴보시더니 약은 안먹어도 되겠다고 하셔...,꼼꼼히 다행히 좋,해서 갔어요 만져 살펴보시더니 먹어도 되겠다고 하셔서 맞고 왔는데 졌어요,설사 병원 배 보고 약 주사 집 그다음 날,아,꼼꼼하다 다행하다 좋다,하다 가다 만지다 살펴보다 먹다 되다 하다 맞다 오다 지다
141250,저희 천사 데려온 곳이고 중성화부터 혈액검사까지 전부 세세하게 봐주셔서 늘 감사드립...,동물병원,저희 천사 데려온 곳이고 중성화부터 혈액검사까지 전부 세세하게 봐주셔서 늘 감사드립니다,,데려온 세세하게 봐주셔서 드립니다,저희 천사 곳 중성 혈액 검사 전부 늘 감사,,,데려오다 세다 보다 드리다
141251,친절하십니다,동물병원,친절하십니다,친절하십니다,,,,친절하다,
141252,진료 꼼꼼히 잘봐주세요 진료후 간식도 챙겨주시고 선생님께서 산책 가자고하니 요미가 ...,동물병원,진료 꼼꼼히 잘봐주세요 진료후 간식도 챙겨주시고 선생님께서 산책 가자고하니 요미가 ...,꼼꼼히 약발라주고 있는데,봐주세요 챙겨주시고 가자고하니 따라가네요 해주신 좋아졌어요,진료 진료 후 간식 선생님 산책 요미 처방 습진 약 눈꼽끼는,,꼼꼼하다 약바르다 있다,보다 챙기다 가다 따라가다 해주다 좋아지다


#### 각 텍스트의 감성 점수를 계산하여 새로운 열에 저장

In [None]:
df_1t['adj_score'] = df_1t['adj_stem'].progress_map(calculate_sentiment_score)
df_1t['verb_score'] = df_1t['verb_stem'].progress_map(calculate_sentiment_score)
df_1t['exclamation_score'] = df_1t['exclamation_stem'].progress_map(calculate_sentiment_score)

In [None]:
df_1t['score'] = df_1t['adj_score'] + df_1t['verb_score'] + df_1t['exclamation_score']

In [29]:
df_2t['adj_score'] = df_2t['adj_stem'].progress_map(calculate_sentiment_score)
df_2t['verb_score'] = df_2t['verb_stem'].progress_map(calculate_sentiment_score)
df_2t['exclamation_score'] = df_2t['exclamation'].progress_map(calculate_sentiment_score)

100%|████████████████████████████████████████████████████████████████████████| 141254/141254 [01:36<00:00, 1465.12it/s]
100%|████████████████████████████████████████████████████████████████████████| 141254/141254 [01:02<00:00, 2251.18it/s]
100%|███████████████████████████████████████████████████████████████████████| 141254/141254 [00:01<00:00, 86145.76it/s]


In [58]:
df_2t['score'] = df_2t['adj_score'] + df_2t['verb_score'] + df_2t['exclamation_score']

In [61]:
# df_2t.to_csv('data/sentimental/text.csv', index=False, encoding='utf-8-sig')

In [60]:
df_2t

Unnamed: 0,review,label,review2,adj,verb,noun,exclamation,adj_stem,verb_stem,adj_score,verb_score,exclamation_score,score
0,?,문화,,,,,,,,0.0,0.0,0.0,0.0
1,친절해요,문화,친절해요,친절해요,,,,친절하다,,2.0,0.0,0.0,2.0
2,좋아요 만족스러워요,문화,좋아요 만족스러워요,좋아요 만족스러워요,,,,좋다 만족스럽다,,4.0,0.0,0.0,4.0
3,와우~~,문화,와우,,,와우,,,,0.0,0.0,0.0,0.0
4,굿,문화,굿,,,굿,,,,0.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...
141249,설사를해서 병원갔어요 배를 만져보고 꼼꼼히 살펴보시더니 약은 안먹어도 되겠다고 하셔...,동물병원,설사를해서 병원갔어요 배를 만져보고 꼼꼼히 살펴보시더니 약은 안먹어도 되겠다고 하셔...,꼼꼼히 다행히 좋,해서 갔어요 만져 살펴보시더니 먹어도 되겠다고 하셔서 맞고 왔는데 졌어요,설사 병원 배 보고 약 주사 집 그다음 날,아,꼼꼼하다 다행하다 좋다,하다 가다 만지다 살펴보다 먹다 되다 하다 맞다 오다 지다,3.0,-1.0,0.0,2.0
141250,저희 천사 데려온 곳이고 중성화부터 혈액검사까지 전부 세세하게 봐주셔서 늘 감사드립...,동물병원,저희 천사 데려온 곳이고 중성화부터 혈액검사까지 전부 세세하게 봐주셔서 늘 감사드립니다,,데려온 세세하게 봐주셔서 드립니다,저희 천사 곳 중성 혈액 검사 전부 늘 감사,,,데려오다 세다 보다 드리다,0.0,0.0,0.0,0.0
141251,친절하십니다,동물병원,친절하십니다,친절하십니다,,,,친절하다,,2.0,0.0,0.0,2.0
141252,진료 꼼꼼히 잘봐주세요 진료후 간식도 챙겨주시고 선생님께서 산책 가자고하니 요미가 ...,동물병원,진료 꼼꼼히 잘봐주세요 진료후 간식도 챙겨주시고 선생님께서 산책 가자고하니 요미가 ...,꼼꼼히 약발라주고 있는데,봐주세요 챙겨주시고 가자고하니 따라가네요 해주신 좋아졌어요,진료 진료 후 간식 선생님 산책 요미 처방 습진 약 눈꼽끼는,,꼼꼼하다 약바르다 있다,보다 챙기다 가다 따라가다 해주다 좋아지다,1.0,0.0,0.0,1.0


In [62]:
df_2t.shape

(141254, 13)

In [67]:
df_2t[df_2t['score'] > 0 ].shape

(92736, 13)

In [66]:
df_2t[df_2t['score'] == 0 ].shape

(43795, 13)

In [68]:
df_2t[df_2t['score'] < 0 ].shape

(4723, 13)

In [None]:
df_3t['adj_score'] = df_3t['adj_stem'].progress_map(calculate_sentiment_score)
df_3t['verb_score'] = df_3t['verb_stem'].progress_map(calculate_sentiment_score)
df_3t['exclamation_score'] = df_3t['exclamation_stem'].progress_map(calculate_sentiment_score)

In [None]:
df_3t['score'] = df_3t['adj_score'] + df_3t['verb_score'] + df_3t['exclamation_score']