## 긍정부분 감정분석

In [10]:
import numpy as np
import pandas as pd


def neg_counter(data):
    negative_n = 0
    neg_front_search = ['보이지', '아깝다', '충분하다않다', '더자세하다', '더좋다', '아쉽다',
                        '쓸데없다', '느리다', '빠르다', '면 좋다', '좋다것같다', '안되다',
                        '헤메다', ' 좋다듯하다', '부족하다', '더들어가다', '어렵다', '비싸', '빠르다것같다', '자주나가다', '그만',
                        '너무늦다', '부족하다', '부분', '당황', '안타깝다']

    neg_back_search = ['다만', '없다', '그런데', '충분하다않다', '조금 더', '근데', '쓸데없다', '솔직', '너무짧다']

    neg_binary_search = ['실망', '부족', '버거운', '것같다', '좋다것같다', '단점', '너무짧다', '어렵다',
                         '때문에', '보완', '섬세', '너무많다', '무리', '않다', '기다']

    # 실망 댓글에서 분류하기 위한 3가지 카테고리 => 영상 품질 실망, 컨텐츠 내용 실망, 재료 관련 실망 카테고리
    neg_video_accord = ['버퍼링', '화질', '속도', '빠르다', '짧다', '보이지않다', '놓치다', '오류', '어둡다', '어두워지다',
                        '안들리다', '보이지', '안보이', '영상', '진도', '뚝뚝', '버퍼링', '스킵', '모양', '안들리다', '세밀',
                        '사이트', '과정', '하단', '확대', '보기', '감기', '초점', '안보이', '화질', '목소리', '평가',
                        '어두워지다', '클로즈업', '안보', '가까이', '화면', '모션', '자막', '오류', '각도']

    neg_content_accord = ['힘들다', '어렵다', '구체적', '헷갈', '반복되다', '환기', '진행', '해소가', '뒤죽박죽',
                          '안나오다', '각인', '장식', '단어', '돈', '작품', '답', '답장', '설명', '방법', '듣기', '교재', '이해', '비용', '힘들다',
                          '어렵다', '깊이', '용이', '초보자', '피드백', '수업', '빠르다', '속도', '시간', '내용', '만들기', '답변', '정보', '진행',
                          '기법', '너무짧다', '강의', '반복되다', '예시', '처음', '앞']

    neg_material_accord = ['촌스럽다', '얇다', '상품', '안오다', '구슬', '준비물', '분량',
                           '패키지', '안오다', '제품', '구성', '주문', '재료', '프린터']

    neg_weight_word = ['다만', '그런데', '충분하다않다', '조금 더', '근데', '쓸데없다', '어렵다', '안타깝다', '좋다것같다',
                       '아쉽다', '더필요하다', '조금불편하다']

    neg_word_list_zip = [neg_front_search, neg_back_search, neg_binary_search,
                         neg_video_accord, neg_content_accord, neg_material_accord]

    for neg_word_list in neg_word_list_zip:
        for neg_word in neg_word_list:
            if neg_word in data:
                if neg_word in neg_weight_word:
                    negative_n += 6
                else:
                    negative_n += 1

    return negative_n


def pos_counter(data):
    positive_n = 0
    pos_front_search = ['빠르다', '감사', '알차다', '만족도', '성취감', '따르다', '구체적으로', '쉬다', '아주',
                        '자세하다', '알게', '좋다', '배우다', '꼼꼼하다', '쉽다', '피드백을', '가르치다', '따르다',
                        '뿌듯', '좋다']

    pos_back_search = ['빠르다', '감사', '알차다', '만족도', '성취감', '따르다', '구체적으로', '쉬다', '아주',
                       '자세하다', '알게', '좋다', '배우다', '꼼꼼하다', '쉽다', '피드백을', '가르치다', '따르다', '최고']

    # 긍정 댓글에서 분류하기 위한 2가지 카테고리 => 영상 설명, 결과물 만족 2가지 카테고리

    pos_content_accord = ['댓글', '답변', '친절', '정보', '팁', '성취', '설명', '피드백', '꼼꼼', '차분', '자세히', '차근차근',
                          '디테일', '기법', '상세', '강의', '이해', '자세', '쉽다', '다양', '실용', '알차다', '구체',
                          '노하우', '알차다']

    pos_product_accord = ['결과물', '디자인', '스타일', '퀄리티', '작품']

    pos_weight_word = ['최고', '너무 좋다', '뿌듯', '꼼꼼']

    pos_word_list_zip = [pos_front_search, pos_back_search, pos_content_accord, pos_product_accord]
    for pos_word_list in pos_word_list_zip:
        for pos_word in pos_word_list:
            if pos_word in data:
                if pos_word in pos_weight_word:
                    positive_n += 5
                else:
                    positive_n += 1

    return positive_n


def return_sentiment(data, weight_score):
    pos_score = pos_counter(data)
    neg_score = neg_counter(data)
    try:
        sentiment_percent = np.round((pos_score / (neg_score + pos_score)) * 100, 2)
    except:
        return 0, 0, 0, 'not enough data'

    if sentiment_percent > weight_score:
        return pos_score, neg_score, sentiment_percent, 'good'
    else:
        return pos_score, neg_score, sentiment_percent, 'sorry'


reviewList = pd.read_excel('./stemming_good_review(row_2774).xlsx', engine='openpyxl')
reviewList.drop(reviewList.loc[reviewList.review.isna()].index, axis=0, inplace=True)
reviewList.reset_index(inplace=True)
reviewList.drop('index', axis=1, inplace=True)

data_n = 0
correct_n = 0
fail_n = 0
not_correct_n = 0


print('<제대로 분석이 된 댓글들>\n')
for i in range(len(reviewList)):
    review = reviewList.iloc[i, 1]
    pos_score, neg_score, sent_per, sentiment = return_sentiment(review, 48)
    data_n += 1
    if sentiment == 'good':
        correct_n += 1


    elif sentiment == 'not enough data':
        not_correct_n += 1
        continue
    else:
        fail_n += 1
        print(review, i)

print('\n----------------------------긍정에 대한 감정분석 결과-------------------------------------')
print('전체 데이터 수: {}\n정확히 분류된 댓글: {}\n잘못 분류된 댓글: {}\n분류 정확도: {}%'.format(data_n, correct_n, fail_n, np.round(
    100 * correct_n / (correct_n + fail_n))))

# pos_score, neg_score, sent_per, sentiment =\
#     return_sentiment('작가님의 강의는 꼼꼼하다차다 좋다다른 클래스와 다르다준비물을 구매하다 않다 똑같이만들기는 쉬다 않다 . 사이즈도 안나오다 있다, 패턴만 따로구매도 안되다 하니 좀아쉽다. ㅠㅠ', 49)
# print(pos_score, neg_score, sent_per, sentiment)


<제대로 분석이 된 댓글들>

혼자 방 구석 서치만으로 자세하다알다 어렵다부분들까지 알다 좋다 17
차분하다알다 쉬다 천천히 설명하다 주시니까 만들다 과정이 어렵다않다  23
신기하다재다 내용이 많다 43
기본적인 것부터 알다 때문에 기초가 탄탄하다잡히다 아무 것도 모르다 기 본명칭부터 배우니까 다른 것들이 눈에 들어오다 시작하고 기존에 제가 사용하다 악세사리를 더 유심히 보다 되다 아직 궁금하다 많다배우다 싶다 많다프랑꼬를 통해 더 알아 갈다 생각이다저같이 아무 것도 모르다 분들취미로 여럽지 않다 배우다 싶다 분들이나 창업을 생각하다 분들도 도움이 되다 것같다고민하다 말다 주얼리 테라 피하다  49
제게는 많다의미를 가지게 되다 클래스이다 같다다른것은 차다 일단 집중과 다른 잡념들도 없애다 만들다 시간 내내즐겁다 51
다양하다기법을 이용한 악세사리 만들기에 이다 어렵다동선 말이까지 배우다 있다 좋다 52
손에 익숙하다않다 도구를 잡다 방법 등을 알다 만들다 성취 감이 생기다  54
여러가지 기법을 알다 있다세밀한 수업이다  61
악세사리의 품격을 업그레이드시키다 있다수업이다 62
너무 재미있다ㅎㅎ마지막 수업까지 빨리 듣다 싶다 ㅎ 63
부분 부분어렵다작업도 있다하작품이 하나 하나 완성되어다 때에 성취 감과 뿌듯하다너무 좋다 68
같다재료들로 여러가지 느낌의 주얼리를 만들다 수있다만들다 때마다 놀랍다한가지만 배우다 여러가지를 응용하다 수있다수업도 너무 재밌다 69
어렵다막히다 부분에 대해서 질문하다 늘알다 쉬다 설명해주다 개운하다마음이 듭니다 그리고색상을 알다 재미가 있다 78
색이 아직도 명확하다인식되다 않다 갈수록 공부하다 하다 더많아지다 느낌이다 79
역시 선생님 강의는 명쾌하다자다 들다 지루하다않다 여러번 반복하다 조색 마스터하다  82
차분하다분위기가 클래스 특성과 일단너무 잘맞다필기로 하다 이론 수업이 아니다직접 스티커로 붙이다 보다 체험해보다 진행하다 수업이라 지루하다않다  85
섞다 쓸다 때 먼저 색이 보이지않다 하다 앞에 칼라를 비교하다 섞다 

## 부정부분 감성분석

In [11]:
import numpy as np
import pandas as pd


def neg_counter(data):
    negative_n = 0
    neg_front_search = ['보이지', '아깝다', '충분하다않다', '더자세하다', '더좋다', '아쉽다',
                        '쓸데없다', '느리다', '빠르다', '면 좋다', '좋다것같다', '안되다',
                        '헤메다', ' 좋다듯하다', '부족하다', '더들어가다', '어렵다', '비싸', '빠르다것같다', '자주나가다', '그만',
                        '너무늦다', '부족하다', '부분', '당황', '안타깝다']

    neg_back_search = ['다만', '없다', '그런데', '충분하다않다', '조금 더', '근데', '쓸데없다', '솔직', '너무짧다']

    neg_binary_search = ['실망', '부족', '버거운', '것같다', '좋다것같다', '단점', '너무짧다', '어렵다',
                         '때문에', '보완', '섬세', '너무많다', '무리', '않다', '기다']

    # 실망 댓글에서 분류하기 위한 3가지 카테고리 => 영상 품질 실망, 컨텐츠 내용 실망, 재료 관련 실망 카테고리
    neg_video_accord = ['버퍼링', '화질', '속도', '빠르다', '짧다', '보이지않다', '놓치다', '오류', '어둡다', '어두워지다',
                        '안들리다', '보이지', '안보이', '영상', '진도', '뚝뚝', '버퍼링', '스킵', '모양', '안들리다', '세밀',
                        '사이트', '과정', '하단', '확대', '보기', '감기', '초점', '안보이', '화질', '목소리', '평가',
                        '어두워지다', '클로즈업', '안보', '가까이', '화면', '모션', '자막', '오류', '각도']

    neg_content_accord = ['힘들다', '어렵다', '구체적', '헷갈', '반복되다', '환기', '진행', '해소가', '뒤죽박죽',
                          '안나오다', '각인', '장식', '단어', '돈', '작품', '답', '답장', '설명', '방법', '듣기', '교재', '이해', '비용', '힘들다',
                          '어렵다', '깊이', '용이', '초보자', '피드백', '수업', '빠르다', '속도', '시간', '내용', '만들기', '답변', '정보', '진행',
                          '기법', '너무짧다', '강의', '반복되다', '예시', '처음', '앞']

    neg_material_accord = ['촌스럽다', '얇다', '상품', '안오다', '구슬', '준비물', '분량',
                           '패키지', '안오다', '제품', '구성', '주문', '재료', '프린터']

    neg_weight_word = ['다만', '그런데', '충분하다않다', '조금 더', '근데', '쓸데없다', '어렵다', '안타깝다', '좋다것같다',
                       '아쉽다', '더필요하다', '조금불편하다']

    neg_word_list_zip = [neg_front_search, neg_back_search, neg_binary_search,
                         neg_video_accord, neg_content_accord, neg_material_accord]

    for neg_word_list in neg_word_list_zip:
        for neg_word in neg_word_list:
            if neg_word in data:
                if neg_word in neg_weight_word:
                    negative_n += 6
                else:
                    negative_n += 1

    return negative_n


def pos_counter(data):
    positive_n = 0
    pos_front_search = ['빠르다', '감사', '알차다', '만족도', '성취감', '따르다', '구체적으로', '쉬다', '아주',
                        '자세하다', '알게', '좋다', '배우다', '꼼꼼하다', '쉽다', '피드백을', '가르치다', '따르다',
                        '뿌듯', '좋다']

    pos_back_search = ['빠르다', '감사', '알차다', '만족도', '성취감', '따르다', '구체적으로', '쉬다', '아주',
                       '자세하다', '알게', '좋다', '배우다', '꼼꼼하다', '쉽다', '피드백을', '가르치다', '따르다', '최고']

    # 긍정 댓글에서 분류하기 위한 2가지 카테고리 => 영상 설명, 결과물 만족 2가지 카테고리

    pos_content_accord = ['댓글', '답변', '친절', '정보', '팁', '성취', '설명', '피드백', '꼼꼼', '차분', '자세히', '차근차근',
                          '디테일', '기법', '상세', '강의', '이해', '자세', '쉽다', '다양', '실용', '알차다', '구체',
                          '노하우', '알차다']

    pos_product_accord = ['결과물', '디자인', '스타일', '퀄리티', '작품']

    pos_weight_word = ['최고', '너무 좋다', '뿌듯', '꼼꼼']

    pos_word_list_zip = [pos_front_search, pos_back_search, pos_content_accord, pos_product_accord]
    for pos_word_list in pos_word_list_zip:
        for pos_word in pos_word_list:
            if pos_word in data:
                if pos_word in pos_weight_word:
                    positive_n += 5
                else:
                    positive_n += 1

    return positive_n


def return_sentiment(data, weight_score):
    pos_score = pos_counter(data)
    neg_score = neg_counter(data)
    try:
        sentiment_percent = np.round((pos_score / (neg_score + pos_score)) * 100, 2)
    except:
        return 0, 0, 0, 'not enough data'

    if sentiment_percent > weight_score:
        return pos_score, neg_score, sentiment_percent, 'good'
    else:
        return pos_score, neg_score, sentiment_percent, 'sorry'


reviewList = pd.read_excel('./stemming_sorry_review.xlsx', engine='openpyxl')
reviewList.drop(reviewList.loc[reviewList.review.isna()].index, axis=0, inplace=True)
reviewList.reset_index(inplace=True)
reviewList.drop('index', axis=1, inplace=True)

data_n = 0
correct_n = 0
fail_n = 0
not_correct_n = 0


print('<제대로 분석이 된 댓글들>\n')
for i in range(len(reviewList)):
    review = reviewList.iloc[i, 1]
    pos_score, neg_score, sent_per, sentiment = return_sentiment(review, 48)
    data_n += 1
    if sentiment == 'sorry':
        correct_n += 1


    elif sentiment == 'not enough data':
        not_correct_n += 1
        continue
    else:
        fail_n += 1
        print(review, i)

print('\n----------------------------긍정에 대한 감정분석 결과-------------------------------------')
print('전체 데이터 수: {}\n정확히 분류된 댓글: {}\n잘못 분류된 댓글: {}\n분류 정확도: {}%'.format(data_n, correct_n, fail_n, np.round(
    100 * correct_n / (correct_n + fail_n))))

# pos_score, neg_score, sent_per, sentiment =\
#     return_sentiment('작가님의 강의는 꼼꼼하다차다 좋다다른 클래스와 다르다준비물을 구매하다 않다 똑같이만들기는 쉬다 않다 . 사이즈도 안나오다 있다, 패턴만 따로구매도 안되다 하니 좀아쉽다. ㅠㅠ', 49)
# print(pos_score, neg_score, sent_per, sentiment)


<제대로 분석이 된 댓글들>

입문 용으로 설명을 쉬다 해주다 좋다하지만마을지 기분이 미숙한 부분이 많이보여서 아쉽다 32
빠지다 제품 때문에 시간이 걸리다 기도하다 다른분들보내다 땐 체크하다 자다 보내다 정말완벽하다거예 요너무재밌다 쉽다강의이다  38
열심히해주다 중간 중간 좀 더 상세히설명하다 주다 좋다텐데아쉽다 40
친절하다 좋다속도가 조금빨르다요ㅠㅠ 48
아주자세하다알다 것은 좋다부분이다하지만처음 주신 장비들중에 날이 안서다 있다구두 칼 일지 비베다 펀치 등은 보완하다 하다  61
날대다 잇다 하다 때 좀 더자세하다설명해주다 좀 더좋다거같다요 하나 작품이 끝나다 때 좀엉성하다부분이 생기다 조금아쉽다웟어요 ㅜ그래도처음 작품을 제 손으로 만들다 되다 너무좋다일끝나다 구라 타다 공예하다 게 지금은 취미가 됫어요 만들다 자다 때가 제일뿌듯하다 65
처음 강의에서 하라는 대로하다 갑자기 다시 처음으로 가다 하다 차다 맷어요 ㅠㅠㅠ처음부터 31로보이다 주심이 좋다거같다ㅠㅠ 66
전반적으로 만족하다진도가 너무느리다비슷비슷하다강의가 반복되다 느낌이에요 좀 더 강의 내용이 다양하다 좋다평소궁금하다것들을 배우다 수있다 좋다 73
알아듣다 쉽다설명과 다소 무난하다 따르다 하다 수있다작품들인 것같다다만바라다 게있다응용 법이 좀 더있다 좋다 80
젛아요 피드백 좀그만하다싶다 용 클래스는 너무좋다이게 너무별로에요 너무 너무ㅜㅜ 88
꼼꼼하다설명을 잘하다 주시기는 하나자세하다보아야 하다 부분이 자다 보이지않다 점이 조금아쉽다 103
동영상이 좀 뒤죽박죽인 느낌ㅜㅜㅜ저만그렇다모르다 일단 동영상하다 번 쭉다보다 뒤에 다시 보기로 시작하다 게좋다듯 105
자세하다설명해주다 따르다 하다 쉽다개인 스케치까지 같이보다 줄알다 그 부분은 완강 후알다 작업하다 거라 아쉽다그 목적이 가장크다 강좌 타이틀이 조금 과장되다 듯하다  108
차분하다설명이 차다 좋다건의 사항있다플레이하다 작업따르다 위해멈추다 영상 한가운데붉다은색 화살표가 나오다 요 참고하다 화면이 가려지다 표현법을 자세하다볼 때아쉽다