In [1]:
import sys
sys.path.append("../")

In [2]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from janome.tokenizer import Tokenizer

In [3]:
from auto_polar.lib.predict_polarity import PolarEstimator, Dict1, Dict2
from auto_polar.lib import load_dictionary

In [4]:
dict1_df = pd.read_csv("../data/dictionary1.txt", sep="\t", header=None)
dict1_df.columns = ["word", "score", "description"]
dict1_df

Unnamed: 0,word,score,description
0,２，３日,e,〜である・になる（状態）客観
1,10%,e,〜である・になる（状態）客観
2,100%,e,〜である・になる（状態）客観
3,25%,e,〜である・になる（状態）客観
4,80%,e,〜である・になる（状態）客観
...,...,...,...
13309,魏,e,〜に行く（場所）
13310,魑魅魍魎,n,〜である・になる（状態）客観
13311,鮑,e,〜である・になる（状態）客観
13312,鹹味,e,〜である・になる（評価・感情）主観


In [5]:
dict1_df["score"].value_counts()

score
n       4958
e       4954
p       3352
?p?n      35
?e         4
a          4
o          3
?p         2
?p?e       1
　          1
Name: count, dtype: int64

In [6]:
with open("../data/data.txt", "r", encoding="UTF-8") as f:
    inputs = f.readlines()

In [7]:
for token in Tokenizer().tokenize(inputs[1]):
    print(token)
    print(token.surface)
    print(token.base_form)

友達	名詞,一般,*,*,*,*,友達,トモダチ,トモダチ
友達
友達
と	助詞,並立助詞,*,*,*,*,と,ト,ト
と
と
映画	名詞,一般,*,*,*,*,映画,エイガ,エイガ
映画
映画
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
を
を
見	動詞,自立,*,*,一段,連用形,見る,ミ,ミ
見
見る
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
に
に
行っ	動詞,自立,*,*,五段・カ行促音便,連用タ接続,行く,イッ,イッ
行っ
行く
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
た
た
けど	助詞,接続助詞,*,*,*,*,けど,ケド,ケド
けど
けど
、	記号,読点,*,*,*,*,、,、,、
、
、
感動	名詞,サ変接続,*,*,*,*,感動,カンドウ,カンドー
感動
感動
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
し
する
て	助詞,接続助詞,*,*,*,*,て,テ,テ
て
て
泣い	動詞,自立,*,*,五段・カ行イ音便,連用タ接続,泣く,ナイ,ナイ
泣い
泣く
ちゃっ	動詞,非自立,*,*,五段・ワ行促音便,連用タ接続,ちゃう,チャッ,チャッ
ちゃっ
ちゃう
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
た
た
。	記号,句点,*,*,*,*,。,。,。
。
。


In [8]:
dict1 = load_dictionary.load_dict1("../data/dictionary1.txt")
dict2 = load_dictionary.load_dict2("../data/dictionary2.txt")

In [9]:
polar_estimator = PolarEstimator(Dict1(dict1), Dict2(dict2))

In [10]:
polar_estimator.estimate_v1(inputs[0], verbose=True)

text: 雨が降ってるから気分が落ち込む。早く晴れてほしいな。

[dict1]  雨 0
[dict1]  気分 0


0

In [11]:
polar_estimator.estimate_v2(inputs[0], verbose=True)

text: 雨が降ってるから気分が落ち込む。早く晴れてほしいな。

[dict1]  雨 0
[dict1]  気分 0
[dict2]  ['落ち込む'] -1
[dict2]  ['晴れる'] 1


0

In [12]:
for text in inputs:
    print(polar_estimator.estimate_v1(text, verbose=True))
    print()

text: 雨が降ってるから気分が落ち込む。早く晴れてほしいな。

[dict1]  雨 0
[dict1]  気分 0
0

text: 友達と映画を見に行ったけど、感動して泣いちゃった。

[dict1]  友達 1
[dict1]  感動 1
2

text: 新しい仕事が始まって緊張するけど、頑張りたい。

[dict1]  仕事 0
[dict1]  緊張 -1
-1

text: 美味しいケーキを食べて、幸せな気持ちになった。

[dict1]  幸せ 1
[dict1]  気持ち 1
2

text: ペットが病気になって心配でたまらない。早く元気になって。

[dict1]  ペット 0
[dict1]  病気 -1
[dict1]  心配 -1
[dict1]  元気 1
-1

text: 家族と一緒に過ごす時間がとても楽しかった。

[dict1]  一緒 1
[dict1]  時間 0
1

text: 仕事でミスをして上司に叱られてしまった。反省しないと。

[dict1]  仕事 0
[dict1]  ミス -1
[dict1]  反省 0
-1

text: 旅行の計画を立てているときが一番ワクワクする。

[dict1]  旅行 1
[dict1]  一番 1
2

text: 久しぶりに会った友達と話して、元気が出た。

[dict1]  久しぶり 0
[dict1]  友達 1
[dict1]  元気 1
2

text: 電車が遅れてイライラするけど、仕方がない。

0

text: 新しい趣味を見つけて、毎日が楽しい。

[dict1]  趣味 0
0

text: 彼氏とのデートで素敵なレストランに行って幸せ。

[dict1]  デート 1
[dict1]  素敵 1
[dict1]  幸せ 1
3

text: 今日も一日がんばった。自分を褒めたい気分。

[dict1]  自分 0
[dict1]  気分 0
0

text: 雨の日はどうしても気分が沈んでしまう。

[dict1]  雨 0
[dict1]  気分 0
0

text: 大好きな音楽を聴くと気分が明るくなる。

[dict1]  大好き 1
[dict1]  気分 0
1

text: 試験の結果が悪くて、落ち込んでしまった。

[dict1]  試

In [13]:
for text in inputs:
    print(polar_estimator.estimate_v2(text, verbose=True))
    print()

text: 雨が降ってるから気分が落ち込む。早く晴れてほしいな。

[dict1]  雨 0
[dict1]  気分 0
[dict2]  ['落ち込む'] -1
[dict2]  ['晴れる'] 1
0

text: 友達と映画を見に行ったけど、感動して泣いちゃった。

[dict1]  友達 1
[dict1]  感動 1
2

text: 新しい仕事が始まって緊張するけど、頑張りたい。

[dict1]  仕事 0
[dict1]  緊張 -1
[dict2]  ['頑張る'] 1
0

text: 美味しいケーキを食べて、幸せな気持ちになった。

[dict1]  幸せ 1
[dict1]  気持ち 1
[dict2]  ['美味しい'] 1
3

text: ペットが病気になって心配でたまらない。早く元気になって。

[dict1]  ペット 0
[dict1]  病気 -1
[dict1]  心配 -1
[dict1]  元気 1
-1

text: 家族と一緒に過ごす時間がとても楽しかった。

[dict1]  一緒 1
[dict1]  時間 0
[dict2]  ['楽しい'] 1
2

text: 仕事でミスをして上司に叱られてしまった。反省しないと。

[dict1]  仕事 0
[dict1]  ミス -1
[dict1]  反省 0
-1

text: 旅行の計画を立てているときが一番ワクワクする。

[dict1]  旅行 1
[dict1]  一番 1
[dict2]  ['わくわく'] 1
3

text: 久しぶりに会った友達と話して、元気が出た。

[dict1]  久しぶり 0
[dict1]  友達 1
[dict1]  元気 1
2

text: 電車が遅れてイライラするけど、仕方がない。

[dict2]  ['遅れる'] -1
[dict2]  ['仕方', 'が', 'ない'] -1
-2

text: 新しい趣味を見つけて、毎日が楽しい。

[dict1]  趣味 0
[dict2]  ['楽しい'] 1
1

text: 彼氏とのデートで素敵なレストランに行って幸せ。

[dict1]  デート 1
[dict1]  素敵 1
[dict1]  幸せ 1
3

text: 今日も一日がんばった。自分を褒めたい気分。

In [14]:
polar_estimator.estimate_v4("電車が遅れてイライラするけど、仕方がない。", verbose=True)

電車	名詞,一般,*,*,*,*,電車,デンシャ,デンシャ 名詞
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ 助詞
遅れ	動詞,自立,*,*,一段,連用形,遅れる,オクレ,オクレ 動詞
て	助詞,接続助詞,*,*,*,*,て,テ,テ 助詞
イライラ	副詞,助詞類接続,*,*,*,*,イライラ,イライラ,イライラ 副詞
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 動詞
けど	助詞,接続助詞,*,*,*,*,けど,ケド,ケド 助詞
h
text: 電車が遅れてイライラする
[dict2]  ['遅れる'] -1
[e_v3]"電車が遅れてイライラする":-1
[e_v4]"電車が遅れてイライラする":-1*"けど":-1
、	記号,読点,*,*,*,*,、,、,、 記号
仕方	名詞,ナイ形容詞語幹,*,*,*,*,仕方,シカタ,シカタ 名詞
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ 助詞
ない	形容詞,自立,*,*,形容詞・アウオ段,基本形,ない,ナイ,ナイ 形容詞
。	記号,句点,*,*,*,*,。,。,。 記号
text: けど、仕方がない。
[dict2]  ['仕方', 'が', 'ない'] -1
[e_v3]"けど、仕方がない。":-1
[e_v4]"けど、仕方がない。":-1


0

In [15]:
with open("../data/data_ans.txt", "r", encoding="UTF-8") as f:
    data_text_with_ans = f.readlines()
l_pol_and_text=[]
for l in data_text_with_ans:
    pol_and_text=l.split(" ")
    pol_and_text[1]=pol_and_text[1].replace("\n","")
    
    l_pol_and_text.append(pol_and_text)
def pol_to_sign(pol:str)->int:
    if(pol=="e"):
        return 0
    if(pol=="n"):
        return -1
    if(pol=="p"):
        return 1
    return None

In [17]:
count_diff = 0
failed_list=[]
for t in l_pol_and_text:
    score = polar_estimator.estimate_v2(t[1])
    pol_sign = pol_to_sign(t[0])
    success = True
    if(pol_sign==0):
        if(score!=0):
            success=False
    elif(int(pol_sign)*int(score)<=0):
        success=False
    if not success:
        count_diff+=1
        failed_list.append(t)
for t in failed_list:
    print("↓")
    print(t)
    print("======")
    score = polar_estimator.estimate_v2(t[1])
    pol_sign = pol_to_sign(t[0])
    print("evaluated score:",score,", ans:",pol_sign)
    print("↑")
print("sum of number  of diffs:",count_diff)

↓
['n', '雨が降ってるから気分が落ち込む。早く晴れてほしいな。']
evaluated score: 0 , ans: -1
↑
↓
['p', '新しい仕事が始まって緊張するけど、頑張りたい。']
evaluated score: 0 , ans: 1
↑
↓
['p', '今日も一日がんばった。自分を褒めたい気分。']
evaluated score: 0 , ans: 1
↑
↓
['n', '雨の日はどうしても気分が沈んでしまう。']
evaluated score: 0 , ans: -1
↑
↓
['p', '久しぶりに休みが取れて、ゆっくり休むことができた。']
evaluated score: 0 , ans: 1
↑
↓
['n', '友達と喧嘩してしまって、悲しい気持ちになった。']
evaluated score: 0 , ans: -1
↑
↓
['p', '新しい洋服を買って、気分が上がった。']
evaluated score: 0 , ans: 1
↑
↓
['e', '今日は特に何もない一日だったけど、それも悪くない。']
evaluated score: -1 , ans: 0
↑
↓
['p', 'スポーツジムで体を動かして、スッキリした。']
evaluated score: 0 , ans: 1
↑
↓
['p', '雨上がりの虹を見て、心が洗われるようだった。']
evaluated score: 0 , ans: 1
↑
↓
['p', '久しぶりに母の手料理を食べて、懐かしい気分になった。']
evaluated score: 0 , ans: 1
↑
↓
['p', '新しいゲームを始めて、ハマってしまった。']
evaluated score: 0 , ans: 1
↑
↓
['p', '長い一日が終わって、ほっと一息ついた。']
evaluated score: 0 , ans: 1
↑
↓
['p', '会議が長引いて疲れたけど、達成感がある。']
evaluated score: 0 , ans: 1
↑
↓
['p', '仕事が終わって家に帰ると、ホッとする。']
evaluated score: 0 , ans: 1
↑
↓
['n', '風が強くて、外に出るのが億劫だった。']
evaluated