# 現状の実装内容を確認

現状の Evaluator モジュールをベースに動作確認を行います。

動作確認にあたっては、MySQLdb に接続できないため、ローカル環境テスト用の Bot クラスを作成しました。

今後、他の評価手法および評価指標（＝評価ルール）でテストを実行する場合は、<b>既存の Evaluator モジュールをベースにしたカスタマイズ・モジュールを使用</b>して行う予定です。

## (1) テストデータ／環境準備

In [1]:
'''
    プロトタイピング用のパスと、Botライブラリーパスを取得／設定します
'''
import sys
import os

prototype_dir = os.path.join(os.getcwd(), '..')
prototype_dir = os.path.abspath(prototype_dir)

learning_dir = os.path.join(prototype_dir, '..')
learning_dir = os.path.abspath(learning_dir)
os.chdir(learning_dir)

if learning_dir not in sys.path:
    sys.path.append(learning_dir)

print('prototype_dir=%s\nlearning_dir=%s\nsys.path=%s' % (prototype_dir, learning_dir, sys.path))

prototype_dir=/Users/makmorit/GitHub/donusagi-bot/learning/prototype
learning_dir=/Users/makmorit/GitHub/donusagi-bot/learning
sys.path=['', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python35.zip', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/plat-darwin', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/lib-dynload', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/IPython/extensions', '/Users/makmorit/.ipython', '/Users/makmorit/GitHub/donusagi-bot/learning']


In [2]:
'''
    データファイルは、既存の訓練データを別場所にコピーしてから使用します
    テストデータは、csv_file_name で指定したものを使用します。
'''
csv_file_name = 'test_daikin_conversation.csv'
original_csv_dir = os.path.join(learning_dir, 'learning/tests/engine/fixtures/')
original_file_path = os.path.join(original_csv_dir, csv_file_name)

csv_dir = os.path.join(prototype_dir, 'resources')

import shutil
shutil.copy2(original_file_path, csv_dir)
copied_csv_file_path = os.path.join(csv_dir, csv_file_name)

print('CSV file for test=[%s]' % copied_csv_file_path)

CSV file for test=[/Users/makmorit/GitHub/donusagi-bot/learning/prototype/resources/test_daikin_conversation.csv]


## (2) 既存モジュールをカスタマイズ

In [3]:
'''
    Bot/Reply モジュールをカスタマイズした
    BotForLocalTest/ReplyForLocalTest モジュールは、
    {prototype_dir}/modules 配下に格納されています
    （ローカル環境から MySQLdb/dataset に接続できないための措置）
'''
from prototype.modules.BotForLocalTest import Bot
from prototype.modules.ReplyForLocalTest import Reply
from learning.core.learn.learning_parameter import LearningParameter



In [4]:
'''
    初期設定
    データファイル、エンコードを指定
    内容は、learn.py を参考にしました。    
'''
bot_id = 8888
attr = {
    'include_failed_data': False,
    'include_tag_vector': False,
    'classify_threshold': None,
    # 'algorithm': LearningParameter.ALGORITHM_NAIVE_BAYES
    'algorithm': LearningParameter.ALGORITHM_LOGISTIC_REGRESSION,
    # 'params_for_algorithm': { 'C': 200 }
    'params_for_algorithm': {}
}
learning_parameter = LearningParameter(attr)
csv_file_path = copied_csv_file_path
csv_file_encoding = 'utf-8'

## (3) 学習実行

In [5]:
'''
    Bot クラスを生成し学習実行--->交差検証の実行
'''
bot = Bot(bot_id, learning_parameter)
evaluator = bot.learn(csv_file_path=csv_file_path, csv_file_encoding=csv_file_encoding)

learning_parameter: {'_params_for_algorithm': {}, '_include_tag_vector': False, '_classify_threshold': None, '_include_failed_data': False, '_algorithm': 0}
2017/03/01 PM 03:22:11 learning_parameter: {'_params_for_algorithm': {}, '_include_tag_vector': False, '_classify_threshold': None, '_include_failed_data': False, '_algorithm': 0}
start Bot#learn
2017/03/01 PM 03:22:11 start Bot#learn
TrainingMessageFromCsv#__build_learning_training_messages count of learning data: 17443
2017/03/01 PM 03:22:12 TrainingMessageFromCsv#__build_learning_training_messages count of learning data: 17443
TextArray#__init__ start
2017/03/01 PM 03:22:12 TextArray#__init__ start
TextArray#to_vec start
2017/03/01 PM 03:22:12 TextArray#to_vec start
TextArray#to_vec end
2017/03/01 PM 03:22:32 TextArray#to_vec end
[[ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]]
20

## (4) 予測実行

In [6]:
'''
    Reply クラスを生成し予測実行

    元データ：
1385832,Outlook2010にて、個人アドレス帳に写真を入れることができますか。,3411,"自分の顔写真は入れることができます。
自分の顔写真以外は絶対に使用しないで下さい。
※自分の顔写真以外の写真を貼ることは、肖像権だけでなく著作権侵害にも該当してしまうため（法務・コンプライアンス・知財センターの見解より） "
'''
test_X = [
    'Outlookのアドレス帳に自分以外の写真を入れてもいいですか？',
]
reply = Reply(bot_id, learning_parameter)
z = reply.predict(test_X)
z

TextArray#__init__ start
2017/03/01 PM 03:26:21 TextArray#__init__ start
TextArray#to_vec start
2017/03/01 PM 03:26:21 TextArray#to_vec start
TextArray#to_vec end
2017/03/01 PM 03:26:21 TextArray#to_vec end
predicted results (order by probability desc)
2017/03/01 PM 03:26:21 predicted results (order by probability desc)
{'answer_id': 3411.0, 'probability': 0.93155278641784311}
2017/03/01 PM 03:26:21 {'answer_id': 3411.0, 'probability': 0.93155278641784311}
{'answer_id': 3440.0, 'probability': 0.022871965491647498}
2017/03/01 PM 03:26:21 {'answer_id': 3440.0, 'probability': 0.022871965491647498}
{'answer_id': 3456.0, 'probability': 0.013204346632437901}
2017/03/01 PM 03:26:21 {'answer_id': 3456.0, 'probability': 0.013204346632437901}
{'answer_id': 3941.0, 'probability': 0.010322056891509227}
2017/03/01 PM 03:26:21 {'answer_id': 3941.0, 'probability': 0.010322056891509227}
{'answer_id': 3788.0, 'probability': 0.0085101308615810004}
2017/03/01 PM 03:26:21 {'answer_id': 3788.0, 'probabilit

question: Outlookのアドレス帳に自分以外の写真を入れてもいいですか？
answer: 3411
proba: 0.931552786418 



[{'answer_id': 3411.0, 'probability': 0.93155278641784311},
 {'answer_id': 3440.0, 'probability': 0.022871965491647498},
 {'answer_id': 3456.0, 'probability': 0.013204346632437901},
 {'answer_id': 3941.0, 'probability': 0.010322056891509227},
 {'answer_id': 3788.0, 'probability': 0.0085101308615810004},
 {'answer_id': 3490.0, 'probability': 0.0019790459006278397},
 {'answer_id': 3400.0, 'probability': 0.0015686917460115393},
 {'answer_id': 3605.0, 'probability': 0.0012459938958152891},
 {'answer_id': 3912.0, 'probability': 0.00096865582913318628},
 {'answer_id': 3478.0, 'probability': 0.00080862332728344369}]