In [19]:
import MeCab, os
import pandas as pd

# tagger = mecab.Tagger("-Owakati")
tagger = MeCab.Tagger("-Owakati -r /opt/homebrew/etc/mecabrc")

In [20]:
input_alpha_filename = 'alpha_Hiraoka.csv'
input_beta_filename = 'beta_Hiraoka.csv'

alpha_path = os.path.join('./TalkData', input_alpha_filename)
beta_path = os.path.join('./TalkData', input_beta_filename)

alpha_data = pd.read_csv(alpha_path)
beta_data = pd.read_csv(beta_path)

In [21]:
def calculate_unique_words(text):
    words = tagger.parse(text).strip().split()
    return len(set(words))

In [22]:
alpha_data['UniqueWords'] = alpha_data['Detail'].apply(calculate_unique_words)
beta_data['UniqueWords'] = beta_data['Detail'].apply(calculate_unique_words)

In [23]:
alpha_avg = alpha_data["UniqueWords"].mean()
beta_avg = beta_data["UniqueWords"].mean()

In [24]:
average_unique_alpha_words = alpha_data.groupby('Speaker')['UniqueWords'].mean()
print(average_unique_alpha_words)
average_unique_beta_words = beta_data.groupby('Speaker')['UniqueWords'].mean()
print(average_unique_beta_words)

Speaker
AI      53.125000
User    15.714286
Name: UniqueWords, dtype: float64
Speaker
AI      79.4
User    20.2
Name: UniqueWords, dtype: float64


In [25]:
beta_data

Unnamed: 0,Speaker,Detail,UniqueWords
0,AI,今日の歩数、4271歩ってことだね。週平均と比べると、ちょっと多めだけど、月平均と比べると少...,70
1,User,ゴールデンウィークは学振書いててずっと研究室いたよ．ほんと最悪だよね,17
2,AI,学振の申請書を書くのは、ほんと大変だよね。ゴールデンウィークに研究室にこもってるなんて、気持...,72
3,User,最近してなかったんだけど，今日筋トレしてきた．久しぶりの運動だから楽しかったー．,20
4,AI,久しぶりの筋トレ、楽しめたみたいで良かったね！体を動かすのは、ストレス解消にもなるし、気分も...,73
5,User,今日はスクワットいっぱいしたよ．MAX110なんやけど，今日重量落ちてなくて安心したー．あと...,26
6,AI,スクワットでMAX110キロをキープできてるなんて、かなりいい感じじゃないか！重量が落ちてな...,69
7,User,超スッキリしたー．今ベンチプレス90kgで100kg目指してるけどどうするのがいいかなぁ．,23
8,AI,100kgのベンチプレス目指してるんだね、いい目標だ！まずは、現在の90kgから徐々に重量を...,113
9,User,そうだよねー．研究してたら筋トレ怠っちゃって困るー,15


In [26]:
# 必要なパッケージをインポート
import pandas as pd
beta_data_with_average = beta_data.copy()
# 平均値の行をデータフレームとして作成
average_rows = pd.DataFrame([
    {'Speaker': 'AI Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_beta_words['AI']},
    {'Speaker': 'User Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_beta_words['User']}
])

# 元のデータと平均値を結合
beta_data_with_average = pd.concat([beta_data, average_rows], ignore_index=True)

# 結果をCSVとして保存
beta_data_with_average.to_csv('./AnalyzedData/analyzed_beta_Hiraoka.csv', index=False, encoding='utf-8-sig')

# 確認用
beta_data_with_average


Unnamed: 0,Speaker,Detail,UniqueWords
0,AI,今日の歩数、4271歩ってことだね。週平均と比べると、ちょっと多めだけど、月平均と比べると少...,70.0
1,User,ゴールデンウィークは学振書いててずっと研究室いたよ．ほんと最悪だよね,17.0
2,AI,学振の申請書を書くのは、ほんと大変だよね。ゴールデンウィークに研究室にこもってるなんて、気持...,72.0
3,User,最近してなかったんだけど，今日筋トレしてきた．久しぶりの運動だから楽しかったー．,20.0
4,AI,久しぶりの筋トレ、楽しめたみたいで良かったね！体を動かすのは、ストレス解消にもなるし、気分も...,73.0
5,User,今日はスクワットいっぱいしたよ．MAX110なんやけど，今日重量落ちてなくて安心したー．あと...,26.0
6,AI,スクワットでMAX110キロをキープできてるなんて、かなりいい感じじゃないか！重量が落ちてな...,69.0
7,User,超スッキリしたー．今ベンチプレス90kgで100kg目指してるけどどうするのがいいかなぁ．,23.0
8,AI,100kgのベンチプレス目指してるんだね、いい目標だ！まずは、現在の90kgから徐々に重量を...,113.0
9,User,そうだよねー．研究してたら筋トレ怠っちゃって困るー,15.0


In [27]:
# 必要なパッケージをインポート
import pandas as pd
import os

# 元ファイル名
input_filename = input_alpha_filename
# 保存フォルダ
output_folder = "./AnalyzedData"
# 元ファイル名から "Hiraoka" 部分を抽出
base_name = os.path.splitext(input_filename)[0]  # 拡張子を除く ("alpha_Hiraoka")
name_part = base_name.split('_')[-1]  # 最後の部分 ("Hiraoka")
# 保存ファイル名を生成
output_filename = f"analyzed_alpha_{name_part}.csv"
output_path = os.path.join(output_folder, output_filename)

alpha_data_with_average = alpha_data.copy()
# 平均値の行をデータフレームとして作成
average_rows = pd.DataFrame([
    {'Speaker': 'AI Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_alpha_words['AI']},
    {'Speaker': 'User Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_alpha_words['User']}
])

# 元のデータと平均値を結合
alpha_data_with_average = pd.concat([alpha_data, average_rows], ignore_index=True)

# 保存
os.makedirs(output_folder, exist_ok=True)  # フォルダがない場合は作成
alpha_data_with_average.to_csv(output_path, index=False, encoding='utf-8-sig')

# 確認用
alpha_data_with_average


Unnamed: 0,Speaker,Detail,UniqueWords
0,AI,こんにちは！最近、体を動かしたり、リラックスする時間は取れてるかな？あと、体調はどうだい？何...,33.0
1,User,体調はめっちゃいいよ．昨日は10時間も寝ちゃった．,13.0
2,AI,それは素晴らしいね！しっかり寝ることができたのは、体にとっても心にとってもいいことだよ。最近...,35.0
3,User,最近は申請書書いててストレス溜まってるかもー．研究向いてないー,15.0
4,AI,申請書を書くのは確かに大変だよね。研究に向いているかどうかというのは、時として自分でも判断し...,65.0
5,User,このまえ温泉行ったんだけどめっちゃ良かったよ．そのあとドライブもしたしね．,18.0
6,AI,温泉とドライブ、最高の組み合わせだね！温泉でリラックスできた上に、ドライブで気分転換もできる...,40.0
7,User,海沿い走った,3.0
8,AI,海沿いをドライブするのは、本当に気持ちがいいよね。窓から入ってくる潮風や、波の音、それに広が...,48.0
9,User,あんまり旅行とか行かないかもー． でも，温泉巡りとかしたいなー．おすすめある？,18.0


In [28]:
# 必要なパッケージをインポート
import pandas as pd
import os

# 元ファイル名
input_filename = input_beta_filename
# 保存フォルダ
output_folder = "./AnalyzedData"
# 元ファイル名から "Hiraoka" 部分を抽出
base_name = os.path.splitext(input_filename)[0]  # 拡張子を除く ("alpha_Hiraoka")
name_part = base_name.split('_')[-1]  # 最後の部分 ("Hiraoka")
# 保存ファイル名を生成
output_filename = f"analyzed_beta_{name_part}.csv"
output_path = os.path.join(output_folder, output_filename)

beta_data_with_average = beta_data.copy()
# 平均値の行をデータフレームとして作成
average_rows = pd.DataFrame([
    {'Speaker': 'AI Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_beta_words['AI']},
    {'Speaker': 'User Average', 'Detail': 'Mean Unique Words', 'UniqueWords': average_unique_beta_words['User']}
])

# 元のデータと平均値を結合
beta_data_with_average = pd.concat([beta_data, average_rows], ignore_index=True)

# 保存
os.makedirs(output_folder, exist_ok=True)  # フォルダがない場合は作成
beta_data_with_average.to_csv(output_path, index=False, encoding='utf-8-sig')

# 確認用
beta_data_with_average


Unnamed: 0,Speaker,Detail,UniqueWords
0,AI,今日の歩数、4271歩ってことだね。週平均と比べると、ちょっと多めだけど、月平均と比べると少...,70.0
1,User,ゴールデンウィークは学振書いててずっと研究室いたよ．ほんと最悪だよね,17.0
2,AI,学振の申請書を書くのは、ほんと大変だよね。ゴールデンウィークに研究室にこもってるなんて、気持...,72.0
3,User,最近してなかったんだけど，今日筋トレしてきた．久しぶりの運動だから楽しかったー．,20.0
4,AI,久しぶりの筋トレ、楽しめたみたいで良かったね！体を動かすのは、ストレス解消にもなるし、気分も...,73.0
5,User,今日はスクワットいっぱいしたよ．MAX110なんやけど，今日重量落ちてなくて安心したー．あと...,26.0
6,AI,スクワットでMAX110キロをキープできてるなんて、かなりいい感じじゃないか！重量が落ちてな...,69.0
7,User,超スッキリしたー．今ベンチプレス90kgで100kg目指してるけどどうするのがいいかなぁ．,23.0
8,AI,100kgのベンチプレス目指してるんだね、いい目標だ！まずは、現在の90kgから徐々に重量を...,113.0
9,User,そうだよねー．研究してたら筋トレ怠っちゃって困るー,15.0


## Word len分析

In [6]:
import pandas as pd
import glob

def countWordsLen(path):
    csv_files = glob.glob(path)
    for file in csv_files:
        df = pd.read_csv(file)
        
        len_list = []
        for text in df["Detail"]:
            words_len = len(text)
            len_list.append(words_len)
            
        df["WordsLen"] = len_list
    
        df.to_csv(file, index=False, encoding='utf-8-sig')
        print(f"上書き保存しました: {file}")
            
path = "../../Analyzed/AnalyzedData/analyzed_*_*.csv"
countWordsLen(path)

上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Hiraoka.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Mori.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Abe.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Suto.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Sakai.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Pang.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Futamura.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Mori.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Futamura.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Sakai.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Shiojiri.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Suto.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_beta_Hiraoka.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Abe.csv
上書き保存しました: ../../Analyzed/AnalyzedData/analyzed_alpha_Shiojiri.csv
上書き保存しました: ../../Analyzed/AnalyzedData/an

#### Column移動

In [7]:
import pandas as pd

# CSVファイルを読み込む
file_path = "/Users/john/Programs/University/Study/Analytics/Analyzed/AnalyzedData/analyzed_alpha_Abe.csv"
df = pd.read_csv(file_path)

# 'WordsLen'列を2番目の位置に移動
cols = df.columns.tolist()
cols.insert(2, cols.pop(cols.index('WordsLen')))
df = df[cols]

# 結果を保存
df.to_csv(file_path, index=False, encoding='utf-8-sig')
print(f"上書き保存しました: {file_path}")

上書き保存しました: /Users/john/Programs/University/Study/Analytics/Analyzed/AnalyzedData/analyzed_alpha_Abe.csv


#### df check

In [9]:
file = "../../Analyzed/AnalyzedData/analyzed_alpha_Abe.csv"
df = pd.read_csv(file)
df


Unnamed: 0,Speaker,Detail,WordsLen,UniqueWords,JLPTLevel,Sentiment-tabularisai,Sentiment-tabularisai-score,Sentiment-lxyuan,Sentiment-lxyuan-score,Sentiment-Christian,Sentiment-Christian-score
0,AI,こんにちは！最近、体の調子はどうですか？何か運動やリラクゼーションの活動をしていますか？それ...,74,36.0,3.0,Very Negative,0.398403,positive,0.401744,positive,0.998923
1,User,最近は起きた時に寝ても寝ても眠い感じがする,21,13.0,2.0,Negative,0.3383,negative,0.461021,positive,0.896546
2,AI,それはちょっと大変そうですね。睡眠の質が落ちている可能性があるかもしれませんね。寝る前の環境...,138,57.0,2.0,Very Negative,0.561873,negative,0.730563,neutral,0.999262
3,User,スマホを見てしまうことなどは前からあったけど，前よりも疲れている感じがするんだよね,41,25.0,2.0,Neutral,0.469847,negative,0.773605,neutral,0.969296
4,AI,疲れが溜まっていると感じるときは、やっぱり体も心も重くなりますよね。スマホの光が睡眠の質を下...,274,90.0,2.0,Neutral,0.339138,positive,0.517148,neutral,0.800267
5,User,散歩するのに家の周りが面白くないんだけど，散歩が面白くなるアイデアが欲しいんだよな,41,18.0,2.0,Neutral,0.39768,positive,0.45657,neutral,0.965423
6,AI,散歩をもっと楽しくするアイデア、いくつか提案しますね！ポッドキャストやオーディオブックを聴く...,449,126.0,3.0,Positive,0.645495,positive,0.766437,positive,0.998347
7,AI Average,Mean Unique Words,17,77.25,3.0,Neutral,0.424112,positive,0.511583,positive,0.99409
8,User Average,Mean Unique Words,17,18.666667,3.0,Neutral,0.424112,positive,0.511583,positive,0.99409
