In [2]:
import os

def convert_dictionaries():
    print("=" * 50)
    print("日本語感情分析辞書の変換を開始します")
    print("=" * 50)
    
    output_lines = []
    
    print("\n【1】名詞編を処理中...")
    noun_file = 'pn.csv.m3.120408.trim'
    
    if not os.path.exists(noun_file):
        print(f"エラー: {noun_file} が見つかりません")
        return False
    
    try:
        with open(noun_file, 'r', encoding='utf-8') as f:
            noun_lines = f.readlines()
        
        noun_count = 0
        noun_positive = 0
        noun_negative = 0
        noun_neutral = 0
        
        for line in noun_lines:
            line = line.strip()
            if not line:
                continue
            
            parts = line.split('\t')
            if len(parts) < 2:
                continue
            
            word = parts[0].strip().strip('"').strip("'")
            polarity = parts[1].strip()
            
            if not word:
                continue
            
            if polarity == 'p':
                score = '1.0'
                noun_positive += 1
            elif polarity == 'n':
                score = '-1.0'
                noun_negative += 1
            elif polarity == 'e':
                score = '0.0'
                noun_neutral += 1
            else:
                continue
            
            output_lines.append(f"{word}\t{score}\n")
            noun_count += 1
        
        print(f"✓ 名詞編: {noun_count}語を処理")
        print(f"  - ポジティブ: {noun_positive}語")
        print(f"  - ネガティブ: {noun_negative}語")
        print(f"  - 中立: {noun_neutral}語")
        
    except Exception as e:
        print(f"エラー: 名詞編の処理中にエラーが発生 - {e}")
        return False
    
    print("\n【2】用言編を処理中...")
    wago_file = 'wago.121808.pn'
    
    if not os.path.exists(wago_file):
        print(f"エラー: {wago_file} が見つかりません")
        return False
    
    try:
        with open(wago_file, 'r', encoding='utf-8') as f:
            wago_lines = f.readlines()
        
        wago_count = 0
        wago_positive = 0
        wago_negative = 0
        
        for line in wago_lines:
            line = line.strip()
            if not line:
                continue
            
            parts = line.split('\t')
            if len(parts) < 2:
                continue
            
            label = parts[0].strip()
            word = parts[1].strip()
            
            if not word:
                continue
            
            if 'ポジ' in label:
                score = '1.0'
                wago_positive += 1
            elif 'ネガ' in label:
                score = '-1.0'
                wago_negative += 1
            else:
                score = '0.0'
            
            output_lines.append(f"{word}\t{score}\n")
            wago_count += 1
        
        print(f"✓ 用言編: {wago_count}語を処理")
        print(f"  - ポジティブ: {wago_positive}語")
        print(f"  - ネガティブ: {wago_negative}語")
        
    except Exception as e:
        print(f"エラー: 用言編の処理中にエラーが発生 - {e}")
        return False
    
    print("\n【3】辞書ファイルを保存中...")
    output_file = 'japanese_sentiment_dictionary.txt'
    
    try:
        with open(output_file, 'w', encoding='utf-8') as f:
            f.writelines(output_lines)
        
        print(f"✓ 保存完了: {output_file}")
        
    except Exception as e:
        print(f"エラー: ファイルの保存中にエラーが発生 - {e}")
        return False
    
    print("\n" + "=" * 50)
    print("変換完了！")
    print("=" * 50)
    print(f"総単語数: {len(output_lines)}語")
    print(f"出力ファイル: {output_file}")
    
    return True

if __name__ == "__main__":
    success = convert_dictionaries()
    
    if success:
        print("\n✅ すべての処理が正常に完了しました！")
    else:
        print("\n❌ 処理中にエラーが発生しました。")

日本語感情分析辞書の変換を開始します

【1】名詞編を処理中...
✓ 名詞編: 13264語を処理
  - ポジティブ: 3352語
  - ネガティブ: 4958語
  - 中立: 4954語

【2】用言編を処理中...
✓ 用言編: 5277語を処理
  - ポジティブ: 2106語
  - ネガティブ: 3171語

【3】辞書ファイルを保存中...
✓ 保存完了: japanese_sentiment_dictionary.txt

変換完了！
総単語数: 18541語
出力ファイル: japanese_sentiment_dictionary.txt

✅ すべての処理が正常に完了しました！
