In [1]:
import MeCab

# カスタム辞書を指定してMeCabを初期化
def analyze_with_neologd(text):
    # NEologd辞書のパスを指定
    neologd_path = '/usr/lib/aarch64-linux-gnu/mecab/dic/mecab-ipadic-neologd'
    
    # NEologd辞書のみを使用（ユーザー辞書なし）
    mecab = MeCab.Tagger(f'-d {neologd_path}')
    
    # 解析実行
    parsed = mecab.parse(text)
    return parsed

# 使用例
text = "フォーミュラEはサステナブルモータースポーツは走る実験室です。最高の品質で社会に貢献します。"
parsed = analyze_with_neologd(text)
print(parsed)

フォーミュラE	名詞,固有名詞,一般,*,*,*,フォーミュラE,フォーミュライー,フォーミュライー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
サステナブル	名詞,固有名詞,一般,*,*,*,Sustainable,サステナブル,サステナブル
モータースポーツ	名詞,一般,*,*,*,*,モータースポーツ,モータースポーツ,モータースポーツ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
走る	動詞,自立,*,*,五段・ラ行,基本形,走る,ハシル,ハシル
実験室	名詞,固有名詞,一般,*,*,*,実験室,ジッケンシツ,ジッケンシツ
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
最高	名詞,一般,*,*,*,*,最高,サイコウ,サイコー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
品質	名詞,一般,*,*,*,*,品質,ヒンシツ,ヒンシツ
で	助詞,格助詞,一般,*,*,*,で,デ,デ
社会	名詞,一般,*,*,*,*,社会,シャカイ,シャカイ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
貢献	名詞,サ変接続,*,*,*,*,貢献,コウケン,コーケン
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。	記号,句点,*,*,*,*,。,。,。
EOS



In [2]:
import MeCab
import subprocess

# 辞書の正確なパスを確認（コマンドの出力を取得）
result = subprocess.run(["find", "/", "-name", "mecab-ipadic-neologd", "-type", "d"], 
                        capture_output=True, text=True)
neologd_paths = result.stdout.strip().split('\n')

if neologd_paths and neologd_paths[0]:
    # 最初に見つかったパスを使用
    neologd_path = neologd_paths[0]
    print(f"Found NEologd at: {neologd_path}")
    
    # user.dicを指定せずに辞書だけを指定
    mecab = MeCab.Tagger(f"-d {neologd_path}")
    
    text = "MeCabでApple新製品の形態素解析を行います。"
    print(mecab.parse(text))
else:
    print("NEologd dictionary not found. Please install it first.")

Found NEologd at: /usr/lib/aarch64-linux-gnu/mecab/dic/mecab-ipadic-neologd
MeCab	名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
で	助詞,格助詞,一般,*,*,*,で,デ,デ
Apple	名詞,固有名詞,一般,*,*,*,Apple,アップル,アップル
新製品	名詞,一般,*,*,*,*,新製品,シンセイヒン,シンセイヒン
の	助詞,連体化,*,*,*,*,の,ノ,ノ
形態素解析	名詞,固有名詞,一般,*,*,*,形態素解析,ケイタイソカイセキ,ケイタイソカイセキ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
行い	動詞,自立,*,*,五段・ワ行促音便,連用形,行う,オコナイ,オコナイ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。	記号,句点,*,*,*,*,。,。,。
EOS



In [4]:
import MeCab

# カスタム辞書を指定してMeCabを初期化
def analyze_with_custom_neologd(text, userdic=None):
    # NEologd辞書のパスを取得
    neologd_path = '/usr/lib/aarch64-linux-gnu/mecab/dic/mecab-ipadic-neologd'
    
    # ユーザー辞書の指定があれば追加
    #if userdic:
    #    mecab = MeCab.Tagger(f'-d {neologd_path} -u {userdic}')
    #else:
    #    mecab = MeCab.Tagger(f'-d {neologd_path}')
    
    # 解析実行
    parsed = mecab.parse(text)
    return parsed

# 使用例
text = "フォーミュラEはサステナブルモータースポーツは走る実験室です。最高の品質で社会に貢献します。"
parsed = analyze_with_custom_neologd(text, userdic='/usr/lib/aarch64-linux-gnu/mecab/dic/mecab-ipadic-neologd/user.dic')
print(parsed)

フォーミュラE	名詞,固有名詞,一般,*,*,*,フォーミュラE,フォーミュライー,フォーミュライー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
サステナブル	名詞,固有名詞,一般,*,*,*,Sustainable,サステナブル,サステナブル
モータースポーツ	名詞,一般,*,*,*,*,モータースポーツ,モータースポーツ,モータースポーツ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
走る	動詞,自立,*,*,五段・ラ行,基本形,走る,ハシル,ハシル
実験室	名詞,固有名詞,一般,*,*,*,実験室,ジッケンシツ,ジッケンシツ
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
最高	名詞,一般,*,*,*,*,最高,サイコウ,サイコー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
品質	名詞,一般,*,*,*,*,品質,ヒンシツ,ヒンシツ
で	助詞,格助詞,一般,*,*,*,で,デ,デ
社会	名詞,一般,*,*,*,*,社会,シャカイ,シャカイ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
貢献	名詞,サ変接続,*,*,*,*,貢献,コウケン,コーケン
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。	記号,句点,*,*,*,*,。,。,。
EOS



In [5]:
!mecab-config --dicdir

/usr/lib/aarch64-linux-gnu/mecab/dic


In [7]:
import MeCab
import subprocess
import os

# NEologd辞書の場所を探す関数
def find_neologd_dictionary():
    try:
        # システムで辞書を検索
        cmd = "find / -name 'mecab-ipadic-neologd' -type d 2>/dev/null"
        result = subprocess.check_output(cmd, shell=True, text=True)
        paths = result.strip().split('\n')
        
        # 有効なパスがあるか確認
        valid_paths = [p for p in paths if os.path.exists(p)]
        
        if valid_paths:
            return valid_paths[0]  # 最初の有効なパスを返す
        else:
            return None
    except:
        return None

# 標準辞書でMeCabを初期化する関数
def analyze_with_standard_dic(text):
    mecab = MeCab.Tagger("")  # デフォルト辞書を使用
    return mecab.parse(text)

# NEologd辞書を使用してテキストを解析
def analyze_text(text):
    # NEologd辞書を探す
    neologd_path = find_neologd_dictionary()
    
    if neologd_path:
        print(f"Found NEologd dictionary at: {neologd_path}")
        try:
            # NEologd辞書を使ってMeCabを初期化
            mecab = MeCab.Tagger(f'-d {neologd_path}')
            return mecab.parse(text)
        except Exception as e:
            print(f"Error using NEologd dictionary: {e}")
            print("Falling back to standard dictionary...")
            return analyze_with_standard_dic(text)
    else:
        print("NEologd dictionary not found. Using standard dictionary.")
        return analyze_with_standard_dic(text)

# 使用例
text = "フォーミュラEはサステナブルモータースポーツは走る実験室です。最高の品質で社会に貢献します。"
parsed = analyze_text(text)
print(parsed)

NEologd dictionary not found. Using standard dictionary.
フォーミュラ	フォーミュラ	フォーミュラ	フォーミュラ-formula	名詞-普通名詞-一般			1
E	E	E	E	名詞-普通名詞-一般			0
は	ワ	ハ	は	助詞-係助詞			
サステナブル	サステナブル	サステイナブル	サステイナブル	名詞-普通名詞-一般			4
モーター	モーター	モーター	モーター-motor	名詞-普通名詞-一般			1,0
スポーツ	スポーツ	スポーツ	スポーツ-sport	名詞-普通名詞-サ変可能			2
は	ワ	ハ	は	助詞-係助詞			
走る	ハシル	ハシル	走る	動詞-一般	五段-ラ行	連体形-一般	2
実験	ジッケン	ジッケン	実験	名詞-普通名詞-サ変可能			0
室	シツ	シツ	室	接尾辞-名詞的-一般			
です	デス	デス	です	助動詞	助動詞-デス	終止形-一般	
。			。	補助記号-句点			
最高	サイコー	サイコウ	最高	名詞-普通名詞-形状詞可能			0
の	ノ	ノ	の	助詞-格助詞			
品質	ヒンシツ	ヒンシツ	品質	名詞-普通名詞-一般			0
で	デ	デ	で	助詞-格助詞			
社会	シャカイ	シャカイ	社会	名詞-普通名詞-一般			1
に	ニ	ニ	に	助詞-格助詞			
貢献	コーケン	コウケン	貢献	名詞-普通名詞-サ変可能			0
し	シ	スル	為る	動詞-非自立可能	サ行変格	連用形-一般	0
ます	マス	マス	ます	助動詞	助動詞-マス	終止形-一般	
。			。	補助記号-句点			
EOS

