In [None]:
# MeCab 설치 (macOS)
!brew install mecab mecab-ko mecab-ko-dic
!pip install mecab-python3

In [1]:
import MeCab

# MeCab 한국어 사전 경로 지정
tagger = MeCab.Tagger('-d /usr/local/lib/mecab/dic/mecab-ko-dic')

kor_text = "사과의 놀라운 효능이라는 글을 봤어. 그래서 오늘 사과를 먹으려고 했는데 사과가 썩어서 슈퍼에 가서 사과랑 오렌지 사왔어"

# 형태소 분석
result = tagger.parse(kor_text)
print("MeCab 분석 결과:")
print(result)

# 형태소만 추출
morphs = []
lines = result.strip().split('\n')
for line in lines:
    if line and line != 'EOS':
        parts = line.split('\t')
        if len(parts) >= 2:
            morphs.append(parts[0])

print("\n형태소 목록:", morphs)

MeCab 분석 결과:
사과	NNG,*,F,사과,*,*,*,*
의	JKG,*,F,의,*,*,*,*
놀라운	VA+ETM,*,T,놀라운,Inflect,VA,ETM,놀랍/VA/*+ᆫ/ETM/*
효능	NNG,*,T,효능,*,*,*,*
이	VCP,*,F,이,*,*,*,*
라는	ETM,*,T,라는,*,*,*,*
글	NNG,*,T,글,*,*,*,*
을	JKO,*,T,을,*,*,*,*
봤	VV+EP,*,T,봤,Inflect,VV,EP,보/VV/*+았/EP/*
어	EF,*,F,어,*,*,*,*
.	SF,*,*,*,*,*,*,*
그래서	MAJ,*,F,그래서,*,*,*,*
오늘	MAG,성분부사|시간부사,T,오늘,*,*,*,*
사과	NNG,*,F,사과,*,*,*,*
를	JKO,*,T,를,*,*,*,*
먹	VV,*,T,먹,*,*,*,*
으려고	EC,*,F,으려고,*,*,*,*
했	VX+EP,*,T,했,Inflect,VX,EP,하/VX/*+았/EP/*
는데	EC,*,F,는데,*,*,*,*
사과	NNG,*,F,사과,*,*,*,*
가	JKS,*,F,가,*,*,*,*
썩	VV,*,T,썩,*,*,*,*
어서	EC,*,F,어서,*,*,*,*
슈퍼	NNG,장소,F,슈퍼,*,*,*,*
에	JKB,*,F,에,*,*,*,*
가	VV,*,F,가,*,*,*,*
서	EC,*,F,서,*,*,*,*
사과	NNG,*,F,사과,*,*,*,*
랑	JKB,*,T,랑,*,*,*,*
오렌지	NNG,*,F,오렌지,*,*,*,*
사	VV+EC,*,F,사,Inflect,VV,EC,사/VV/*+아/EC/*
왔	VX+EP,*,T,왔,Inflect,VX,EP,오/VX/*+았/EP/*
어	EC,*,F,어,*,*,*,*
EOS


형태소 목록: ['사과', '의', '놀라운', '효능', '이', '라는', '글', '을', '봤', '어', '.', '그래서', '오늘', '사과', '를', '먹', '으려고', '했', '는데', '사과', '가', '썩', '어서', '슈퍼', '에', '가', '서', '사과', '랑', '오

In [8]:
# KoNLPy Okt 형태소 분석기



from konlpy.tag import Okt

text = "파이썬을 이용한 자연어 처리는 재미있습니다!"
okt = Okt()
tokens = okt.morphs(text)
print("형태소 분석 결과:", tokens)


형태소 분석 결과: ['파이썬', '을', '이용', '한', '자연어', '처리', '는', '재미있습니다', '!']


In [2]:
# KoNLPy와 MeCab 비교
from konlpy.tag import Okt
# import MeCab

text = "파이썬을 이용한 자연어 처리는 재미있습니다!"

# Okt 사용
okt = Okt()
okt_tokens = okt.morphs(text)
print("Okt 형태소 분석:", okt_tokens)

# MeCab 사용  
tagger = MeCab.Tagger('-d /usr/local/lib/mecab/dic/mecab-ko-dic')
result = tagger.parse(text)

# MeCab 형태소만 추출
mecab_tokens = []
lines = result.strip().split('\n')
for line in lines:
    if line and line != 'EOS':
        parts = line.split('\t')
        if len(parts) >= 2:
            mecab_tokens.append(parts[0])

print("MeCab 형태소 분석:", mecab_tokens)

Okt 형태소 분석: ['파이썬', '을', '이용', '한', '자연어', '처리', '는', '재미있습니다', '!']
MeCab 형태소 분석: ['파이썬', '을', '이용', '한', '자연어', '처리', '는', '재미있', '습니다', '!']
