In [None]:
# 필요한 라이브러리 재설치
!pip install konlpy --force-reinstall
# 의존성 문제를 방지하기 위해 --no-dependencies 옵션 사용
!pip install numpy==1.23.5 --no-dependencies
!pip install mecab-python3 --no-dependencies

# MeCab 설치 스크립트 실행
!bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)

Collecting konlpy
  Downloading konlpy-0.6.0-py2.py3-none-any.whl (19.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m19.4/19.4 MB[0m [31m18.8 MB/s[0m eta [36m0:00:00[0m
[0mCollecting JPype1>=0.7.0 (from konlpy)
  Downloading JPype1-1.4.1-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (465 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m465.3/465.3 kB[0m [31m21.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting lxml>=4.1.0 (from konlpy)
  Downloading lxml-4.9.3-cp310-cp310-manylinux_2_28_x86_64.whl (7.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.9/7.9 MB[0m [31m37.2 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting numpy>=1.6 (from konlpy)
  Downloading numpy-1.26.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (18.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m18.2/18.2 MB[0m [31m75.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting packaging (from JPype1>=0.7.0->k

Collecting mecab-python3
  Downloading mecab_python3-1.0.8-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (581 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/581.7 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m71.7/581.7 kB[0m [31m2.0 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m581.7/581.7 kB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: mecab-python3
Successfully installed mecab-python3-1.0.8
Install mecab-ko
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
100 1381k  100 1381k    0     0  1505k      0 --:--:-- --:--:-- --:--:-- 1505k
mecab-0.996-ko-0.9.2/
mecab-0.996-ko-0.9.2/example/
mecab-0.996-ko-0.9

In [None]:
# 필요한 라이브러리 임포트
import pandas as pd
from collections import Counter
from konlpy.tag import Mecab

# Google Drive 마운트
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

# 파일 경로
file_path = '/content/drive/My Drive/recipe/찜1000_2.csv'

# 파일 읽기
try:
    data = pd.read_csv(file_path, encoding='CP949')
except UnicodeDecodeError:
    try:
        data = pd.read_csv(file_path, encoding='EUC-KR')
    except UnicodeDecodeError:
        print("파일을 읽을 수 없습니다. 인코딩을 확인하세요.")

# 실제 열 이름 확인
print(data.columns)

# Mecab 객체 생성
try:
    mecab = Mecab()
except Exception as e:
    print(f"Mecab 객체 생성 실패: {e}")
    # 여기에서 오류 발생 시 후속 코드 실행을 중단합니다.
    raise

# 동사 추출 함수
def extract_verbs(text):
    if not isinstance(text, str):
        return []  # 문자열이 아닌 경우 빈 리스트 반환
    try:
        verbs = set(word[0] for word in mecab.pos(text) if word[1].startswith('V'))
        return verbs
    except Exception as e:
        print(f"Error processing text: {e}")
        return []


# 레시피 열에 대한 동사 추출
data['verbs'] = data['recipe'].apply(extract_verbs)  # 'recipe'는 실제 열 이름에 따라 조정 필요

# DF 계산
df = Counter()
for verbs in data['verbs']:
    df.update(verbs)

# DF를 기준으로 동사 정렬 및 출력
sorted_df = sorted(df.items(), key=lambda x: x[1], reverse=True)

# 정렬된 결과 출력
for verb, freq in sorted_df:
    print(f"{verb}: {freq}")


Mounted at /content/drive
Index(['id', 'name', 'img', 'difficulty', 'cooktime', 'ingre', 'recipe',
       'classification'],
      dtype='object')
넣: 944
주: 833
섞: 495
썰: 489
줍니다: 458
만들: 452
있: 429
좋: 419
익: 369
먹: 368
다진: 365
끓여: 364
않: 352
씻: 351
하: 337
끓: 319
담: 301
큰: 294
되: 287
놓: 276
맛있: 274
이: 268
덮: 260
올려: 259
없: 248
잘라: 240
해: 240
부: 236
빼: 223
입니다: 221
지: 217
됩니다: 209
보: 209
내: 203
준: 199
쪄: 196
익혀: 169
닫: 160
뿌려: 154
끓이: 153
가: 150
깔: 147
볶: 145
붓: 141
삶: 140
남: 138
잡: 135
두: 131
작: 128
둔: 127
같: 126
올리: 125
풀: 120
따라: 120
저: 118
열: 116
말: 115
흐르: 106
잘: 104
꺼내: 94
끄: 93
싶: 90
줄: 88
다져: 86
잠길: 86
위해: 84
한: 84
나: 83
들어가: 83
낸: 82
진: 81
갈: 81
부드럽: 77
썬: 76
찌: 75
발라: 75
많: 75
데쳐: 74
담가: 73
버무려: 73
줄여: 71
들: 71
건져: 71
준다: 70
짜: 70
끓어오르: 69
맞: 68
둡니다: 68
만든: 68
돌려주: 67
불려: 67
나오: 66
드: 66
졸여: 66
떼: 65
간: 65
오르: 63
묵: 63
자르: 62
얇: 61
얹: 61
두르: 60
줄이: 60
보이: 60
예쁘: 59
파: 59
해요: 59
합니다: 59
된답니다: 59
잘라서: 58
살: 58
뺀: 57
해서: 56
헹궈: 56
담궈: 56
오른: 55
돌려: 55
데친: 55
붙: 54
인: 54
재워: 54
눌러