In [38]:
import json
import re
from konlpy.tag import Okt
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

In [39]:
with open('sample_data.json', 'r',encoding="cp949") as f:
    json_data = json.load(f)

In [40]:
json_data

{'documents': [{'address_name': '서울 강남구 삼성동 10-18',
   'category_group_code': 'FD6',
   'category_group_name': '음식점',
   'category_name': '음식점 > 간식 > 아이스크림',
   'distance': '',
   'id': '900538186',
   'phone': '02-543-1261',
   'place_name': '광화문석갈비 코엑스점',
   'place_url': 'https://place.map.kakao.com/885622105',
   'road_address_name': '서울 강남구 선릉로126길 14',
   'x': '127.04324523621',
   'y': '37.5152792229316',
   'menu': ['소찬밥',
    '돼찬밥',
    '소 돌판구이',
    '소 돌판구이 세트(3인)',
    '돼지 돌판구이 세트(3인)',
    '돼지갈비찜'],
   'review': ['ㅜㅜ 사장님?으로 보이는 안경낀 남자직원분 너무 친절하시고 화장실 갈때도 어딘지 에스코트해주시고 너무 좋았어요. 무엇보다 제가 위에 소노펠리체에서 예식하고 친정엄마아빠랑 내려와서 밥먹고 정신가출해서 식당에 아빠가 신혼여행때 쓰라고 주신 액수가 큰 봉투를 그대로 식탁에 놓고 나왔어요. 근데 너무 감사하게도 잘 보관해주셔서 찾아왔습니다.. 정말 최악의 결혼식날이 될 뻔했는데 오히려 좋은 하루 만들어주셔서 감사했다 하셔서 울컥했네요~~번창하세요!!',
    '또 가고픈 맛',
    '음식이 깔끔하네요. 인테리어도 세련되고 예쁘구. 위치가 조금 아쉽다고 느끼긴 했는데 그거 빼곤 다 너무 좋았어요. 육회 비빔밥 처음 먹어본 건데 맛있었습니다~',
    '소찬밥 맛있어요!']},
  {'address_name': '서울 강남구 삼성동 65-9',
   'category_group_code': 'FD6',
   'category_gro

## 샘플 데이터 5개로 메뉴, 리뷰를 조합하여 코사인 유사도 분석

### 1. 메뉴 + 리뷰 (tokenize 처리 x)

In [41]:
reviews=[]
clean_review_tokenized=[]
total=[]
for i in range(len(json_data["documents"])):
    # 전처리
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"])
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu)
    review=' '.join(str(s) for s in json_data["documents"][i]["review"])
    clean_review=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', review)
    clean_review=re.sub("([ㄱ-ㅎㅏ-ㅣ]+)","",clean_review)

    # total 리스트에 입력
    total.append(clean_menu+" "+clean_review)

# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

          광화문        카츠        유리        마초       뽕사부
광화문  1.000000  0.022027  0.021874  0.000000  0.007098
카츠   0.022027  1.000000  0.013964  0.009991  0.032494
유리   0.021874  0.013964  1.000000  0.013521  0.005634
마초   0.000000  0.009991  0.013521  1.000000  0.024186
뽕사부  0.007098  0.032494  0.005634  0.024186  1.000000


0.2120631765125167

In [42]:
result

Unnamed: 0,광화문,카츠,유리,마초,뽕사부
광화문,1.0,0.022027,0.021874,0.0,0.007098
카츠,0.022027,1.0,0.013964,0.009991,0.032494
유리,0.021874,0.013964,1.0,0.013521,0.005634
마초,0.0,0.009991,0.013521,1.0,0.024186
뽕사부,0.007098,0.032494,0.005634,0.024186,1.0


In [43]:
vectorizer.get_feature_names()

['12시반쯤',
 '2만원',
 '30분걸림',
 '30분입니다',
 '3분',
 '5분정도',
 '87분에',
 '가게가',
 '가게는',
 '가격대비',
 '가격은',
 '가격이면',
 '가고픈',
 '가깝고',
 '가끔',
 '가능한',
 '가니',
 '가다가',
 '가세요',
 '갈때도',
 '갈비',
 '갈비는',
 '감사하게도',
 '감사했다',
 '갔는데',
 '강남역점',
 '강남역점을',
 '강남점이랑',
 '같네요',
 '같이',
 '개판',
 '거리가',
 '거리도',
 '거절당함',
 '건데',
 '걸어가니',
 '것은',
 '결국',
 '결혼식날이',
 '계산뒤에',
 '계속',
 '고객',
 '고기',
 '고기는',
 '고기도',
 '고추장불고기',
 '곳입니다',
 '공간에서',
 '괜찮았음',
 '굉장히',
 '군대',
 '굳어서',
 '그거',
 '그냥',
 '그대로',
 '그래서',
 '그러다보니',
 '그리고',
 '근데',
 '기다리라고만',
 '기름먹으면서',
 '김치유부주머니우동',
 '깐풍기',
 '깔끔하네요',
 '나라',
 '나서',
 '나오고',
 '나오는',
 '나온',
 '나왔던',
 '나왔습니다',
 '나왔어요',
 '날치알',
 '남자직원분',
 '납니다',
 '내려와서',
 '냉면시켰으나',
 '냉면이아니라',
 '냉짬뽕8',
 '너무',
 '너무맛있다고',
 '넣어주네요',
 '놓고',
 '놨던거',
 '눅눅해졌습니다',
 '눅눅했어요',
 '눌러도',
 '눌러붙어있고',
 '느끼긴',
 '다르게',
 '다르신건지',
 '다시',
 '다신안감',
 '단골',
 '달라니',
 '더워서',
 '뎁혀서',
 '돈까스',
 '돈까스가',
 '돈까스집',
 '돌판구이',
 '돼지',
 '돼지갈비찜',
 '돼찬밥',
 '되어',
 '된다고',
 '두시간',
 '뒤죽박죽으로',
 '들리는',
 '들어가게되었는데',
 '등심카츠14',
 '때는',
 '떨어지는데',
 '뜨거워서',
 '리뷰를',
 '마나',
 '마초

### 2. 메뉴 + 리뷰 (메뉴는 tokenize 처리 x)
- stem 처리 x

In [44]:
def review_tokenize(review : str) -> tuple:
    okt = Okt()
    Okt_morphs=okt.pos(review)  # 형태소 분석
    return Okt_morphs

def select_tokenize(tokenize : tuple) -> str:
    filter_review=""
    for word, pos in tokenize:
#        if pos in STOP_WORDS: #리뷰들 보면서 불용어 직접 추가해야 됨
#            pass
        if pos == 'Noun' or pos == "Verb" or pos == "Adjective" or pos == "Adverb":
            filter_review=filter_review+" "+word        
    return filter_review

In [45]:
reviews=[]
total=[]

for i in range(len(json_data["documents"])):
    # 메뉴 특수문자 제거
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"]) # 식당 메뉴 불러오기.
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu) 
    
    # 리뷰 특수문자 제거 및 자음, 모음만 있는 것 삭제 후 tokenize 처리
    review=' '.join(str(s) for s in json_data["documents"][i]["review"])
    clean_review=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', review)
    clean_review=re.sub("([ㄱ-ㅎㅏ-ㅣ]+)","",clean_review)
    
    # total 리스트에 정리된 메뉴와 clean_review를 review_tokenize를 이용해 토큰화(형태소 분석)를 하고 select_tokenize를 이용해 필요한 단어들만 추출한 리뷰 추가
    total.append(clean_menu+" "+select_tokenize(review_tokenize(clean_review)))

# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

          광화문        카츠        유리        마초       뽕사부
광화문  1.000000  0.036987  0.021154  0.010435  0.020600
카츠   0.036987  1.000000  0.087563  0.018410  0.042680
유리   0.021154  0.087563  1.000000  0.046802  0.021355
마초   0.010435  0.018410  0.046802  1.000000  0.054710
뽕사부  0.020600  0.042680  0.021355  0.054710  1.000000


0.22885569453152044

In [46]:
vectorizer.get_feature_names()

['가게',
 '가격',
 '가깝고',
 '가끔',
 '가능한',
 '가니',
 '가다가',
 '가세',
 '가출',
 '갈비',
 '감사하게도',
 '감사했다',
 '갔는데',
 '강남',
 '같네요',
 '같이',
 '같지만',
 '개판',
 '거리',
 '거절',
 '건지',
 '걸어가니',
 '결국',
 '결혼식',
 '계산',
 '계속',
 '고객',
 '고기',
 '고추장불고기',
 '고픈',
 '공간',
 '괜찮았음',
 '굉장히',
 '군대',
 '굳어서',
 '그거',
 '그냥',
 '그대로',
 '그래서',
 '그러다',
 '근데',
 '근면',
 '기다리라고만',
 '기름',
 '김치유부주머니우동',
 '깐풍기',
 '깔끔하네요',
 '나라',
 '나서',
 '나오고',
 '나오는',
 '나오는데',
 '나온',
 '나옴',
 '나와서',
 '나왔던',
 '나왔습니다',
 '나왔어요',
 '날치알',
 '남자',
 '납니다',
 '내려와서',
 '냉면',
 '냉짬뽕8',
 '너무',
 '넣어주네요',
 '녹아요',
 '놓고',
 '놨던거',
 '눅눅해졌습니다',
 '눅눅했어요',
 '눌러',
 '눌러도',
 '느끼긴',
 '다르',
 '다르게',
 '다시',
 '다신',
 '단골',
 '달라',
 '당함',
 '대비',
 '대신',
 '더워서',
 '뎁혀',
 '돈까스',
 '돌판구이',
 '돼지',
 '돼지갈비찜',
 '돼찬밥',
 '되어',
 '되었는데',
 '된다고',
 '둠도',
 '뒤죽박죽',
 '들리는',
 '들어가게',
 '등심카츠14',
 '떡볶이',
 '떨어졌다고',
 '떨어지는데',
 '뜨거워서',
 '리뷰',
 '마나',
 '마시고',
 '마초',
 '마키',
 '만들어',
 '만들어놨던거',
 '만들어주셔서',
 '만족하지',
 '많이',
 '맛없는',
 '맛있고요',
 '맛있네요',
 '맛있는데',
 '맛있다고',
 '맛있어요',
 '맛있었습니다',
 '맛집',
 '망할듯',
 '맨날',
 '먹고',
 '먹고가던',


### 2. 메뉴 + 리뷰 (메뉴는 tokenize 처리 x)
- okt.pos()를 이용하여 각 품사를 태깅하고, 명사, 형용사, 동사, 부사만 뽑아낸다 이때 stem을 이용하여 어간을 추출한다.

In [47]:
def review_tokenize(review : str) -> tuple:
    okt = Okt()
    Okt_morphs=okt.pos(review,norm=True,stem=True)  # 형태소 분석
    return Okt_morphs

def select_tokenize(tokenize : tuple) -> str:
    filter_review=""
    for word, pos in tokenize:
        if pos == 'Noun' or pos == "Verb" or pos == "Adjective" or pos == "Adverb":
            filter_review=filter_review+" "+word        
    return filter_review

In [48]:
reviews=[]
total=[]

for i in range(len(json_data["documents"])):
    # 메뉴 특수문자 제거
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"]) # 식당 메뉴 불러오기.
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu) 
    
    # 리뷰 특수문자 제거 및 자음, 모음만 있는 것 삭제 후 tokenize 처리
    review=' '.join(str(s) for s in json_data["documents"][i]["review"])
    clean_review=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', review)
    clean_review=re.sub("([ㄱ-ㅎㅏ-ㅣ]+)","",clean_review)
    
    # total 리스트에 정리된 메뉴와 clean_review를 review_tokenize를 이용해 토큰화(형태소 분석)를 하고 select_tokenize를 이용해 필요한 단어들만 추출한 리뷰 추가
    total.append(clean_menu+" "+select_tokenize(review_tokenize(clean_review)))

# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

          광화문        카츠        유리        마초       뽕사부
광화문  1.000000  0.131537  0.060904  0.106722  0.113443
카츠   0.131537  1.000000  0.143579  0.115599  0.182881
유리   0.060904  0.143579  1.000000  0.089567  0.062792
마초   0.106722  0.115599  0.089567  1.000000  0.190343
뽕사부  0.113443  0.182881  0.062792  0.190343  1.000000


0.29578936763150376

In [49]:
vectorizer.get_feature_names()

['가게',
 '가격',
 '가깝다',
 '가끔',
 '가능하다',
 '가다',
 '가다가',
 '가세',
 '가출',
 '갈다',
 '갈비',
 '감사하다',
 '강남',
 '같다',
 '같이',
 '개판',
 '거리',
 '거절',
 '건지다',
 '걸어가다',
 '결국',
 '결혼식',
 '계산',
 '계속',
 '고객',
 '고기',
 '고추장불고기',
 '고프다',
 '공간',
 '괜찮다',
 '굉장하다',
 '군대',
 '굳다',
 '그거',
 '그냥',
 '그대로',
 '그래서',
 '그렇다',
 '근데',
 '근면',
 '기다리다',
 '기름',
 '김치유부주머니우동',
 '깐풍기',
 '깔끔하다',
 '끼다',
 '나다',
 '나라',
 '나서다',
 '나오다',
 '날치알',
 '남자',
 '내려오다',
 '냉면',
 '냉짬뽕8',
 '너무',
 '넘다',
 '넣다',
 '녹다',
 '놓다',
 '놨던거',
 '누르다',
 '눅눅하다',
 '느끼다',
 '다르다',
 '다시',
 '다시다',
 '단골',
 '달라',
 '당하다',
 '대다',
 '대비',
 '대신',
 '덥다',
 '뎁혀',
 '돈까스',
 '돌판구이',
 '돼지',
 '돼지갈비찜',
 '돼찬밥',
 '되다',
 '되어다',
 '두다',
 '뒤죽박죽',
 '들리다',
 '들어가다',
 '등심카츠14',
 '떡볶이',
 '떨어지다',
 '뜨겁다',
 '리뷰',
 '마나',
 '마초',
 '마키',
 '만들다',
 '만족하다',
 '많이',
 '말다',
 '맛없다',
 '맛있다',
 '맛집',
 '망하다',
 '맨날',
 '먹기',
 '먹다',
 '메뉴',
 '메뉴판',
 '몇번',
 '모두',
 '모르다',
 '모시',
 '무료',
 '무엇',
 '묽다',
 '뭐라다',
 '뭔가',
 '미지',
 '미지근하다',
 '바꾸다',
 '바쁘다',
 '바삭바삭',
 '반상',
 '받다',
 '방식',
 '방치',
 '버리다',
 '번창',
 '별로',
 '보관',
 '보다',
 '보시

### 3. 메뉴만( tokenize O)

In [50]:
reviews=[]
clean_review_tokenized=[]
clean_menu_tokenized=[]
total=[]
for i in range(len(json_data["documents"])):
    # 메뉴 특수문자 제거
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"])
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu)
   
    # 함수를 이용해 메뉴를 토큰화하고 total 리스트에 토큰화한 메뉴 추가
    total.append(select_tokenize(review_tokenize(clean_menu)))

# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

     광화문      카츠      유리   마초  뽕사부
광화문  1.0  0.0000  0.0000  0.0  0.0
카츠   0.0  1.0000  0.1474  0.0  0.0
유리   0.0  0.1474  1.0000  0.0  0.0
마초   0.0  0.0000  0.0000  1.0  0.0
뽕사부  0.0  0.0000  0.0000  0.0  1.0


0.21179202413362627

In [51]:
vectorizer.get_feature_names()

['갈비',
 '갈비찜',
 '고추장',
 '구이',
 '김치',
 '깐풍기',
 '날치',
 '돌판',
 '돼다',
 '돼지',
 '등심',
 '래미',
 '마초',
 '명란',
 '불고기',
 '삼겹살',
 '새우',
 '샐러드',
 '생목',
 '세트',
 '수제',
 '안심',
 '오니기리',
 '우동',
 '유부',
 '주머니',
 '짜장면',
 '짬뽕',
 '차돌',
 '찬밥',
 '참치',
 '치즈',
 '카츠',
 '크다',
 '크림',
 '탕수육']

In [52]:
total

[' 찬밥 돼다 찬밥 소 돌판 구이 소 돌판 구이 세트 인 돼지 돌판 구이 세트 인 돼지 갈비찜',
 ' 치즈 카츠 등심 카츠 특 안심 카츠 차돌 우동 얼 크다 명란 우동',
 ' 수제 유부 주머니 우동 김치 유부 주머니 우동 고추장 불고기 오니기리 참치 샐러드 오니기리 크다 래미 날치 알 오니기리',
 ' 마초 생 갈비 마초 갈비 마초 왕 갈비 생 삼겹살 생목 살',
 ' 짜장면 냉 짬뽕 탕수육 소 깐풍기 소 크림 새우 소']

### 3-1 메뉴만( tokenize : okt.phrases()를 이용하여 텍스트에서 어절을 뽑아낸다.)

In [53]:
reviews=[]
total=[]

menu_okt = Okt()
for i in range(len(json_data["documents"])):
    # 메뉴 정리
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"])
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu)
    clean_menu = re.sub(r'[0-9]+', '', clean_menu)

    # total 리스트에 정리된 메뉴와 리뷰 토큰화하여 추가
    total.append(" ".join(menu_okt.phrases(clean_menu)))

    
# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

     광화문        카츠        유리   마초  뽕사부
광화문  1.0  0.000000  0.000000  0.0  0.0
카츠   0.0  1.000000  0.008637  0.0  0.0
유리   0.0  0.008637  1.000000  0.0  0.0
마초   0.0  0.000000  0.000000  1.0  0.0
뽕사부  0.0  0.000000  0.000000  0.0  1.0


0.20069093992720666

In [54]:
reviews=[]
total=[]

menu_okt = Okt()
for i in range(len(json_data["documents"])):
    # 메뉴 정리
    menu=' '.join(str(s) for s in json_data["documents"][i]["menu"])
    clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu)
    clean_menu = re.sub(r'[0-9]+', '', clean_menu)

    menu_str=" ".join(menu_okt.phrases(clean_menu))
    total.append(" ".join(list(set(menu_str.split(" ")))))
    # total 리스트에 정리된 메뉴와 리뷰 토큰화하여 추가
   

    
# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

     광화문        카츠        유리   마초  뽕사부
광화문  1.0  0.000000  0.000000  0.0  0.0
카츠   0.0  1.000000  0.048203  0.0  0.0
유리   0.0  0.048203  1.000000  0.0  0.0
마초   0.0  0.000000  0.000000  1.0  0.0
뽕사부  0.0  0.000000  0.000000  0.0  1.0


0.2038562490010957

In [55]:
total

['돌판구이 갈비찜 구이 돼지 소찬밥 찬밥 돌판 세트 소 돼지갈비찜',
 '안심 특안심카츠 등심카츠 얼큰명란우동 차돌 치즈 우동 차돌우동 명란 등심 치즈카츠 얼 카츠',
 '오니기리 수제유부주머니우동 김치 고추장 고추장불고기 우동 날치알 참치 샐러드 김치유부주머니우동 유부 수제 불고기 날치 래미 주머니',
 '마초 생갈비 왕갈비 생삼겹살 삼겹살 생목살 갈비 생목',
 '크림중 새우 짬뽕 깐풍기 탕수육 소 짜장면 크림중새우 냉짬뽕']

In [56]:
vectorizer.get_feature_names()

['갈비',
 '갈비찜',
 '고추장',
 '고추장불고기',
 '구이',
 '김치',
 '김치유부주머니우동',
 '깐풍기',
 '날치',
 '날치알',
 '냉짬뽕',
 '돌판',
 '돌판구이',
 '돼지',
 '돼지갈비찜',
 '등심',
 '등심카츠',
 '래미',
 '마초',
 '명란',
 '불고기',
 '삼겹살',
 '새우',
 '샐러드',
 '생갈비',
 '생목',
 '생목살',
 '생삼겹살',
 '세트',
 '소찬밥',
 '수제',
 '수제유부주머니우동',
 '안심',
 '얼큰명란우동',
 '오니기리',
 '왕갈비',
 '우동',
 '유부',
 '주머니',
 '짜장면',
 '짬뽕',
 '차돌',
 '차돌우동',
 '찬밥',
 '참치',
 '치즈',
 '치즈카츠',
 '카츠',
 '크림중',
 '크림중새우',
 '탕수육',
 '특안심카츠']

In [57]:
total

['돌판구이 갈비찜 구이 돼지 소찬밥 찬밥 돌판 세트 소 돼지갈비찜',
 '안심 특안심카츠 등심카츠 얼큰명란우동 차돌 치즈 우동 차돌우동 명란 등심 치즈카츠 얼 카츠',
 '오니기리 수제유부주머니우동 김치 고추장 고추장불고기 우동 날치알 참치 샐러드 김치유부주머니우동 유부 수제 불고기 날치 래미 주머니',
 '마초 생갈비 왕갈비 생삼겹살 삼겹살 생목살 갈비 생목',
 '크림중 새우 짬뽕 깐풍기 탕수육 소 짜장면 크림중새우 냉짬뽕']

### 3-2. 리뷰만 (tokenize O)

In [58]:
reviews=[]
total=[]

for i in range(len(json_data["documents"])):

    # 리뷰 특수문자 제거 및 자음, 모음만 있는 것 삭제 후 tokenize 처리
    review=' '.join(str(s) for s in json_data["documents"][i]["review"])
    clean_review=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', review)
    clean_review=re.sub("([ㄱ-ㅎㅏ-ㅣ]+)","",clean_review)   

    
    # total 리스트에 정리된 리뷰 추가
    total.append(select_tokenize(review_tokenize(clean_review)))
    
# TfidVectorizer 적용
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(total).todense()

# cosine 유사도 분석
result = pd.DataFrame(cosine_similarity( X , X ))
result.columns = ['광화문', '카츠', '유리',"마초","뽕사부"]
result.index = ['광화문', '카츠', '유리',"마초","뽕사부"]
print(result)

# cosine 유사도 평균
cosine_similarity( X , X ).mean()

          광화문        카츠        유리        마초       뽕사부
광화문  1.000000  0.145664  0.075187  0.122873  0.127275
카츠   0.145664  1.000000  0.164554  0.123559  0.190484
유리   0.075187  0.164554  1.000000  0.106724  0.072910
마초   0.122873  0.123559  0.106724  1.000000  0.206121
뽕사부  0.127275  0.190484  0.072910  0.206121  1.000000


0.3068281911731574

In [59]:
vectorizer.get_feature_names()

['가게',
 '가격',
 '가깝다',
 '가끔',
 '가능하다',
 '가다',
 '가다가',
 '가세',
 '가출',
 '갈다',
 '갈비',
 '감사하다',
 '강남',
 '같다',
 '같이',
 '개판',
 '거리',
 '거절',
 '건지다',
 '걸어가다',
 '결국',
 '결혼식',
 '계산',
 '계속',
 '고객',
 '고기',
 '고프다',
 '공간',
 '괜찮다',
 '굉장하다',
 '군대',
 '굳다',
 '그거',
 '그냥',
 '그대로',
 '그래서',
 '그렇다',
 '근데',
 '근면',
 '기다리다',
 '기름',
 '깔끔하다',
 '끼다',
 '나다',
 '나라',
 '나서다',
 '나오다',
 '남자',
 '내려오다',
 '냉면',
 '너무',
 '넘다',
 '넣다',
 '녹다',
 '놓다',
 '놨던거',
 '누르다',
 '눅눅하다',
 '느끼다',
 '다르다',
 '다시',
 '다시다',
 '단골',
 '달라',
 '당하다',
 '대다',
 '대비',
 '대신',
 '덥다',
 '뎁혀',
 '돈까스',
 '되다',
 '되어다',
 '두다',
 '뒤죽박죽',
 '들리다',
 '들어가다',
 '떡볶이',
 '떨어지다',
 '뜨겁다',
 '리뷰',
 '마나',
 '마키',
 '만들다',
 '만족하다',
 '많이',
 '말다',
 '맛없다',
 '맛있다',
 '맛집',
 '망하다',
 '맨날',
 '먹기',
 '먹다',
 '메뉴',
 '메뉴판',
 '몇번',
 '모두',
 '모르다',
 '모시',
 '무료',
 '무엇',
 '묽다',
 '뭐라다',
 '뭔가',
 '미지',
 '미지근하다',
 '바꾸다',
 '바쁘다',
 '바삭바삭',
 '반상',
 '받다',
 '방식',
 '방치',
 '버리다',
 '번창',
 '별로',
 '보관',
 '보다',
 '보시',
 '보이다',
 '복도',
 '볶음',
 '볶음밥',
 '봉투',
 '부드럽다',
 '불다',
 '불친절',
 '붙다',
 '비빔밥',
 '비싸다',
 '빨리',
 '빼다',
 

### 결론 : 
1. 토큰화를 진행하면 불필요한 단어를 제거해줌으로써 유사도가 높아진다.
2. 어간을 추출하여 토큰화 방식을 진행하면 같은 의미의 단어 중복을 방지하고 명사, 형용사, 동사, 부사만 뽑아내어 불필요한 단어를 없앤다.
3. 메뉴 같은 경우는 어간 추출 방식이 적합하지 않아 어절 단위로 추출한다. 어절 단위로 추출하면 치즈카츠와 같은 단어는 치즈카츠,치즈,카츠로 나눌 수 있다.
-> 리뷰와 메뉴를 합쳐서 유사도를 계산하면 메뉴의 영향이 낮아져 따로 추출하여 가중치를 부여하는 방식으로 진행한다. 
여기서 리뷰는 어간추출 메뉴는 어절추출 방식으로 토큰화를 진행한다.

# (최종) category_menu_review_sim_update

In [60]:
with open('kakao_data.json', 'r',encoding="utf-8") as f:
    json_data = json.load(f)

In [61]:
def review_tokenize(review : str) -> tuple:
    okt = Okt()
    Okt_morphs=okt.pos(review,norm=True,stem=True)  # 형태소 분석
    return Okt_morphs

### * 아래 dataframe 구분자 콤마에서 띄어쓰기로 변경 *

In [62]:
def select_tokenize(tokenize : tuple) -> str:
    filter_review=""
    for word, pos in tokenize:
#        if pos in STOP_WORDS: #리뷰들 보면서 불용어 직접 추가해야 됨
#            pass
        if pos == 'Noun' or pos == "Verb" or pos == "Adjective" or pos == "Adverb":
            filter_review=filter_review+word+" "  
    return filter_review[:-1]

In [63]:
name_count=0
cate_count=0
menu_count=0
review_count=0

for i in range(len(json_data["documents"])):
    if json_data["documents"][i]["place_name"] == "":
        name_count+=1
    elif json_data["documents"][i]["category_name"] == "":
        cate_count+=1
    elif json_data["documents"][i]["menu"] == []:
        menu_count+=1
    elif json_data["documents"][i]["review"] == []:
        review_count+=1

print("가게 결측치 개수 : ",name_count)
print("카테고리 결측치 개수 : ",cate_count)
print("메뉴 결측치 개수 : ",menu_count)
print("리뷰 결측치 개수 : ",review_count)

가게 결측치 개수 :  0
카테고리 결측치 개수 :  0
메뉴 결측치 개수 :  101
리뷰 결측치 개수 :  9


###  **메뉴 토큰화 방식 어절 추출 방식으로 적용 **
- 어간 추출 : 추천사,워,도우,추천,크루,상,바게트,브리,오슈,번,골든,식빵,플레인,식빵,치아바타,호밀빵,뺑,쇼콜라,브런치
- 어절 추출 : 추천크루와상 식빵 바게트 추천사워도우 치아바타 오쇼콜라 브리오슈 번 플레인 추천사 추천크루 브리 호밀빵 골든 골든식빵 Citr 크루 100% 추천 Soda 14 Cappuccino 오슈 브런치 도우 Berry Chez Caf Latte

In [64]:
reviews=[]
store=[]
menus=[]
category=[]

menu_okt = Okt()
for i in range(len(json_data["documents"])):
    
    if json_data["documents"][i]["place_name"] == "":
        store.append( "")
    else:
        store.append(json_data["documents"][i]["place_name"])
        
    if json_data["documents"][i]["category_name"] == "":
        category.append("")
    else:
        category.append(json_data["documents"][i]["category_name"])
    
    if json_data["documents"][i]["menu"]==[]:
        menus.append("")
    else:
        menu=' '.join(str(s) for s in json_data["documents"][i]["menu"])
        clean_menu=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', menu)
        menu_str=" ".join(menu_okt.phrases(clean_menu))
        menus.append(" ".join(list(set(menu_str.split(" "))))) 
    
    if json_data["documents"][i]["review"]==[]:
        reviews.append("")
    else:
        review=' '.join(str(s) for s in json_data["documents"][i]["review"])
        clean_review=re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', '', review)
        clean_review=re.sub("([ㄱ-ㅎㅏ-ㅣ]+)","",clean_review)
        reviews.append(select_tokenize(review_tokenize(clean_review)))
    

In [65]:
df_store = pd.DataFrame(store,columns=["place_name"])
df_category = pd.DataFrame(category, columns=["category_name"])
df_menu = pd.DataFrame(menus, columns=["menu_tokenized"])
df_review = pd.DataFrame(reviews, columns=["review_tokenized"])

In [66]:
concat=pd.concat([df_store,df_category,df_menu,df_review],axis=1)

In [67]:
concat

Unnamed: 0,place_name,category_name,menu_tokenized,review_tokenized
0,젠제로,음식점 > 간식 > 아이스크림,,맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이...
1,품서울,음식점 > 한식 > 한정식,,아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 ...
2,쉐즈알렉스,"음식점 > 간식 > 제과,베이커리",치아바타 Caf 브리오슈 식빵 Citr 브리 Cappuccino 바게트 14 추천사...,가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 ...
3,일상정원 코엑스점,음식점 > 일식,미소 구름 한우육회 버터 구이 육회 스키야키관서식 관서식 해물뚝배기 한우 장어구이 ...,예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 ...
4,하랑,"음식점 > 일식 > 돈까스,우동",,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 ...
...,...,...,...,...
641,동경규동 삼성점,음식점 > 퓨전요리 > 퓨전일식,김치 김치가츠동 가츠동 우동 끼우동 얼큰우동 니 규동 김치규동 얼,일주일 두 번 들리다 간편하다 점심 저녁 동시 하다 수 있다 맛집 이다 우동 국물 ...
642,힘난다버거 코엑스점,음식점 > 양식 > 햄버거,,맛있다 가격 대비 훌륭하다 맛 이다 후 라이 너무 짜지다 않다 포솔포솔 두껍다 감자...
643,에그드랍 파르나스몰점,음식점 > 패스트푸드 > 샌드위치 > 에그드랍,햄 치킨 베이컨 데리야끼 미스터 클럽 아메리칸 샌드위치 치즈 아메리카노 바베큐 카페...,드랍 위치 파르 스몰 현대 백화점 방향 이다 카카오 맵 검색 하다 멀리 떨어지다 곳...
644,원조을지로골뱅이,음식점 > 한식,계란뱅이 오뎅 골뱅이 계란 통닭 뱅이 오뎅탕 통닭뱅이 닭도리탕,아직 이집 맛있다 골뱅이 무치다 먹다 봄 통닭구이 육전 같이 먹다 정말 맛남


In [68]:
#concat.to_csv("menu_review_tokenized.csv")

In [69]:
concat.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 646 entries, 0 to 645
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   place_name        646 non-null    object
 1   category_name     646 non-null    object
 2   menu_tokenized    646 non-null    object
 3   review_tokenized  646 non-null    object
dtypes: object(4)
memory usage: 20.3+ KB


In [70]:
concat["category_name"].value_counts()

음식점 > 한식 > 육류,고기             85
음식점 > 한식                     46
음식점 > 중식 > 중화요리              27
음식점 > 양식 > 이탈리안              22
음식점 > 한식 > 국수                21
                             ..
음식점 > 뷔페 > 해산물뷔페              1
음식점 > 패밀리레스토랑 > 캘리포니아피자키친     1
음식점 > 양식 > 해산물 > 바닷가재         1
음식점 > 한식 > 감자탕                1
음식점 > 한식 > 쌈밥                 1
Name: category_name, Length: 111, dtype: int64

In [71]:
concat_category=concat["category_name"].str.split(">")

In [72]:
concat_category.str.get(0).value_counts()

음식점     646
Name: category_name, dtype: int64

In [73]:
concat_category.str.get(1).value_counts()

 한식          299
 술집           56
 한식           46
 일식           38
 양식           36
 중식           32
 양식           20
 치킨           20
 분식           11
 일식           10
 아시아음식        10
 분식            9
 뷔페            8
 중식            7
 간식            7
 치킨            6
 패스트푸드         5
 뷔페            5
 샤브샤브          4
 퓨전요리          3
 도시락           3
 술집            2
 샐러드           2
 샤브샤브          2
 패밀리레스토랑       2
 아시아음식         2
 패스트푸드         1
Name: category_name, dtype: int64

In [74]:
concat_category.str.get(2).value_counts()

 육류,고기     85
 육류,고기     53
 해물,생선     40
 중화요리      27
 이탈리안      22
           ..
 BHC치킨      1
 일본식라면      1
 김밥천국       1
 일식집        1
 지코바        1
Name: category_name, Length: 76, dtype: int64

In [75]:
concat["category_name"]= concat["category_name"].str.replace('>', '')
concat["category_name"]= concat["category_name"].str.replace(',', ' ')

In [76]:
concat

Unnamed: 0,place_name,category_name,menu_tokenized,review_tokenized
0,젠제로,음식점 간식 아이스크림,,맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이...
1,품서울,음식점 한식 한정식,,아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 ...
2,쉐즈알렉스,음식점 간식 제과 베이커리,치아바타 Caf 브리오슈 식빵 Citr 브리 Cappuccino 바게트 14 추천사...,가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 ...
3,일상정원 코엑스점,음식점 일식,미소 구름 한우육회 버터 구이 육회 스키야키관서식 관서식 해물뚝배기 한우 장어구이 ...,예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 ...
4,하랑,음식점 일식 돈까스 우동,,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 ...
...,...,...,...,...
641,동경규동 삼성점,음식점 퓨전요리 퓨전일식,김치 김치가츠동 가츠동 우동 끼우동 얼큰우동 니 규동 김치규동 얼,일주일 두 번 들리다 간편하다 점심 저녁 동시 하다 수 있다 맛집 이다 우동 국물 ...
642,힘난다버거 코엑스점,음식점 양식 햄버거,,맛있다 가격 대비 훌륭하다 맛 이다 후 라이 너무 짜지다 않다 포솔포솔 두껍다 감자...
643,에그드랍 파르나스몰점,음식점 패스트푸드 샌드위치 에그드랍,햄 치킨 베이컨 데리야끼 미스터 클럽 아메리칸 샌드위치 치즈 아메리카노 바베큐 카페...,드랍 위치 파르 스몰 현대 백화점 방향 이다 카카오 맵 검색 하다 멀리 떨어지다 곳...
644,원조을지로골뱅이,음식점 한식,계란뱅이 오뎅 골뱅이 계란 통닭 뱅이 오뎅탕 통닭뱅이 닭도리탕,아직 이집 맛있다 골뱅이 무치다 먹다 봄 통닭구이 육전 같이 먹다 정말 맛남


### Countervectorizer를 이용하여 카테고리 유사도 구하기

In [77]:
from sklearn.feature_extraction.text import CountVectorizer  # 피체 벡터화
from sklearn.metrics.pairwise import cosine_similarity  # 코사인 유사도


count_vect_category = CountVectorizer(min_df=0, ngram_range=(1,2))
place_category = count_vect_category.fit_transform(concat["category_name"]) 
place_simi_cate = cosine_similarity(place_category, place_category) 
#place_simi_cate_sorted_ind = place_simi_cate.argsort()[:, ::-1]

In [78]:
cosine_similarity(place_category, place_category).mean()

0.3238454010371664

In [79]:
category_result=pd.DataFrame(place_simi_cate)
category_result.columns = concat["category_name"]
category_result.index = concat["category_name"]
category_result

category_name,음식점 간식 아이스크림,음식점 한식 한정식,음식점 간식 제과 베이커리,음식점 일식,음식점 일식 돈까스 우동,음식점 한식 육류 고기 닭요리,음식점 일식,음식점 술집 일본식주점,음식점 술집 일본식주점,음식점 한식 육류 고기,...,음식점 한식 육류 고기,음식점 한식 육류 고기,음식점 술집 호프 요리주점,음식점 한식 해물 생선,음식점 한식 육류 고기 곱창 막창,음식점 퓨전요리 퓨전일식,음식점 양식 햄버거,음식점 패스트푸드 샌드위치 에그드랍,음식점 한식,음식점 한식 육류 고기
category_name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
음식점 간식 아이스크림,1.000000,0.200000,0.507093,0.258199,0.169031,0.149071,0.258199,0.200000,0.200000,0.169031,...,0.169031,0.169031,0.169031,0.169031,0.134840,0.200000,0.200000,0.169031,0.258199,0.169031
음식점 한식 한정식,0.200000,1.000000,0.169031,0.258199,0.169031,0.447214,0.258199,0.200000,0.200000,0.507093,...,0.507093,0.507093,0.169031,0.507093,0.404520,0.200000,0.200000,0.169031,0.774597,0.507093
음식점 간식 제과 베이커리,0.507093,0.169031,1.000000,0.218218,0.142857,0.125988,0.218218,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,0.142857,0.218218,0.142857
음식점 일식,0.258199,0.258199,0.218218,1.000000,0.654654,0.192450,1.000000,0.258199,0.258199,0.218218,...,0.218218,0.218218,0.218218,0.218218,0.174078,0.258199,0.258199,0.218218,0.333333,0.218218
음식점 일식 돈까스 우동,0.169031,0.169031,0.142857,0.654654,1.000000,0.125988,0.654654,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,0.142857,0.218218,0.142857
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
음식점 퓨전요리 퓨전일식,0.200000,0.200000,0.169031,0.258199,0.169031,0.149071,0.258199,0.200000,0.200000,0.169031,...,0.169031,0.169031,0.169031,0.169031,0.134840,1.000000,0.200000,0.169031,0.258199,0.169031
음식점 양식 햄버거,0.200000,0.200000,0.169031,0.258199,0.169031,0.149071,0.258199,0.200000,0.200000,0.169031,...,0.169031,0.169031,0.169031,0.169031,0.134840,0.200000,1.000000,0.169031,0.258199,0.169031
음식점 패스트푸드 샌드위치 에그드랍,0.169031,0.169031,0.142857,0.218218,0.142857,0.125988,0.218218,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,1.000000,0.218218,0.142857
음식점 한식,0.258199,0.774597,0.218218,0.333333,0.218218,0.577350,0.333333,0.258199,0.258199,0.654654,...,0.654654,0.654654,0.218218,0.654654,0.522233,0.258199,0.258199,0.218218,1.000000,0.654654


In [80]:
category_result.sort_values(by=category_result.index[0],ascending=False)

category_name,음식점 간식 아이스크림,음식점 한식 한정식,음식점 간식 제과 베이커리,음식점 일식,음식점 일식 돈까스 우동,음식점 한식 육류 고기 닭요리,음식점 일식,음식점 술집 일본식주점,음식점 술집 일본식주점,음식점 한식 육류 고기,...,음식점 한식 육류 고기,음식점 한식 육류 고기,음식점 술집 호프 요리주점,음식점 한식 해물 생선,음식점 한식 육류 고기 곱창 막창,음식점 퓨전요리 퓨전일식,음식점 양식 햄버거,음식점 패스트푸드 샌드위치 에그드랍,음식점 한식,음식점 한식 육류 고기
category_name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
음식점 간식 아이스크림,1.000000,0.200000,0.507093,0.258199,0.169031,0.149071,0.258199,0.200000,0.200000,0.169031,...,0.169031,0.169031,0.169031,0.169031,0.134840,0.200000,0.200000,0.169031,0.258199,0.169031
음식점 간식 아이스크림 배스킨라빈스,0.845154,0.169031,0.428571,0.218218,0.142857,0.125988,0.218218,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,0.142857,0.218218,0.142857
음식점 간식 초콜릿,0.600000,0.200000,0.507093,0.258199,0.169031,0.149071,0.258199,0.200000,0.200000,0.169031,...,0.169031,0.169031,0.169031,0.169031,0.134840,0.200000,0.200000,0.169031,0.258199,0.169031
음식점 간식 제과 베이커리,0.507093,0.169031,1.000000,0.218218,0.142857,0.125988,0.218218,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,0.142857,0.218218,0.142857
음식점 간식 제과 베이커리,0.507093,0.169031,1.000000,0.218218,0.142857,0.125988,0.218218,0.169031,0.169031,0.142857,...,0.142857,0.142857,0.142857,0.142857,0.113961,0.169031,0.169031,0.142857,0.218218,0.142857
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
음식점 한식 육류 고기 닭요리 삼계탕,0.134840,0.404520,0.113961,0.174078,0.113961,0.904534,0.174078,0.134840,0.134840,0.797724,...,0.797724,0.797724,0.113961,0.341882,0.636364,0.134840,0.134840,0.113961,0.522233,0.797724
음식점 한식 육류 고기 곱창 막창,0.134840,0.404520,0.113961,0.174078,0.113961,0.703526,0.174078,0.134840,0.134840,0.797724,...,0.797724,0.797724,0.113961,0.341882,1.000000,0.134840,0.134840,0.113961,0.522233,0.797724
음식점 한식 육류 고기 족발 보쌈 가장맛있는족발,0.124035,0.372104,0.104828,0.160128,0.104828,0.647150,0.160128,0.124035,0.124035,0.733799,...,0.733799,0.733799,0.104828,0.314485,0.585369,0.124035,0.124035,0.104828,0.480384,0.733799
음식점 한식 육류 고기 족발 보쌈 가장맛있는족발,0.124035,0.372104,0.104828,0.160128,0.104828,0.647150,0.160128,0.124035,0.124035,0.733799,...,0.733799,0.733799,0.104828,0.314485,0.585369,0.124035,0.124035,0.104828,0.480384,0.733799


### Countervectorizer를 이용하여 메뉴 유사도 구하기

In [81]:
count_vect_menu = CountVectorizer(min_df=0, ngram_range=(1,2))
place_menu = count_vect_category.fit_transform(concat["menu_tokenized"]) 
place_simi_menu = cosine_similarity(place_menu, place_menu) 

In [82]:
place_simi_menu.mean()

0.00877972274596571

In [83]:
menu_result=pd.DataFrame(place_simi_menu)
menu_result.columns = concat["menu_tokenized"]
menu_result.index = concat["menu_tokenized"]
menu_result

menu_tokenized,Unnamed: 1_level_0,Unnamed: 2_level_0,치아바타 Caf 브리오슈 식빵 Citr 브리 Cappuccino 바게트 14 추천사 골든식빵 플레인 Latte 추천크루 오슈 추천사워도우 Soda Berry 크루 Chez 추천크루와상 도우 브런치 오쇼콜라 번 100% 추천 호밀빵 골든,미소 구름 한우육회 버터 구이 육회 스키야키관서식 관서식 해물뚝배기 한우 장어구이 스키야키 텐동 전복 관동식 스키야키관동식,Unnamed: 5_level_0,순살 치즈 순살찜닭 찜닭 치즈찜닭 묵사발세트 소 사발 세트 2인 해물,Unnamed: 7_level_0,유린 설숯불구이 유린기 구이 숯불구이 족발 모 굴튀김 일본식 숯불 튀김 덴뿌라,오뎅 곤약 물떡 봉오뎅 유부주머니 물결 물결오뎅 유부 주머니,오뎅 250g 징기스칸 양갈비 양고기200g 프렌치 프렌치랙180200g 200g 180200g 양고기,...,고기 LA 김치찌개 명품 LA갈비정식 중 한돈 차돌 곱창전골 전골 평양 냉면 한우 한돈김치찌개 갈비 안동 육회비빔밥 디너 고기된장 곰탕 수육 육회 명품갈비탕 국밥 버섯 불고기 사태 정식 150g 양곰탕 차돌된장 한우치 비빔밥 스페셜 배꼽 런치 아롱사태 안심 한우스페셜 인분 맛살 장정식 옥돔 갈비탕 된장 1인분 꽃게,고기 LA 김치찌개 명품 LA갈비정식 중 한돈 차돌 곱창전골 전골 평양 냉면 한우 한돈김치찌개 갈비 안동 육회비빔밥 디너 고기된장 곰탕 수육 육회 명품갈비탕 국밥 버섯 불고기 사태 정식 150g 양곰탕 차돌된장 한우치 비빔밥 스페셜 배꼽 런치 아롱사태 안심 한우스페셜 인분 맛살 장정식 옥돔 갈비탕 된장 1인분 꽃게,생굴 한우육회 육전 육회 데침 한우 튀김 홍합 꼬막,생굴 한우육회 육전 육회 데침 한우 튀김 홍합 꼬막,양 볶음밥 김치국밥 대창 김치 곱창 양밥 국밥,김치 김치가츠동 가츠동 우동 끼우동 얼큰우동 니 규동 김치규동 얼,Unnamed: 18_level_0,햄 치킨 베이컨 데리야끼 미스터 클럽 아메리칸 샌드위치 치즈 아메리카노 바베큐 카페라떼 더블,계란뱅이 오뎅 골뱅이 계란 통닭 뱅이 오뎅탕 통닭뱅이 닭도리탕,150g 김치 안심 등심150g 제육 삼겹살 한우 1 등심 안심150g 숙성 180g 매콤
menu_tokenized,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.000000
,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.000000
치아바타 Caf 브리오슈 식빵 Citr 브리 Cappuccino 바게트 14 추천사 골든식빵 플레인 Latte 추천크루 오슈 추천사워도우 Soda Berry 크루 Chez 추천크루와상 도우 브런치 오쇼콜라 번 100% 추천 호밀빵 골든,0.0,0.0,1.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.000000
미소 구름 한우육회 버터 구이 육회 스키야키관서식 관서식 해물뚝배기 한우 장어구이 스키야키 텐동 전복 관동식 스키야키관동식,0.0,0.0,0.0,1.00000,0.0,0.000000,0.0,0.039193,0.000000,0.000000,...,0.037656,0.037656,0.130682,0.130682,0.000000,0.000000,0.0,0.0,0.0,0.037450
,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.000000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
김치 김치가츠동 가츠동 우동 끼우동 얼큰우동 니 규동 김치규동 얼,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.071611,1.000000,0.0,0.0,0.0,0.053838
,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.000000
햄 치킨 베이컨 데리야끼 미스터 클럽 아메리칸 샌드위치 치즈 아메리카노 바베큐 카페라떼 더블,0.0,0.0,0.0,0.00000,0.0,0.047836,0.0,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,1.0,0.0,0.000000
계란뱅이 오뎅 골뱅이 계란 통닭 뱅이 오뎅탕 통닭뱅이 닭도리탕,0.0,0.0,0.0,0.00000,0.0,0.000000,0.0,0.000000,0.058824,0.055641,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.0,0.0,1.0,0.000000


### TfidfVectorizer 이용하여 리뷰 유사도 구하기

In [84]:
vectorizer = TfidfVectorizer()
tf_review = vectorizer.fit_transform(concat["review_tokenized"]).todense()
place_simi_review = cosine_similarity(tf_review, tf_review) 

review_result=pd.DataFrame(place_simi_review)
review_result.columns = concat["review_tokenized"]
review_result.index = concat["review_tokenized"]
review_result

review_tokenized,맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이제 베 갈다 같다 짜다 짤 이토마토 쌀 라즈베리 피스타치오 먹다 보다 다 맛있다 특히 피흐 타치 오 정말 꼬소 유럽 먹다 덥다 그 감동 맛 이다 최고 매일 사먹다 다른 젤라또 가게 두 배다 더 맛있다 맛있다 욤 널 나오다 때 오다 싶다 쌀 올리브 당근 맛있슴 맛 비다 직원 응대 차다 아쉽다 매장 이다 최근 또 괜찮다 타 젤라또 업 대비 참신하다 조합 시도 돋보이다 플레이 버 많다 좋다 단 맛 강하다 단골 이다 가격 말 안되다 오르다 주문 받다 직원 응대 너무 답답하다 스무고개 하다 줄 알다 보 냉포 안되다 하다 나중 보냉 추가 하다 물어보다 점 점 수정 하다 주민 젠 제로 초기 때 가다 근데 최근 지나치다 돈독 오르다 같다 맛 점점 사라지다 심지어 전 기본 맛 이다 이제 프리미엄 돈 받다 게 비싸다 맛 내다 돈 벌리다 수작 보이다 가격 점점 선 넘다 진짜 맨날 먹다 젤라또 쫀득함 거의 없다 맛 특이하다 소프트 아이스크림 집 정도 하다 번 가보다 하다 곳 음식 새롭다 시도 좋아하다 좋아하다 밤꿀 너무 달다 제 취향 아니다 감태 추천 하다 술안주 가지 맛 사서 하다 통 다 먹다 건강하다 아이스크림 맛 특이하다 아이스크림 최고 젠 제로 먹다 다른 젤라또 못 먹다 재료 본연 맛 자다 살리다 아이스크림 정말 너무 너무 좋아하다 곳 이다 젤라또 정말 좋아하다 젠 제로 하다 곳 없다 감태 카라멜 진짜 꼭 들다 보새 가격 있다 가치 그 이상 미식 무엇 배우다 곳 머리 열리다 젤라또 세계 이 시국 너무 다닥다닥 이르다 걱정 되다 점 빼다 감태 리조 먹다 진짜 맛있다 특히 감태 특이하다 맛 나다 또 먹다 맛 괜찮다 손님 대하 응대 방식 정말 아쉽다 초창 기 비다 맛 조금 변하다 느낌 존맛 고급스럽다 맛 우리 집 근처 이다 운 피 스타 자두 소르베 쫀득하 넘다 맛있다,아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 식 자재 과연 이 가격 어울리다 요 오래전 부터 다니다 프랑스 타이어 회사 별 같다 예약 예전 할하 않다 음식 정말 깔끔하다 좋다 저녁 창가 쪽 앉다 경치 좋다 지방 이사 하다 서울 그립다 맛집 중 하나 친절하다 음식 깔끔하다 인테리어 예쁘다 좋다 저희 가족 좀 싱겁다 먹다 펴다 음식 간이 약간 있다 이 점 빼다 완벽하다 식사 이다 기대하다 훨 맛있다 다 식사 하다 곳 찾다 추천 노 영희 서비스 좋다 음식 맛 좋다 살짝 아쉽다 부분 전복 약간 비리다 신년 가족 모임 주말 방문 하다 맛 흠잡다 없다 서빙 하다 분 미쉘 린 스타 답지 않다 특히 나 넘어서다 브레이크 타임 때문 쉬다 하다 건지다 빨리 계산 나가다 눈치 주다 맛 최고 서빙 하다 분 서비스 개선 필요하다 서빙 하다 분 음식 설명 좀 도 프로 답 해주다 하다 같다,가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 겉 바삭 속 풍 밉다 부드럽다 많이 바스러지다 그래도 커피 와인 먹다 싶다 생각 들다 지하 베이커리 지상 브런치 운영 오래되다 주택 개조 하다 접근성 계단 지하 위치 빵집 경사 마련 해주다 좋다 브런치 맛있다 양은 적다 편입 니 밥 먹다 건지다 밥 되다 건지다 음식 적다 진짜 맛있다 입 입 엄청 음미 하다 먹엇어 고급 지고 분위기 좋다 와인 조금 아쉽다 음식 맛 있다 양 적다 분위기 좋다 평일 저녁 당일 예약 가능하다 방문 하다 음식 너무 맛있다 분위기 좋다 다만 직원 목소리 작다 뭐라다 하다 자다 들리다 않다 분위기 좋다 음식 괜춘 짱짱 먹다 하다 음식 이 가격 이렇다 분위기 이렇다 서비스 요리 가격 비다 너무 떨어지다 서비스 눈물나다,예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 깔다 끄다 구름 스끼야끼 짜다 조르다 육수 조금씩 부어 먹다 미소 스끼야끼 육수 푹 담그다 먹다 비교 담백하다 맛 가격 다소 있다 재 방문 의사 있다 저 개인 구름 스끼야끼 맛있다 분위기 맛집 맛 기대하다 말다 낫 배드 깔끔하다 인테리어 고기 냄새 남 기대 너무 많이 하다 보다 어 수선 맛 소 분위기 괜찮다 깔다 끄다 정갈하다 식사 하다 좋다 곳 육회 잡다 안나 맛있다,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 가다 하다 제 자리다 비우다 맛있다 튀김 정도 아주 딱이다 부드럽다 정말 맛있다 튀김 기름 좋다 거 써다 덜 느끼하다 맛있다 고기 두툼해 끼 식사 최고 이다 카레 추다 추천 드리다 말 하다 뭐해 완전 맛집 임 진짜 맛있다 또 먹다 최고 맛있다 인정 양도 꽤 많다 괜찮다 이 동네 몇개 월 넘다 지나다 이 가게 있다 전혀 모르다 너무 눈 안 띄다 최고,코엑스 안 있다 가게 접근성 정말 닭 없다 면 감자 듬뿍 들다 동치미 벌레 나오다 직원 너무나 당연하다 초파리 이다 하다 평소 초파리 얼마나 많다 보지 않다 초파리 알다 밥 퍽퍽 떡 맛없다 전 맵다 맛 시키다 맛있다 리뷰 적다 지금 야식 타임 그렇다 또 먹다 싶다 완전 맛있다 당면 넉넉하다,우선 그릇 예쁘다 먹다 때 대접받다 기분 나다 서비스 최고 이다 셰프 친절 유쾌하다 대화 분위기 보다 적절하다 설명 침묵 섞다 좋다 다만 구성은 다른 스시 오다 크게 것 없다 보이다 여기다 런치 약간 임팩트 부족하다 장사 안되다 홍보 알바 쓰다 보다 만족스럽다 식사 이다 특히 샤리 취향 자다 맞다 구성 괜찮다 맛 괜찮다 서빙 괜찮다 술 마시기 좋다 곳 접시 보다 인스타 용 같다 그 정도 좋다 접시 만족 스시 불만족,맛있다 욤,사장 너무 친절하다 지다 여 오뎅 바 넘다 좋아하다 너무나 취향 저격 당하다 감다 다음 친구 데리다 또 갈고 생맥주 아웃 오뎅 육수 맛있다 다른 안주 분위기 그닥 특별하다 점 느끼다 부띠 끄다 느낌 빙 두르다 앉다 먹다 마시다 집 분위기 좋다 갠 자리 불피욘 동성 끼리 가도 불피욘,사장 친절하다 고기 진짜 맛있다 자주 가게 되다 식당 이다 청담 점 좋다 맛있다 직원 차다 교육 필요하다 밥 먹다 앞 수다 떨다 말 듣다 시끄럽다 최악,...,회사 야근 후 지하 있다 식당 밥겸 간단하다 하다 잔 하다 가다 갈비 정식 시키다 생각 너무 맛있다 깜짝 놀라다 찬 맛있다 저녁 술 하다 잔 모두 충족 되다 곳 앞 자주 갈다 하다 토요일 오 앉다 주문 고기 나오다 때 기다리다 심지어 사람 많다 직접 굽다 댐 사람 없다 때 모르다 주말 비추다 가족 고기 먹다 가다 아이 맛있다 또 오자 하다 맛있다 굽다 감사하다 최근 먹다 소고기 중 최고 맛있다 특특급 사르르 녹음 소고기 굽다 먹다 오다 입 사르르 녹다 폭풍 흡입 하다 넘다 맛 나다 인테리어 깔끔하다 룸 따로 있다 넘다 편하다 먹다 오다 차돌박이 먹다 고소하다 맛있다 여기다 오다 하다 두께 조절 맞추다 넘다 기분 좋다 반찬 깔끔하다 친절하다 안내 하다 주심 음식 정갈하다 맛있다 다시 또 찾다 되다 같다 먹다 감사하다 고기 정말 맛있다 최 곱다 김치찌개 갈비탕 다 맛있다 반찬 맛있다 또 생각나다 곳 이다 넓다 좋다 호선 봉은사 역 가다 배꼽 집 밥 먹다 가다 갈비탕 시키다 국물 맛있다 고기 맛있다 반찬 맛있다 소고기 먹다 후식 냉면 먹다 고기 냉면 맛있다 엄마 같이 코엑스 가다 밥 먹다 곳 찾아가다 배꼽 집 차다 갈비 정식 시키다 먹다 엄마 맛있다 다 들다 기분 좋다 엄마 고기 맛있다 반찬 맛있다 나중 또 오자 심 차다 갈비 맛 정식 냉면 밑반찬 포함 갈비 냉면 너무 맛있다 왜 이리 매장 넓다 개인 룸 불금 그렇다 회식 많다 매장 쾌적하다 이쁘다 가끔 들다 분위기 있다 좋다 또 오다 싶다 곳 다음 육회 먹다 오다 육회 맛있다 보임 코엑스 가면 종종 들르다 곳 소고기 맛있다 돈 김치찌개 만족하다 점심식사 갈다 때 직원 친절하다 기분 좋다 먹다 인테리어 깔끔하다 내부 넓다 회식 하다 좋다 곳 이다 호선 삼성역 가깝다 호선 봉은사 역 지하 입구 바로 앞 있다 찾기 쉽다 저번 코엑스몰 가다 때 가족 고기 먹다 정말 부드럽다 맛있다 또 려고 찜 해 두다 곳 이번 저녁식사 얼큰하다 김치찌개 한우 사태 곰탕 반하다 가다 콜키 프리 다음 번 회식 때 와인 챙기다 오다 하다 매장 넓다 깨끗하다 친절하다 너무 맛있다 회사 끝나다 봉은사 역 근처 분위기 좋다 레스토랑 줄알 들어가다 국밥 있다 반갑다 제 알다 김치찌개 손 꼽 정도 맛있다 대박 다시 오다 겁니다 돈 김치찌개 시키다 맛 나쁘다 않다 고기 너무 적다 아쉽다 테이블 크다 깔끔하다 반찬 맛있다 하다 소고기 먹다 마감 라거 함 아니다 하다 자기 집 빨 리가 야하다 마감 나오다 기준 없다 식당 오픈 초기 너무 달라지다 이다 갈비 정식 시키다 아래 사진 인분 고기 양 질 모두 최악 이다 보다 갈비 이상 뼈 남다 중 은 비계 살코기 정말 지다 고요 비싸다 돈 내다 된장찌개 공기밥 먹다 오다 황당하다 간만 사진 리뷰 남기다 직장 근처 코엑스 안 고기 먹다 때 가끔 가다 작년 중반 실망 스럽다 오늘 부로 갈다 듯 하다 접기 점심 때 사람 많다 오금 불친절하다 저 여기 물냉면 맛있다 호불호 극 갈림 그 곰탕 진짜 맛있다 물냉 시키다 반찬 나오다 왜,회사 야근 후 지하 있다 식당 밥겸 간단하다 하다 잔 하다 가다 갈비 정식 시키다 생각 너무 맛있다 깜짝 놀라다 찬 맛있다 저녁 술 하다 잔 모두 충족 되다 곳 앞 자주 갈다 하다 토요일 오 앉다 주문 고기 나오다 때 기다리다 심지어 사람 많다 직접 굽다 댐 사람 없다 때 모르다 주말 비추다 가족 고기 먹다 가다 아이 맛있다 또 오자 하다 맛있다 굽다 감사하다 최근 먹다 소고기 중 최고 맛있다 특특급 사르르 녹음 소고기 굽다 먹다 오다 입 사르르 녹다 폭풍 흡입 하다 넘다 맛 나다 인테리어 깔끔하다 룸 따로 있다 넘다 편하다 먹다 오다 차돌박이 먹다 고소하다 맛있다 여기다 오다 하다 두께 조절 맞추다 넘다 기분 좋다 반찬 깔끔하다 친절하다 안내 하다 주심 음식 정갈하다 맛있다 다시 또 찾다 되다 같다 먹다 감사하다 고기 정말 맛있다 최 곱다 김치찌개 갈비탕 다 맛있다 반찬 맛있다 또 생각나다 곳 이다 넓다 좋다 호선 봉은사 역 가다 배꼽 집 밥 먹다 가다 갈비탕 시키다 국물 맛있다 고기 맛있다 반찬 맛있다 소고기 먹다 후식 냉면 먹다 고기 냉면 맛있다 엄마 같이 코엑스 가다 밥 먹다 곳 찾아가다 배꼽 집 차다 갈비 정식 시키다 먹다 엄마 맛있다 다 들다 기분 좋다 엄마 고기 맛있다 반찬 맛있다 나중 또 오자 심 차다 갈비 맛 정식 냉면 밑반찬 포함 갈비 냉면 너무 맛있다 왜 이리 매장 넓다 개인 룸 불금 그렇다 회식 많다 매장 쾌적하다 이쁘다 가끔 들다 분위기 있다 좋다 또 오다 싶다 곳 다음 육회 먹다 오다 육회 맛있다 보임 코엑스 가면 종종 들르다 곳 소고기 맛있다 돈 김치찌개 만족하다 점심식사 갈다 때 직원 친절하다 기분 좋다 먹다 인테리어 깔끔하다 내부 넓다 회식 하다 좋다 곳 이다 호선 삼성역 가깝다 호선 봉은사 역 지하 입구 바로 앞 있다 찾기 쉽다 저번 코엑스몰 가다 때 가족 고기 먹다 정말 부드럽다 맛있다 또 려고 찜 해 두다 곳 이번 저녁식사 얼큰하다 김치찌개 한우 사태 곰탕 반하다 가다 콜키 프리 다음 번 회식 때 와인 챙기다 오다 하다 매장 넓다 깨끗하다 친절하다 너무 맛있다 회사 끝나다 봉은사 역 근처 분위기 좋다 레스토랑 줄알 들어가다 국밥 있다 반갑다 제 알다 김치찌개 손 꼽 정도 맛있다 대박 다시 오다 겁니다 돈 김치찌개 시키다 맛 나쁘다 않다 고기 너무 적다 아쉽다 테이블 크다 깔끔하다 반찬 맛있다 하다 소고기 먹다 마감 라거 함 아니다 하다 자기 집 빨 리가 야하다 마감 나오다 기준 없다 식당 오픈 초기 너무 달라지다 이다 갈비 정식 시키다 아래 사진 인분 고기 양 질 모두 최악 이다 보다 갈비 이상 뼈 남다 중 은 비계 살코기 정말 지다 고요 비싸다 돈 내다 된장찌개 공기밥 먹다 오다 황당하다 간만 사진 리뷰 남기다 직장 근처 코엑스 안 고기 먹다 때 가끔 가다 작년 중반 실망 스럽다 오늘 부로 갈다 듯 하다 접기 점심 때 사람 많다 오금 불친절하다 저 여기 물냉면 맛있다 호불호 극 갈림 그 곰탕 진짜 맛있다 물냉 시키다 반찬 나오다 왜,맛있다 반찬 양 간도 적당하다 너무 인 코스 가성 비 맛 모두 최고 깔끔하다 맛있다 쭈꾸미 볶음 육회 비빔밥 자주 먹다 깔끔하다 맛있다 좋다 물가 바인 코엑스 그나마 돈값 하다 생각 함 직원 다 친절하다 좋다 솔직하다 점 만점 아니다 평가 되어다 점,맛있다 반찬 양 간도 적당하다 너무 인 코스 가성 비 맛 모두 최고 깔끔하다 맛있다 쭈꾸미 볶음 육회 비빔밥 자주 먹다 깔끔하다 맛있다 좋다 물가 바인 코엑스 그나마 돈값 하다 생각 함 직원 다 친절하다 좋다 솔직하다 점 만점 아니다 평가 되어다 점,먹다 곱창 집 중 젤 맛있다 갈다 때 항상 기분 좋아지다 곳 가게 자체 꽤 돼다 위생 위생 직원 분과 사장 친절하다 따뜻하다 물론 맛 겸비 최고 식당 생각 들다 남편 여기 단골 연애 때 처음 가게 돼다 시간 좀 흐르다 아이 가다 따뜻하다 반기다 정말 신선하다 맛있다 곱창 먹다 덕분 기분 좋다 하루 마무리 하다 수 있다 비다 비다 여기 진상 오지 사장 직원 건강하다 돈 많이 벌다 해주 접기 곱창 맛 말 하다 것 없다 서비스 위생 관리 철저하다 친절하다 가도 기분 좋다 자다 보다 분위기 옛날 허름 풍 엄청 깔끔하다 관리 하다 가장 중요하다 음식 곱창 상태 항상 좋다 곁들이다 나오다 천엽 간 및 함께 볶다 부추 파김치 너무 맛있다 중간 내다 기다 국수 뱃속 느끼다 고소 상금 새 크다 조화 이루다 줍다 마지막 밥 먹다 대다 만족 하다 곳 접기 친절,일주일 두 번 들리다 간편하다 점심 저녁 동시 하다 수 있다 맛집 이다 우동 국물 넘다 시원하다 맵다 규동 고소하다 고기 두께 남다르다 돈가스 맛 나다 메뉴 다 맛 요 인생 맛집 규동 무난 냉 모밀 아쉽다 자리 좁다 먹다 불편하다,맛있다 가격 대비 훌륭하다 맛 이다 후 라이 너무 짜지다 않다 포솔포솔 두껍다 감자 튀기다 조리 시간 오래 걸리다 주문 동시 조리 하다 하다 저녁 피크 시간 전 이다 다소 시간 걸리다 음식 받다 먹다 사르르 잊다 되다 맛 이다 테이블 위 청소 상태 약간 미흡하다 홀 직원 따로 없다 그렇다 테이블 음식물 조각 쓰레기 조금 있다 직접 닦다 버리다 티슈 빈곽 있다 이 점 아쉽다 가격 맛 뛰어나다 재 방문 의사 있다 접기 저 논현 종종 이용 하다 거기 양 적다 신선하다 특수 야채 파프리카 양파 너무 자다 썰다 잇다 별로 이다 밥 너무 딱딱하다 다 남기다 버거 괜찮다 여기다 샐러드 버거 추천 드리다 체중 관리 회사 근처 곳 있다 좋다 사장 매우 친절하다 음식 맛있다,드랍 위치 파르 스몰 현대 백화점 방향 이다 카카오 맵 검색 하다 멀리 떨어지다 곳 알다 평일 가도 주말 가도 가도 가도 이상 걸리다 주문 받다 번 가다 개선 의지 없다 보다 대체 하다 곳 생기 치다 보다 생각 맛 무난 하다 앉다 먹다 공간 부족 테이크 아웃 위주 비다 가격 아쉽다,아직 이집 맛있다 골뱅이 무치다 먹다 봄 통닭구이 육전 같이 먹다 정말 맛남,여기 진짜 맛있다 목살 최고 스텔라 생맥주 곁들이다 마시기 고기 사진 깜빡 하다 이미 내 위속 직행 하다 싸구려 고기 식감 느낌 다르다 이정재 와인 곁들이다 먹다 느낌 고기
review_tokenized,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이제 베 갈다 같다 짜다 짤 이토마토 쌀 라즈베리 피스타치오 먹다 보다 다 맛있다 특히 피흐 타치 오 정말 꼬소 유럽 먹다 덥다 그 감동 맛 이다 최고 매일 사먹다 다른 젤라또 가게 두 배다 더 맛있다 맛있다 욤 널 나오다 때 오다 싶다 쌀 올리브 당근 맛있슴 맛 비다 직원 응대 차다 아쉽다 매장 이다 최근 또 괜찮다 타 젤라또 업 대비 참신하다 조합 시도 돋보이다 플레이 버 많다 좋다 단 맛 강하다 단골 이다 가격 말 안되다 오르다 주문 받다 직원 응대 너무 답답하다 스무고개 하다 줄 알다 보 냉포 안되다 하다 나중 보냉 추가 하다 물어보다 점 점 수정 하다 주민 젠 제로 초기 때 가다 근데 최근 지나치다 돈독 오르다 같다 맛 점점 사라지다 심지어 전 기본 맛 이다 이제 프리미엄 돈 받다 게 비싸다 맛 내다 돈 벌리다 수작 보이다 가격 점점 선 넘다 진짜 맨날 먹다 젤라또 쫀득함 거의 없다 맛 특이하다 소프트 아이스크림 집 정도 하다 번 가보다 하다 곳 음식 새롭다 시도 좋아하다 좋아하다 밤꿀 너무 달다 제 취향 아니다 감태 추천 하다 술안주 가지 맛 사서 하다 통 다 먹다 건강하다 아이스크림 맛 특이하다 아이스크림 최고 젠 제로 먹다 다른 젤라또 못 먹다 재료 본연 맛 자다 살리다 아이스크림 정말 너무 너무 좋아하다 곳 이다 젤라또 정말 좋아하다 젠 제로 하다 곳 없다 감태 카라멜 진짜 꼭 들다 보새 가격 있다 가치 그 이상 미식 무엇 배우다 곳 머리 열리다 젤라또 세계 이 시국 너무 다닥다닥 이르다 걱정 되다 점 빼다 감태 리조 먹다 진짜 맛있다 특히 감태 특이하다 맛 나다 또 먹다 맛 괜찮다 손님 대하 응대 방식 정말 아쉽다 초창 기 비다 맛 조금 변하다 느낌 존맛 고급스럽다 맛 우리 집 근처 이다 운 피 스타 자두 소르베 쫀득하 넘다 맛있다,1.000000,0.098080,0.106301,0.049797,0.135176,0.062090,0.092047,0.128600,0.055983,0.086423,...,0.175170,0.175170,0.069658,0.069658,0.089281,0.045280,0.109272,0.067330,0.053451,0.049461
아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 식 자재 과연 이 가격 어울리다 요 오래전 부터 다니다 프랑스 타이어 회사 별 같다 예약 예전 할하 않다 음식 정말 깔끔하다 좋다 저녁 창가 쪽 앉다 경치 좋다 지방 이사 하다 서울 그립다 맛집 중 하나 친절하다 음식 깔끔하다 인테리어 예쁘다 좋다 저희 가족 좀 싱겁다 먹다 펴다 음식 간이 약간 있다 이 점 빼다 완벽하다 식사 이다 기대하다 훨 맛있다 다 식사 하다 곳 찾다 추천 노 영희 서비스 좋다 음식 맛 좋다 살짝 아쉽다 부분 전복 약간 비리다 신년 가족 모임 주말 방문 하다 맛 흠잡다 없다 서빙 하다 분 미쉘 린 스타 답지 않다 특히 나 넘어서다 브레이크 타임 때문 쉬다 하다 건지다 빨리 계산 나가다 눈치 주다 맛 최고 서빙 하다 분 서비스 개선 필요하다 서빙 하다 분 음식 설명 좀 도 프로 답 해주다 하다 같다,0.098080,1.000000,0.182417,0.091801,0.096224,0.051932,0.123565,0.026205,0.023084,0.057555,...,0.134643,0.134643,0.086001,0.086001,0.082544,0.050287,0.110856,0.072763,0.015450,0.034399
가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 겉 바삭 속 풍 밉다 부드럽다 많이 바스러지다 그래도 커피 와인 먹다 싶다 생각 들다 지하 베이커리 지상 브런치 운영 오래되다 주택 개조 하다 접근성 계단 지하 위치 빵집 경사 마련 해주다 좋다 브런치 맛있다 양은 적다 편입 니 밥 먹다 건지다 밥 되다 건지다 음식 적다 진짜 맛있다 입 입 엄청 음미 하다 먹엇어 고급 지고 분위기 좋다 와인 조금 아쉽다 음식 맛 있다 양 적다 분위기 좋다 평일 저녁 당일 예약 가능하다 방문 하다 음식 너무 맛있다 분위기 좋다 다만 직원 목소리 작다 뭐라다 하다 자다 들리다 않다 분위기 좋다 음식 괜춘 짱짱 먹다 하다 음식 이 가격 이렇다 분위기 이렇다 서비스 요리 가격 비다 너무 떨어지다 서비스 눈물나다,0.106301,0.182417,1.000000,0.109707,0.091725,0.079064,0.070280,0.079112,0.065706,0.060139,...,0.177176,0.177176,0.079206,0.079206,0.118368,0.053126,0.126730,0.078625,0.025600,0.061400
예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 깔다 끄다 구름 스끼야끼 짜다 조르다 육수 조금씩 부어 먹다 미소 스끼야끼 육수 푹 담그다 먹다 비교 담백하다 맛 가격 다소 있다 재 방문 의사 있다 저 개인 구름 스끼야끼 맛있다 분위기 맛집 맛 기대하다 말다 낫 배드 깔끔하다 인테리어 고기 냄새 남 기대 너무 많이 하다 보다 어 수선 맛 소 분위기 괜찮다 깔다 끄다 정갈하다 식사 하다 좋다 곳 육회 잡다 안나 맛있다,0.049797,0.091801,0.109707,1.000000,0.062441,0.022781,0.074360,0.063076,0.078811,0.029797,...,0.124988,0.124988,0.067912,0.067912,0.044279,0.030364,0.079645,0.021788,0.020411,0.032758
맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 가다 하다 제 자리다 비우다 맛있다 튀김 정도 아주 딱이다 부드럽다 정말 맛있다 튀김 기름 좋다 거 써다 덜 느끼하다 맛있다 고기 두툼해 끼 식사 최고 이다 카레 추다 추천 드리다 말 하다 뭐해 완전 맛집 임 진짜 맛있다 또 먹다 최고 맛있다 인정 양도 꽤 많다 괜찮다 이 동네 몇개 월 넘다 지나다 이 가게 있다 전혀 모르다 너무 눈 안 띄다 최고,0.135176,0.096224,0.091725,0.062441,1.000000,0.073350,0.066674,0.257245,0.027919,0.099404,...,0.199823,0.199823,0.097200,0.097200,0.088840,0.053767,0.094984,0.033948,0.044157,0.091631
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
일주일 두 번 들리다 간편하다 점심 저녁 동시 하다 수 있다 맛집 이다 우동 국물 넘다 시원하다 맵다 규동 고소하다 고기 두께 남다르다 돈가스 맛 나다 메뉴 다 맛 요 인생 맛집 규동 무난 냉 모밀 아쉽다 자리 좁다 먹다 불편하다,0.045280,0.050287,0.053126,0.030364,0.053767,0.032545,0.020127,0.000000,0.028740,0.028607,...,0.092221,0.092221,0.007958,0.007958,0.014079,1.000000,0.079343,0.034590,0.012175,0.037896
맛있다 가격 대비 훌륭하다 맛 이다 후 라이 너무 짜지다 않다 포솔포솔 두껍다 감자 튀기다 조리 시간 오래 걸리다 주문 동시 조리 하다 하다 저녁 피크 시간 전 이다 다소 시간 걸리다 음식 받다 먹다 사르르 잊다 되다 맛 이다 테이블 위 청소 상태 약간 미흡하다 홀 직원 따로 없다 그렇다 테이블 음식물 조각 쓰레기 조금 있다 직접 닦다 버리다 티슈 빈곽 있다 이 점 아쉽다 가격 맛 뛰어나다 재 방문 의사 있다 접기 저 논현 종종 이용 하다 거기 양 적다 신선하다 특수 야채 파프리카 양파 너무 자다 썰다 잇다 별로 이다 밥 너무 딱딱하다 다 남기다 버거 괜찮다 여기다 샐러드 버거 추천 드리다 체중 관리 회사 근처 곳 있다 좋다 사장 매우 친절하다 음식 맛있다,0.109272,0.110856,0.126730,0.079645,0.094984,0.071100,0.060412,0.058353,0.018931,0.065458,...,0.138533,0.138533,0.044975,0.044975,0.102027,0.079343,1.000000,0.070644,0.012011,0.016419
드랍 위치 파르 스몰 현대 백화점 방향 이다 카카오 맵 검색 하다 멀리 떨어지다 곳 알다 평일 가도 주말 가도 가도 가도 이상 걸리다 주문 받다 번 가다 개선 의지 없다 보다 대체 하다 곳 생기 치다 보다 생각 맛 무난 하다 앉다 먹다 공간 부족 테이크 아웃 위주 비다 가격 아쉽다,0.067330,0.072763,0.078625,0.021788,0.033948,0.023200,0.036669,0.000000,0.130356,0.010593,...,0.064441,0.064441,0.020220,0.020220,0.098091,0.034590,0.070644,1.000000,0.008706,0.016879
아직 이집 맛있다 골뱅이 무치다 먹다 봄 통닭구이 육전 같이 먹다 정말 맛남,0.053451,0.015450,0.025600,0.020411,0.044157,0.028703,0.008896,0.088071,0.013060,0.032776,...,0.087830,0.087830,0.030190,0.030190,0.032078,0.012175,0.012011,0.008706,1.000000,0.017173


In [85]:
place_simi_review.mean()

0.05035397159343402

In [86]:
review_result.sort_values(by=review_result.index[0],ascending=False)

review_tokenized,맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이제 베 갈다 같다 짜다 짤 이토마토 쌀 라즈베리 피스타치오 먹다 보다 다 맛있다 특히 피흐 타치 오 정말 꼬소 유럽 먹다 덥다 그 감동 맛 이다 최고 매일 사먹다 다른 젤라또 가게 두 배다 더 맛있다 맛있다 욤 널 나오다 때 오다 싶다 쌀 올리브 당근 맛있슴 맛 비다 직원 응대 차다 아쉽다 매장 이다 최근 또 괜찮다 타 젤라또 업 대비 참신하다 조합 시도 돋보이다 플레이 버 많다 좋다 단 맛 강하다 단골 이다 가격 말 안되다 오르다 주문 받다 직원 응대 너무 답답하다 스무고개 하다 줄 알다 보 냉포 안되다 하다 나중 보냉 추가 하다 물어보다 점 점 수정 하다 주민 젠 제로 초기 때 가다 근데 최근 지나치다 돈독 오르다 같다 맛 점점 사라지다 심지어 전 기본 맛 이다 이제 프리미엄 돈 받다 게 비싸다 맛 내다 돈 벌리다 수작 보이다 가격 점점 선 넘다 진짜 맨날 먹다 젤라또 쫀득함 거의 없다 맛 특이하다 소프트 아이스크림 집 정도 하다 번 가보다 하다 곳 음식 새롭다 시도 좋아하다 좋아하다 밤꿀 너무 달다 제 취향 아니다 감태 추천 하다 술안주 가지 맛 사서 하다 통 다 먹다 건강하다 아이스크림 맛 특이하다 아이스크림 최고 젠 제로 먹다 다른 젤라또 못 먹다 재료 본연 맛 자다 살리다 아이스크림 정말 너무 너무 좋아하다 곳 이다 젤라또 정말 좋아하다 젠 제로 하다 곳 없다 감태 카라멜 진짜 꼭 들다 보새 가격 있다 가치 그 이상 미식 무엇 배우다 곳 머리 열리다 젤라또 세계 이 시국 너무 다닥다닥 이르다 걱정 되다 점 빼다 감태 리조 먹다 진짜 맛있다 특히 감태 특이하다 맛 나다 또 먹다 맛 괜찮다 손님 대하 응대 방식 정말 아쉽다 초창 기 비다 맛 조금 변하다 느낌 존맛 고급스럽다 맛 우리 집 근처 이다 운 피 스타 자두 소르베 쫀득하 넘다 맛있다,아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 식 자재 과연 이 가격 어울리다 요 오래전 부터 다니다 프랑스 타이어 회사 별 같다 예약 예전 할하 않다 음식 정말 깔끔하다 좋다 저녁 창가 쪽 앉다 경치 좋다 지방 이사 하다 서울 그립다 맛집 중 하나 친절하다 음식 깔끔하다 인테리어 예쁘다 좋다 저희 가족 좀 싱겁다 먹다 펴다 음식 간이 약간 있다 이 점 빼다 완벽하다 식사 이다 기대하다 훨 맛있다 다 식사 하다 곳 찾다 추천 노 영희 서비스 좋다 음식 맛 좋다 살짝 아쉽다 부분 전복 약간 비리다 신년 가족 모임 주말 방문 하다 맛 흠잡다 없다 서빙 하다 분 미쉘 린 스타 답지 않다 특히 나 넘어서다 브레이크 타임 때문 쉬다 하다 건지다 빨리 계산 나가다 눈치 주다 맛 최고 서빙 하다 분 서비스 개선 필요하다 서빙 하다 분 음식 설명 좀 도 프로 답 해주다 하다 같다,가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 겉 바삭 속 풍 밉다 부드럽다 많이 바스러지다 그래도 커피 와인 먹다 싶다 생각 들다 지하 베이커리 지상 브런치 운영 오래되다 주택 개조 하다 접근성 계단 지하 위치 빵집 경사 마련 해주다 좋다 브런치 맛있다 양은 적다 편입 니 밥 먹다 건지다 밥 되다 건지다 음식 적다 진짜 맛있다 입 입 엄청 음미 하다 먹엇어 고급 지고 분위기 좋다 와인 조금 아쉽다 음식 맛 있다 양 적다 분위기 좋다 평일 저녁 당일 예약 가능하다 방문 하다 음식 너무 맛있다 분위기 좋다 다만 직원 목소리 작다 뭐라다 하다 자다 들리다 않다 분위기 좋다 음식 괜춘 짱짱 먹다 하다 음식 이 가격 이렇다 분위기 이렇다 서비스 요리 가격 비다 너무 떨어지다 서비스 눈물나다,예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 깔다 끄다 구름 스끼야끼 짜다 조르다 육수 조금씩 부어 먹다 미소 스끼야끼 육수 푹 담그다 먹다 비교 담백하다 맛 가격 다소 있다 재 방문 의사 있다 저 개인 구름 스끼야끼 맛있다 분위기 맛집 맛 기대하다 말다 낫 배드 깔끔하다 인테리어 고기 냄새 남 기대 너무 많이 하다 보다 어 수선 맛 소 분위기 괜찮다 깔다 끄다 정갈하다 식사 하다 좋다 곳 육회 잡다 안나 맛있다,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 가다 하다 제 자리다 비우다 맛있다 튀김 정도 아주 딱이다 부드럽다 정말 맛있다 튀김 기름 좋다 거 써다 덜 느끼하다 맛있다 고기 두툼해 끼 식사 최고 이다 카레 추다 추천 드리다 말 하다 뭐해 완전 맛집 임 진짜 맛있다 또 먹다 최고 맛있다 인정 양도 꽤 많다 괜찮다 이 동네 몇개 월 넘다 지나다 이 가게 있다 전혀 모르다 너무 눈 안 띄다 최고,코엑스 안 있다 가게 접근성 정말 닭 없다 면 감자 듬뿍 들다 동치미 벌레 나오다 직원 너무나 당연하다 초파리 이다 하다 평소 초파리 얼마나 많다 보지 않다 초파리 알다 밥 퍽퍽 떡 맛없다 전 맵다 맛 시키다 맛있다 리뷰 적다 지금 야식 타임 그렇다 또 먹다 싶다 완전 맛있다 당면 넉넉하다,우선 그릇 예쁘다 먹다 때 대접받다 기분 나다 서비스 최고 이다 셰프 친절 유쾌하다 대화 분위기 보다 적절하다 설명 침묵 섞다 좋다 다만 구성은 다른 스시 오다 크게 것 없다 보이다 여기다 런치 약간 임팩트 부족하다 장사 안되다 홍보 알바 쓰다 보다 만족스럽다 식사 이다 특히 샤리 취향 자다 맞다 구성 괜찮다 맛 괜찮다 서빙 괜찮다 술 마시기 좋다 곳 접시 보다 인스타 용 같다 그 정도 좋다 접시 만족 스시 불만족,맛있다 욤,사장 너무 친절하다 지다 여 오뎅 바 넘다 좋아하다 너무나 취향 저격 당하다 감다 다음 친구 데리다 또 갈고 생맥주 아웃 오뎅 육수 맛있다 다른 안주 분위기 그닥 특별하다 점 느끼다 부띠 끄다 느낌 빙 두르다 앉다 먹다 마시다 집 분위기 좋다 갠 자리 불피욘 동성 끼리 가도 불피욘,사장 친절하다 고기 진짜 맛있다 자주 가게 되다 식당 이다 청담 점 좋다 맛있다 직원 차다 교육 필요하다 밥 먹다 앞 수다 떨다 말 듣다 시끄럽다 최악,...,회사 야근 후 지하 있다 식당 밥겸 간단하다 하다 잔 하다 가다 갈비 정식 시키다 생각 너무 맛있다 깜짝 놀라다 찬 맛있다 저녁 술 하다 잔 모두 충족 되다 곳 앞 자주 갈다 하다 토요일 오 앉다 주문 고기 나오다 때 기다리다 심지어 사람 많다 직접 굽다 댐 사람 없다 때 모르다 주말 비추다 가족 고기 먹다 가다 아이 맛있다 또 오자 하다 맛있다 굽다 감사하다 최근 먹다 소고기 중 최고 맛있다 특특급 사르르 녹음 소고기 굽다 먹다 오다 입 사르르 녹다 폭풍 흡입 하다 넘다 맛 나다 인테리어 깔끔하다 룸 따로 있다 넘다 편하다 먹다 오다 차돌박이 먹다 고소하다 맛있다 여기다 오다 하다 두께 조절 맞추다 넘다 기분 좋다 반찬 깔끔하다 친절하다 안내 하다 주심 음식 정갈하다 맛있다 다시 또 찾다 되다 같다 먹다 감사하다 고기 정말 맛있다 최 곱다 김치찌개 갈비탕 다 맛있다 반찬 맛있다 또 생각나다 곳 이다 넓다 좋다 호선 봉은사 역 가다 배꼽 집 밥 먹다 가다 갈비탕 시키다 국물 맛있다 고기 맛있다 반찬 맛있다 소고기 먹다 후식 냉면 먹다 고기 냉면 맛있다 엄마 같이 코엑스 가다 밥 먹다 곳 찾아가다 배꼽 집 차다 갈비 정식 시키다 먹다 엄마 맛있다 다 들다 기분 좋다 엄마 고기 맛있다 반찬 맛있다 나중 또 오자 심 차다 갈비 맛 정식 냉면 밑반찬 포함 갈비 냉면 너무 맛있다 왜 이리 매장 넓다 개인 룸 불금 그렇다 회식 많다 매장 쾌적하다 이쁘다 가끔 들다 분위기 있다 좋다 또 오다 싶다 곳 다음 육회 먹다 오다 육회 맛있다 보임 코엑스 가면 종종 들르다 곳 소고기 맛있다 돈 김치찌개 만족하다 점심식사 갈다 때 직원 친절하다 기분 좋다 먹다 인테리어 깔끔하다 내부 넓다 회식 하다 좋다 곳 이다 호선 삼성역 가깝다 호선 봉은사 역 지하 입구 바로 앞 있다 찾기 쉽다 저번 코엑스몰 가다 때 가족 고기 먹다 정말 부드럽다 맛있다 또 려고 찜 해 두다 곳 이번 저녁식사 얼큰하다 김치찌개 한우 사태 곰탕 반하다 가다 콜키 프리 다음 번 회식 때 와인 챙기다 오다 하다 매장 넓다 깨끗하다 친절하다 너무 맛있다 회사 끝나다 봉은사 역 근처 분위기 좋다 레스토랑 줄알 들어가다 국밥 있다 반갑다 제 알다 김치찌개 손 꼽 정도 맛있다 대박 다시 오다 겁니다 돈 김치찌개 시키다 맛 나쁘다 않다 고기 너무 적다 아쉽다 테이블 크다 깔끔하다 반찬 맛있다 하다 소고기 먹다 마감 라거 함 아니다 하다 자기 집 빨 리가 야하다 마감 나오다 기준 없다 식당 오픈 초기 너무 달라지다 이다 갈비 정식 시키다 아래 사진 인분 고기 양 질 모두 최악 이다 보다 갈비 이상 뼈 남다 중 은 비계 살코기 정말 지다 고요 비싸다 돈 내다 된장찌개 공기밥 먹다 오다 황당하다 간만 사진 리뷰 남기다 직장 근처 코엑스 안 고기 먹다 때 가끔 가다 작년 중반 실망 스럽다 오늘 부로 갈다 듯 하다 접기 점심 때 사람 많다 오금 불친절하다 저 여기 물냉면 맛있다 호불호 극 갈림 그 곰탕 진짜 맛있다 물냉 시키다 반찬 나오다 왜,회사 야근 후 지하 있다 식당 밥겸 간단하다 하다 잔 하다 가다 갈비 정식 시키다 생각 너무 맛있다 깜짝 놀라다 찬 맛있다 저녁 술 하다 잔 모두 충족 되다 곳 앞 자주 갈다 하다 토요일 오 앉다 주문 고기 나오다 때 기다리다 심지어 사람 많다 직접 굽다 댐 사람 없다 때 모르다 주말 비추다 가족 고기 먹다 가다 아이 맛있다 또 오자 하다 맛있다 굽다 감사하다 최근 먹다 소고기 중 최고 맛있다 특특급 사르르 녹음 소고기 굽다 먹다 오다 입 사르르 녹다 폭풍 흡입 하다 넘다 맛 나다 인테리어 깔끔하다 룸 따로 있다 넘다 편하다 먹다 오다 차돌박이 먹다 고소하다 맛있다 여기다 오다 하다 두께 조절 맞추다 넘다 기분 좋다 반찬 깔끔하다 친절하다 안내 하다 주심 음식 정갈하다 맛있다 다시 또 찾다 되다 같다 먹다 감사하다 고기 정말 맛있다 최 곱다 김치찌개 갈비탕 다 맛있다 반찬 맛있다 또 생각나다 곳 이다 넓다 좋다 호선 봉은사 역 가다 배꼽 집 밥 먹다 가다 갈비탕 시키다 국물 맛있다 고기 맛있다 반찬 맛있다 소고기 먹다 후식 냉면 먹다 고기 냉면 맛있다 엄마 같이 코엑스 가다 밥 먹다 곳 찾아가다 배꼽 집 차다 갈비 정식 시키다 먹다 엄마 맛있다 다 들다 기분 좋다 엄마 고기 맛있다 반찬 맛있다 나중 또 오자 심 차다 갈비 맛 정식 냉면 밑반찬 포함 갈비 냉면 너무 맛있다 왜 이리 매장 넓다 개인 룸 불금 그렇다 회식 많다 매장 쾌적하다 이쁘다 가끔 들다 분위기 있다 좋다 또 오다 싶다 곳 다음 육회 먹다 오다 육회 맛있다 보임 코엑스 가면 종종 들르다 곳 소고기 맛있다 돈 김치찌개 만족하다 점심식사 갈다 때 직원 친절하다 기분 좋다 먹다 인테리어 깔끔하다 내부 넓다 회식 하다 좋다 곳 이다 호선 삼성역 가깝다 호선 봉은사 역 지하 입구 바로 앞 있다 찾기 쉽다 저번 코엑스몰 가다 때 가족 고기 먹다 정말 부드럽다 맛있다 또 려고 찜 해 두다 곳 이번 저녁식사 얼큰하다 김치찌개 한우 사태 곰탕 반하다 가다 콜키 프리 다음 번 회식 때 와인 챙기다 오다 하다 매장 넓다 깨끗하다 친절하다 너무 맛있다 회사 끝나다 봉은사 역 근처 분위기 좋다 레스토랑 줄알 들어가다 국밥 있다 반갑다 제 알다 김치찌개 손 꼽 정도 맛있다 대박 다시 오다 겁니다 돈 김치찌개 시키다 맛 나쁘다 않다 고기 너무 적다 아쉽다 테이블 크다 깔끔하다 반찬 맛있다 하다 소고기 먹다 마감 라거 함 아니다 하다 자기 집 빨 리가 야하다 마감 나오다 기준 없다 식당 오픈 초기 너무 달라지다 이다 갈비 정식 시키다 아래 사진 인분 고기 양 질 모두 최악 이다 보다 갈비 이상 뼈 남다 중 은 비계 살코기 정말 지다 고요 비싸다 돈 내다 된장찌개 공기밥 먹다 오다 황당하다 간만 사진 리뷰 남기다 직장 근처 코엑스 안 고기 먹다 때 가끔 가다 작년 중반 실망 스럽다 오늘 부로 갈다 듯 하다 접기 점심 때 사람 많다 오금 불친절하다 저 여기 물냉면 맛있다 호불호 극 갈림 그 곰탕 진짜 맛있다 물냉 시키다 반찬 나오다 왜,맛있다 반찬 양 간도 적당하다 너무 인 코스 가성 비 맛 모두 최고 깔끔하다 맛있다 쭈꾸미 볶음 육회 비빔밥 자주 먹다 깔끔하다 맛있다 좋다 물가 바인 코엑스 그나마 돈값 하다 생각 함 직원 다 친절하다 좋다 솔직하다 점 만점 아니다 평가 되어다 점,맛있다 반찬 양 간도 적당하다 너무 인 코스 가성 비 맛 모두 최고 깔끔하다 맛있다 쭈꾸미 볶음 육회 비빔밥 자주 먹다 깔끔하다 맛있다 좋다 물가 바인 코엑스 그나마 돈값 하다 생각 함 직원 다 친절하다 좋다 솔직하다 점 만점 아니다 평가 되어다 점,먹다 곱창 집 중 젤 맛있다 갈다 때 항상 기분 좋아지다 곳 가게 자체 꽤 돼다 위생 위생 직원 분과 사장 친절하다 따뜻하다 물론 맛 겸비 최고 식당 생각 들다 남편 여기 단골 연애 때 처음 가게 돼다 시간 좀 흐르다 아이 가다 따뜻하다 반기다 정말 신선하다 맛있다 곱창 먹다 덕분 기분 좋다 하루 마무리 하다 수 있다 비다 비다 여기 진상 오지 사장 직원 건강하다 돈 많이 벌다 해주 접기 곱창 맛 말 하다 것 없다 서비스 위생 관리 철저하다 친절하다 가도 기분 좋다 자다 보다 분위기 옛날 허름 풍 엄청 깔끔하다 관리 하다 가장 중요하다 음식 곱창 상태 항상 좋다 곁들이다 나오다 천엽 간 및 함께 볶다 부추 파김치 너무 맛있다 중간 내다 기다 국수 뱃속 느끼다 고소 상금 새 크다 조화 이루다 줍다 마지막 밥 먹다 대다 만족 하다 곳 접기 친절,일주일 두 번 들리다 간편하다 점심 저녁 동시 하다 수 있다 맛집 이다 우동 국물 넘다 시원하다 맵다 규동 고소하다 고기 두께 남다르다 돈가스 맛 나다 메뉴 다 맛 요 인생 맛집 규동 무난 냉 모밀 아쉽다 자리 좁다 먹다 불편하다,맛있다 가격 대비 훌륭하다 맛 이다 후 라이 너무 짜지다 않다 포솔포솔 두껍다 감자 튀기다 조리 시간 오래 걸리다 주문 동시 조리 하다 하다 저녁 피크 시간 전 이다 다소 시간 걸리다 음식 받다 먹다 사르르 잊다 되다 맛 이다 테이블 위 청소 상태 약간 미흡하다 홀 직원 따로 없다 그렇다 테이블 음식물 조각 쓰레기 조금 있다 직접 닦다 버리다 티슈 빈곽 있다 이 점 아쉽다 가격 맛 뛰어나다 재 방문 의사 있다 접기 저 논현 종종 이용 하다 거기 양 적다 신선하다 특수 야채 파프리카 양파 너무 자다 썰다 잇다 별로 이다 밥 너무 딱딱하다 다 남기다 버거 괜찮다 여기다 샐러드 버거 추천 드리다 체중 관리 회사 근처 곳 있다 좋다 사장 매우 친절하다 음식 맛있다,드랍 위치 파르 스몰 현대 백화점 방향 이다 카카오 맵 검색 하다 멀리 떨어지다 곳 알다 평일 가도 주말 가도 가도 가도 이상 걸리다 주문 받다 번 가다 개선 의지 없다 보다 대체 하다 곳 생기 치다 보다 생각 맛 무난 하다 앉다 먹다 공간 부족 테이크 아웃 위주 비다 가격 아쉽다,아직 이집 맛있다 골뱅이 무치다 먹다 봄 통닭구이 육전 같이 먹다 정말 맛남,여기 진짜 맛있다 목살 최고 스텔라 생맥주 곁들이다 마시기 고기 사진 깜빡 하다 이미 내 위속 직행 하다 싸구려 고기 식감 느낌 다르다 이정재 와인 곁들이다 먹다 느낌 고기
review_tokenized,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이제 베 갈다 같다 짜다 짤 이토마토 쌀 라즈베리 피스타치오 먹다 보다 다 맛있다 특히 피흐 타치 오 정말 꼬소 유럽 먹다 덥다 그 감동 맛 이다 최고 매일 사먹다 다른 젤라또 가게 두 배다 더 맛있다 맛있다 욤 널 나오다 때 오다 싶다 쌀 올리브 당근 맛있슴 맛 비다 직원 응대 차다 아쉽다 매장 이다 최근 또 괜찮다 타 젤라또 업 대비 참신하다 조합 시도 돋보이다 플레이 버 많다 좋다 단 맛 강하다 단골 이다 가격 말 안되다 오르다 주문 받다 직원 응대 너무 답답하다 스무고개 하다 줄 알다 보 냉포 안되다 하다 나중 보냉 추가 하다 물어보다 점 점 수정 하다 주민 젠 제로 초기 때 가다 근데 최근 지나치다 돈독 오르다 같다 맛 점점 사라지다 심지어 전 기본 맛 이다 이제 프리미엄 돈 받다 게 비싸다 맛 내다 돈 벌리다 수작 보이다 가격 점점 선 넘다 진짜 맨날 먹다 젤라또 쫀득함 거의 없다 맛 특이하다 소프트 아이스크림 집 정도 하다 번 가보다 하다 곳 음식 새롭다 시도 좋아하다 좋아하다 밤꿀 너무 달다 제 취향 아니다 감태 추천 하다 술안주 가지 맛 사서 하다 통 다 먹다 건강하다 아이스크림 맛 특이하다 아이스크림 최고 젠 제로 먹다 다른 젤라또 못 먹다 재료 본연 맛 자다 살리다 아이스크림 정말 너무 너무 좋아하다 곳 이다 젤라또 정말 좋아하다 젠 제로 하다 곳 없다 감태 카라멜 진짜 꼭 들다 보새 가격 있다 가치 그 이상 미식 무엇 배우다 곳 머리 열리다 젤라또 세계 이 시국 너무 다닥다닥 이르다 걱정 되다 점 빼다 감태 리조 먹다 진짜 맛있다 특히 감태 특이하다 맛 나다 또 먹다 맛 괜찮다 손님 대하 응대 방식 정말 아쉽다 초창 기 비다 맛 조금 변하다 느낌 존맛 고급스럽다 맛 우리 집 근처 이다 운 피 스타 자두 소르베 쫀득하 넘다 맛있다,1.000000,0.098080,0.106301,0.049797,0.135176,0.062090,0.092047,0.128600,0.055983,0.086423,...,0.175170,0.175170,0.069658,0.069658,0.089281,0.045280,0.109272,0.067330,0.053451,0.049461
가격 있다 맛있다 친절하다 맛있다 고기랑 김치 정말 훌륭하다 국물 예술 넘다 맛있다 사장 직원 모두 유쾌하다 친절하다 선릉 점 유독 그렇다 듯 재 방문 의사 이다 맛 잇다 친절하다 모임 하다 딱 굽다 좋다 좀 질 기다 전체 음식 달다 맛있다 맛있다 사장 친절하다 단골 임 정말 너무 맛있다 친절하다 맛있다 생일 기념 점심 합 하다 여자 사장 친절하다 만족스럽다 식사 하다 여기 너무 맛있다 사장 짱 친절하다 직원 좋다 분위기 좋다 맛 좋다 양도 많다 너무 기분 좋다 먹다 담 또 방문 하다 존맛 사장 너무 친절하다 우연히 찾다 찌다 맛집 날 너무 덥다 삘받는 곳 들어가다 아니다 왜 이렇게 맛있다 사장 너무 친절하다 음식 너무 깔끔하다 진짜 맛있다 사장 적다 일 돈 많이 버세 너무 맛있다 정말 자주 가다 집 고기 질도 정말 좋다 방문 하다 때 마다 직원 친절하다 대해 주다 늘 기분 좋다 먹다 가요 외식 생각나다 때 순위 방문 하다 곳 이다 맛있다 물론 직원 너무 친절하다 친구 저녁 먹다 찾다 곳 역시 소문 기 막히다 맛 요 굽다 남자 직원 너무 젬 있다 기분 좋다 저녁 시간 이다 자주 가다 집 맛 안변 직원 갈다 때 친절하다 너무 아니다 걸다 가다 식사 인분 손님 의사 물어보다 그냥 멋대로 굽다 대고 빨리 먹다 꺼지다 듯이 장난 하나 서울 서다 입맛 제대로 버리다 가다 다시다 여기 알다 정말 비추다 하다 맛있다 차돌박이 관자 김치 뭔들 직원 직접 굽다 접시 올려주다 서비스 좋다 대접 받다 느낌 역시 맛 나다 대접 받다 만큼 비싸다 껏 먹다 덤벼 들다 생각 라면 가성 비다 넣다 두다 넣다 두다 광고 빨다 가성 비 별로 점 조정 차원 줍다 언제나 최고 맛있다 기본 직원 사장 전부 친절 굿 여기 미치다 고민 시 꼭 오다 너무 친절하다 너무 맛있다 강 추강 츄 인생 맛집 다른 분 다 좋다 남자 진짜 맛있다 조합 하다 줄다 맛 잘알다 고수 느낌 최고 집 오다 계속 생각나다 만큼 너무 맛있다 계속 생각나다 맛 사장 너무 친절하다 기분 다 좋다 먹다 다녀오다 소복 불고기 맛 여기 아니다 먹다 진 대감 중 선릉 점 타가 아니다 존맛 이다 다음 꼭 갈다 명 나물 싸다 먹다 맛 잊다 침 쥬르륵 진대 감다 항상 찌다 오늘 맛있다 먹다 매니저 케어 감동 받다 오다 그동안 진 대감 논현 점 가다가 번개 첨 방문 선릉 점도 이다 코로나 정리 되다 단체 회식 장소 순위 이다 담 기억 하다 주시 묵 사발 서비스 맛 친절 가면 항상 행복하다 곳 이다 맛집 요 먹다 기다리다 보람 있다 친철 맛있다 잘해주다 먹다 오다 재 방문 의사 맛있다 추가 시키다 차돌 금방 물리다 주변 밑반찬 조화 좋다 저녁 사람 많다 굽다 주다 하다 흐름 끊기다 자발 굽다 먹음 날치 알 볶음밥 맛있다 소주 맥주 딱 맛 혹 하다 먹다 중간 중간 흐름 끊기다 아쉬움 맛있다 함 이집 나 최애 맛집 이영자 맛집 유명하다 더 유명하다 않다 좋다 나 알기 미안하다 곳 너무나 맛있다 음식 개깔꼼 예쁘다 이모 너무나 친절하다 좋다 오늘 맛있다 먹다 가다,0.202077,0.184340,0.190573,0.109156,0.220551,0.102896,0.120422,0.286781,0.115038,0.206660,...,0.344532,0.344532,0.212344,0.212344,0.239383,0.084616,0.205886,0.051231,0.091015,0.077530
가격 있다 맛있다 친절하다 맛있다 고기랑 김치 정말 훌륭하다 국물 예술 넘다 맛있다 사장 직원 모두 유쾌하다 친절하다 선릉 점 유독 그렇다 듯 재 방문 의사 이다 맛 잇다 친절하다 모임 하다 딱 굽다 좋다 좀 질 기다 전체 음식 달다 맛있다 맛있다 사장 친절하다 단골 임 정말 너무 맛있다 친절하다 맛있다 생일 기념 점심 합 하다 여자 사장 친절하다 만족스럽다 식사 하다 여기 너무 맛있다 사장 짱 친절하다 직원 좋다 분위기 좋다 맛 좋다 양도 많다 너무 기분 좋다 먹다 담 또 방문 하다 존맛 사장 너무 친절하다 우연히 찾다 찌다 맛집 날 너무 덥다 삘받는 곳 들어가다 아니다 왜 이렇게 맛있다 사장 너무 친절하다 음식 너무 깔끔하다 진짜 맛있다 사장 적다 일 돈 많이 버세 너무 맛있다 정말 자주 가다 집 고기 질도 정말 좋다 방문 하다 때 마다 직원 친절하다 대해 주다 늘 기분 좋다 먹다 가요 외식 생각나다 때 순위 방문 하다 곳 이다 맛있다 물론 직원 너무 친절하다 친구 저녁 먹다 찾다 곳 역시 소문 기 막히다 맛 요 굽다 남자 직원 너무 젬 있다 기분 좋다 저녁 시간 이다 자주 가다 집 맛 안변 직원 갈다 때 친절하다 너무 아니다 걸다 가다 식사 인분 손님 의사 물어보다 그냥 멋대로 굽다 대고 빨리 먹다 꺼지다 듯이 장난 하나 서울 서다 입맛 제대로 버리다 가다 다시다 여기 알다 정말 비추다 하다 맛있다 차돌박이 관자 김치 뭔들 직원 직접 굽다 접시 올려주다 서비스 좋다 대접 받다 느낌 역시 맛 나다 대접 받다 만큼 비싸다 껏 먹다 덤벼 들다 생각 라면 가성 비다 넣다 두다 넣다 두다 광고 빨다 가성 비 별로 점 조정 차원 줍다 언제나 최고 맛있다 기본 직원 사장 전부 친절 굿 여기 미치다 고민 시 꼭 오다 너무 친절하다 너무 맛있다 강 추강 츄 인생 맛집 다른 분 다 좋다 남자 진짜 맛있다 조합 하다 줄다 맛 잘알다 고수 느낌 최고 집 오다 계속 생각나다 만큼 너무 맛있다 계속 생각나다 맛 사장 너무 친절하다 기분 다 좋다 먹다 다녀오다 소복 불고기 맛 여기 아니다 먹다 진 대감 중 선릉 점 타가 아니다 존맛 이다 다음 꼭 갈다 명 나물 싸다 먹다 맛 잊다 침 쥬르륵 진대 감다 항상 찌다 오늘 맛있다 먹다 매니저 케어 감동 받다 오다 그동안 진 대감 논현 점 가다가 번개 첨 방문 선릉 점도 이다 코로나 정리 되다 단체 회식 장소 순위 이다 담 기억 하다 주시 묵 사발 서비스 맛 친절 가면 항상 행복하다 곳 이다 맛집 요 먹다 기다리다 보람 있다 친철 맛있다 잘해주다 먹다 오다 재 방문 의사 맛있다 추가 시키다 차돌 금방 물리다 주변 밑반찬 조화 좋다 저녁 사람 많다 굽다 주다 하다 흐름 끊기다 자발 굽다 먹음 날치 알 볶음밥 맛있다 소주 맥주 딱 맛 혹 하다 먹다 중간 중간 흐름 끊기다 아쉬움 맛있다 함 이집 나 최애 맛집 이영자 맛집 유명하다 더 유명하다 않다 좋다 나 알기 미안하다 곳 너무나 맛있다 음식 개깔꼼 예쁘다 이모 너무나 친절하다 좋다 오늘 맛있다 먹다 가다,0.202077,0.184340,0.190573,0.109156,0.220551,0.102896,0.120422,0.286781,0.115038,0.206660,...,0.344532,0.344532,0.212344,0.212344,0.239383,0.084616,0.205886,0.051231,0.091015,0.077530
친구 오다 먹다 맛있다 직원 매우 친절하다 욤 설문조사 하다 디저트 주네 맛있다 분위기 특이하다 맛있다 가성 비 괜찮다 그냥 한번 가보다 하다 물 수돗물 음식 쏘다 쏘다 물 입 먹다 먹다 양도 적다 편이 둘이서 개 시키다 나누다 먹다 그냥 분위기 컨셉 딱 하다 번 가보다 다른 건 모르다 음식 너무 맛없다 친구 다 남다 나오다 진짜 왠만하다 먹다 너무 맛없다 초심 잃다 건지다 주방 잃다 건지다 가다 곳 만 지인 데려가다 미안하다 정도 이다 푹 퍼지다 면 특히 연어 샐러드 너무 실망 연어 씩 사서 먹다 정도 연어 좋아하다 연어 남기다 건 상상 하다 수 없다 사람 남기다 연어 재활용 싶다 정도 조각 조각 잘리다 부스러기 나오다 찝찝하다 반 남기다 너무 좋아하다 곳 맛있다 너무 친절하다 기분 좋다 메뉴 늘 존맛 꽃게 파스타 존맛 꼭 들다 가성 비다 모르다 시키다 거중 제일 맛있다 굳다 굳다 돈마 호크 리 코타 샐러드 간장 치킨 크림 파스타 링거 칵테일 무 알콜 가격 간함 해리포터 좋아하다 좋아하다 장소 이다 분위기 약간 다크 할로윈 분위기 브레이크 타임 있다 모르다 가다 남다 아슬아슬하다 가다 받다 감사하다 직원 다 친절하다 음식 적당하다 맛있다 분위기 좋다 담 또 갈다 막 엄청 맛있다 아니다 인스타 용 맛 없다 않다 딱 적당 토마호크 스테이크 맛있다 특히 비계 부분 꽃게 파스타 먹다 날치 알 엄청 많이 올려주다 톡톡 터지다 맛있다 먹다 처음 방문 맛 좋다 재 방문 하다 주방 바뀌다 신건 맛 애매하다 진짜 최악 앵 가다 다 자다 먹다 별 생각 없다 방문 하다 음식 넘다 걸리다 나오다 스테이크 다 식다 심지어 스테이크 같이 나오다 양송이 차갑다 샐러드 야채 시들시들하다 아삭아삭 맛 없다 파리 바게뜨 샐러드 더 맛있다 이렇다 음식점 처음 맛 없다 둘째 성의 없다 음식 진짜 최악 요 이색 데이트 코스 추천 드리다 돈마 호크 스테이크 정말 맛있다 특히 소스 너무 최고 이색 데이트 하다 때 좋다 것 같다 가성 비도 좋다 맛 좋다 맛 있다 가격 착하다 이색 분위기 완전 좋다 데이트 코스 딱이다 분위기 새 가격 착하다 부담 없다 가다 즐기다 서다 있다 곳 마녀 손가락 있다 넓적다리 스테이크 링거 칵테일 인 용 꼭 시키다 로 리조또 맛 나다 다 맛있다 컨셉 진짜 특이하다 맛 쏘다 쏘다 가게 전반 먼지 좀 많다 청소 시급 해보다 직원 불친절하다 너무 맛있다 자다 먹다,0.193127,0.143149,0.218447,0.081333,0.170598,0.096324,0.102966,0.173329,0.086966,0.109608,...,0.228606,0.228606,0.131809,0.131809,0.128013,0.032000,0.168935,0.050645,0.057970,0.041091
맛있다 친절하다 맛있다 무엇 깔끔하다 진 대감 더 좋다 차돌 합 맛있다 먹다 날치 알 덮다 밥 양 많다 자다 먹다 가다 이전 하다 깨끗하다 너무 좋다 코로나 풀리다 팀 회식 하다 좋다 같다 룸 있다 맛있다 자다 먹다 가다 다음 또 오다 보기 좋다 보이다 고기 퀄리티 관자 같이 먹다 쫄깃 고소하다 다음 또 오다 간만 재 방문 하다 맛있다 식사 하다 오다 가게 깨끗하다 밑반찬 잘나오다 맛있다 돈 많다 매일 먹다 싶다 집 기회 되다 또 가다 괜찮다 추천 하다 너무 맛있다 친절하다 서비스 담 역삼 쪽 가면 꼭 다시 방문 싶다 만 친구 모임 위해 선택 진 대감 고기 맛있다 직원 센스 유머 감각 즐겁다 모이다 고기 맛 나다 엄청 바쁘다 신다 친절하다 먹다 오다 회식 때 많이 가다 곳 너무 맛있다 가족 재 방문 하다 직원 너무 친절하다 고기 굽다 편하다 먹다 수 있다 매번 맛있다 먹다 오다 만 방문 하다 전보 더 맛있다 같다 직원 친절하다 여기 차돌 관자 묵은지 합 맛있다 아니다 다른 메뉴 진짜 맛있다 특히 육회 진짜 기 막히다 신선하다 고소하다 제 제일 좋아하다 식당 또 가다 직원 너무 친절하다 갈다 때 만족하다 주차 하다 곳 없다 차 주다 헐다 사장 직접 나오다 일일이 대리 주차 완전 감동 맛 더 감동 일일이 굽다 더 베리 굿 자주 갈다 이영자 원픽 적극 동감 하다 친절하다 직접 굽다 올려주다 너무 편하다 더 맛있다 먹다 수 있다 날치 알 볶음밥 무조건 들다 야하다 굿굿 서비스 똥망 강남 점 훨씬 하다 종업원 자다 굽다 못 불친절하다 좌 불편하다 죽다 좁다 테이블 다닥다닥 붙다 먹다 난리 사람 여럿 이서 가다 불판 개 놓다 달라 자기 들이다 감당 안되다 불판 개 가지 굽다 먹다 정신 없다 먹다 같다 않다 역삼 점 비추다 서비스 좋다 맛있다 일요일 점심 오픈 하다 말 가다 하다 손님 받다 영업 거 카맵 보고 가다 굽다 싫다 차돌박이 다 한번 굽다 버리다 일부러 친절하다 하다 거기 가다 생일 날 기분 개 좋다 계산 하다 전화 받다 이렇다 곳 진짜 사장 주방 뒤 드러눕다 왜 일요일 오픈 건지다 눈치 보다 먹다 힘들다 차돌 합 맛깔 밑반찬 맛있다 비싸다 편 굽다 접시 담다 아주 편하다 맛있다 먹다 나오다 발렛파킹 맛있다 비싸다 편 굽다 접시 담다 아주 편하다 맛있다 먹다 나오다 발렛파킹,0.189890,0.156805,0.166796,0.093094,0.198203,0.082497,0.108960,0.266482,0.064993,0.163548,...,0.393153,0.393153,0.155889,0.155889,0.158667,0.083094,0.131527,0.056730,0.081177,0.093487
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000


### 최종 
- place_simi_cate * 0.3 # 공식 1. 카테고리 유사도
- place_simi_menu * 0.5 # 공식 2. 메뉴 유사도
- place_simi_review * 1 # 공식 3. 리뷰 5유사도

In [87]:
place_simi_co = (
                 + place_simi_cate * 0.3 # 공식 1. 카테고리 유사도
                 + place_simi_menu * 0.5 # 공식 2. 메뉴 유사도
                 + place_simi_review * 1 # 공식 3. 리뷰 유사도
                 )

In [88]:
place_simi_co

array([[1.3       , 0.15807969, 0.2584286 , ..., 0.11803969, 0.13091026,
        0.10016993],
       [0.15807969, 1.3       , 0.23312628, ..., 0.1234725 , 0.24782864,
        0.18652643],
       [0.2584286 , 0.23312628, 1.8       , ..., 0.12148259, 0.09106508,
        0.10425725],
       ...,
       [0.11803969, 0.1234725 , 0.12148259, ..., 1.8       , 0.07417164,
        0.05973624],
       [0.13091026, 0.24782864, 0.09106508, ..., 0.07417164, 1.8       ,
        0.21356915],
       [0.10016993, 0.18652643, 0.10425725, ..., 0.05973624, 0.21356915,
        1.8       ]])

In [89]:
concat.head()

Unnamed: 0,place_name,category_name,menu_tokenized,review_tokenized
0,젠제로,음식점 간식 아이스크림,,맛있다 맛있다 흑 너무 맛있다 수제 아이스크림 너무 좋아하다 여기다 특히 맛있다 이...
1,품서울,음식점 한식 한정식,,아무리 본연 맛 중시 다지 미슐랭 어울리다 않다 특색 없다 메뉴 홀 매니저 서비스 ...
2,쉐즈알렉스,음식점 간식 제과 베이커리,치아바타 Caf 브리오슈 식빵 Citr 브리 Cappuccino 바게트 14 추천사...,가야 이유 매장 맛 고급스럽다 가다 이유 가격 조금 있다 하다 크다 로 상 바게트 ...
3,일상정원 코엑스점,음식점 일식,미소 구름 한우육회 버터 구이 육회 스키야키관서식 관서식 해물뚝배기 한우 장어구이 ...,예쁘다 맛 양은 그저 그렇다 간판 작다 찾아가다 다소 힘들다 매장 인테리어 예쁘다 ...
4,하랑,음식점 일식 돈까스 우동,,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 ...


In [90]:
place_simi_co_sorted_ind = place_simi_co.argsort()[:, ::-1] #어레이 place_simi_co를 정렬하는 인덱스의 어레이를 반환
place_simi_co_sorted_ind

array([[  0,  83, 120, ...,  47, 555, 422],
       [  1, 508, 129, ..., 507, 312, 598],
       [  2, 120, 447, ..., 555,  47, 422],
       ...,
       [643, 359, 617, ..., 555,  47, 422],
       [644, 362,  57, ..., 514, 426, 464],
       [645,  66, 437, ..., 505, 310, 596]], dtype=int64)

In [91]:
pd.DataFrame(place_simi_co_sorted_ind).head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,636,637,638,639,640,641,642,643,644,645
0,0,83,120,409,2,70,580,354,331,29,...,271,277,334,303,310,171,511,47,555,422
1,1,508,129,384,327,566,480,352,217,335,...,505,596,310,534,475,514,297,507,312,598
2,2,120,447,328,33,522,426,26,414,213,...,334,171,405,406,495,511,233,555,47,422
3,3,12,135,6,175,620,127,184,446,301,...,310,171,596,320,303,505,511,555,47,422
4,4,157,20,302,22,525,593,127,526,474,...,171,277,271,406,258,320,511,555,47,422


In [92]:
place_simi_co = (
                 + place_simi_cate * 0.3 # 공식 1. 카테고리 유사도
                 + place_simi_menu * 0.5 # 공식 2. 메뉴 유사도
                 + place_simi_review * 1 # 공식 3. 리뷰 유사도
                 )

place_simi_co_sorted_ind = place_simi_co.argsort()[:, ::-1] 


# 최종 구현 함수
def find_simi_place(df, sorted_ind, place_name, top_n=10):
    
    place_title = df[df['place_name'] == place_name]                    # 입력된 데이터프레임에서 입력된 가게이름 행을 추출하여 데이터 프레임 생성
    place_index = place_title.index.values                                #생성된 데이터 프레임의 인덱스 값 추출
    similar_indexes = sorted_ind[place_index, :(top_n)]                #입력된 인덱스 어레이에서 이전에 추출한 인덱스 행만 추출
    similar_indexes = similar_indexes.reshape(-1)                         # 2차원 행렬을 1차원으로 변경
    return df.iloc[similar_indexes]


# 하랑을 포함해 5개 업체를 뽑아봅시다.
find_simi_place(concat, place_simi_co_sorted_ind, '하랑', 5)

Unnamed: 0,place_name,category_name,menu_tokenized,review_tokenized
4,하랑,음식점 일식 돈까스 우동,,맛있다 근처 대적 하다 돈까스 집 없다 만큼 강남 가격 퀄 주변 가면 무조건 여기 ...
157,윤화돈까스,음식점 일식 돈까스 우동,생선까스 정식 윤화정식 까스 함박까스 윤화 돼지 돈까스 생선 반반,돈까스 맛있다 먹다 나오다 발렛 파킹 해주시 아저씨 차 안 담배 피신 건지다 온 몸...
20,간코블랙 현대무역센터점,음식점 일식 돈까스 우동,우삼겹비프카레 치즈폭탄카레 불고기정식 웰빙 정식 웰빙버섯카레 비프 돈카츠 블랙 우삼...,맛있다 음식 좀 늦다 나오다 그래도 돈까스 퀄 맛 괜찮다 맛 특별하다 않다 뚝배기 ...
302,압구정하루,음식점 일식 돈까스 우동,카레라이스 냉모밀 카레돈가스 모밀 돈가스 온모밀 판모밀,대학생 때 단골 이다 제주도 이사 서다 가보다 제주 모밀 먹다 예전 맛 그립다 찾아...
22,잇쇼우,음식점 일식 돈까스 우동,정식 ASet 김치 쇼우정식 돈가스 우정식 스페셜 수제생등심돈가스 등심 수제생 붓 케정식,우동 면발 특이하다 맛있다 보통 우동 은 약간 끊기다 느낌 있다 여기다 전체 아주 ...


In [93]:
#고담식당을 포함해 5개 업체를 뽑아봅시다.
find_simi_place(concat, place_simi_co_sorted_ind, '고담식당', 5)

Unnamed: 0,place_name,category_name,menu_tokenized,review_tokenized
645,고담식당,음식점 한식 육류 고기,150g 김치 안심 등심150g 제육 삼겹살 한우 1 등심 안심150g 숙성 180...,여기 진짜 맛있다 목살 최고 스텔라 생맥주 곁들이다 마시기 고기 사진 깜빡 하다 이...
66,소담골,음식점 한식 육류 고기,170g 살170g 등심170g 삼겹살 갈비탕 삼겹살170g 등심 육사시미 200g...,고기 질 좋다 친절하다
437,벽돌집60-5,음식점 한식 육류 고기,150g 이베리 목살 이베리코베요타 국내 요타 눈꽃 국내산150g 삼겹살 눈꽃목살 코베,맛있다 자다 먹다 소고기 조금 느끼하다 고추 장아찌 신의 한수인 듯 화장실 바닥 변...
574,경천애인2237,음식점 한식 육류 고기,채끝 150g 등심 안심 120g 일품 특안심 꽃등심 소갈비살 경애등 경애등안,육회 비빔 비다 미치다 서버 친절하다 고기 맛있다 개인 하다 담 창고 여기 더 맛있...
416,경천애인2237,음식점 한식 육류 고기,채끝 150g 등심 안심 120g 일품 특안심 꽃등심 소갈비살 경애등 경애등안,육회 비빔 비다 미치다 서버 친절하다 고기 맛있다 개인 하다 담 창고 여기 더 맛있...
