#####

# 진행사항
1. 카카오맵을 크롤링하여 리뷰 예측 모델을 위한 리뷰 데이터 수집
2. LSTM을 이용하여 리뷰 예측 모델 생성
3. 망고 플레이트의 리뷰를 크롤링하여 예측 대상 데이터 수집
4. 미리 만들어놓은 모델을 통해 망고 플레이트 리뷰 평점 예측
5. Google Maps API를 통해 위도 / 경도 데이터 수집
6. 예측한 가게별 리뷰 평점과 위도 / 경도 데이터 정리
7. Google Maps API와 haver_sine을 통하여 입력된 주소들의 중간 지점을 계산
8. 중간 지점에 포함되는 위치의 가게들중 평점이 높은 곳을 Google Map상에 표시
9. 이 중 한 곳을 선택
10. 선택된 곳과 주력 메뉴의 코사인 유사도가 높은 곳을 찾고 해당 데이터를 Google Map으로 전달
11. 전달된 데이터를 Google Map상에 띄우고 별표 마커로 표시

# 개선사항 및 추후보완예정
1. DB를 구축하여 유저들이 선택했던 정보를 저장할 것.
    - (첫 추천시에는 그냥 평점이 높은 가게를 보여주고 여기서 선택했을 때, 이 사람이 어떤 주력 메뉴를 선호하는지 DB에 저장하여 다음 추천 때 주소를 입력하면, 선택했던 주력메뉴 위주로 추천을 해줄 수 있음)
2. API정리 및 코드의 객체화 필요
3. Java Script나 Android Studio를 통해 유저들이 사용하기 용이하도록 인터페이스 개선

#####

In [36]:
import pandas as pd
import numpy as np
import googlemaps
import folium
import ast

from haversine import haversine
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity

In [37]:
def location_recommender(num_points):
    gmaps = googlemaps.Client(key='AIzaSyCNetZW4eZiBmY7Zlwa9IDOj1CtZhgm_a0')
    latitude=[]
    longitude=[]
    coordinate=[]

    address_list = []
    for i in range(num_points):
        address = input("도로명주소를 입력하세요: ")
        geocode_result = gmaps.geocode(address)
        geometry=geocode_result[0].get("geometry")
        location=geometry.get("location")
        lng=location.get("lng")
        lat=location.get("lat")
        latitude.append(lat)
        longitude.append(lng)
        coordinate.append((lat, lng))
        address_list.append(address)

    center_point=(sum(latitude)/len(latitude), sum(longitude)/len(longitude))
    
    cluster = pd.read_csv("./중간지점 산출 4/data/cluster 중간지점 좌표모음(470m 기준).csv", sep=",")
    distance = []
    for i in range(len(cluster)):
        d = haversine(center_point, (cluster["0"][i], cluster["1"][i]))
        distance.append(d)
    s_distance= pd.Series(distance, name="distance")
    cluster_distance=pd.concat([cluster, s_distance], axis=1)
    idx=cluster_distance.nsmallest(3, "distance", keep="all").index
    
    for i in range(3):
        print("{}번째로 가까운 추천지역: {}, 거리 {}km".format(i+1, (cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]), cluster_distance["distance"][idx[i]]))
    
    
    map=folium.Map(location=[center_point[0], center_point[1]], zoom_start=12)
    #folium.Marker([center_point[0], center_point[1]], popup="중간 지점", icon=folium.Icon(color="blue")).add_to(map)
    
    #추천 cluster 표시
    for i in range(3):
        folium.Marker([cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]], popup="추천지역 {}".format(i+1), icon=folium.Icon(color="red")).add_to(map)
        folium.Circle([cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]], radius=1200, color="skyblue", fill_color="skyblue").add_to(map)
    
    #출발지점 표시
    for i in range(len(coordinate)):
        folium.Marker([latitude[i], longitude[i]], popup="출발지점 {}".format(i)).add_to(map)
        #각 출발지점과 추천 cluster 연결선 긋기
        for j in range(3):
            folium.PolyLine(locations=[coordinate[i], (cluster_distance["0"][idx[j]], cluster_distance["1"][idx[j]])],weight=2, color = 'blue').add_to(map)

    #각 cluster 내 음식점 표시
    places = pd.read_csv("./중간지점 산출 4/data/점수포함 맛집리스트2.csv", sep=",")
    color_list = ['green', 'purple', 'orange']
    
    # 음식점 이름 list
    store_list = []
    
    for i in range(3):
        restaurants = pd.DataFrame(columns=places.columns)

        for j in range(len(places)):
            if idx[i] in ast.literal_eval(places['Cluster'][j]):
                restaurants = pd.concat([restaurants, places.iloc[j].to_frame().T])

        restaurants["점수"] = restaurants["점수"].astype(float) 
        hiscore=restaurants.nlargest(5, "점수", keep="all").index
        
        for k in range(len(hiscore)):
            folium.Marker([places["위도"][hiscore[k]], places["경도"][hiscore[k]]], popup=places["이름"][hiscore[k]], icon=folium.Icon(color=color_list[i])).add_to(map)
            store_list.append(places["이름"][hiscore[k]])

    return map, store_list, address_list

In [38]:
def get_recommend_menu_list(df, store_title, top=30):
    # 특정 가게와 비슷한 가게를 추천해야 하기 때문에 "특정 가게" 정보를 뽑아냄
    target_store_index = df[df["이름"] == store_title].index.values
    print(target_store_index)
    
    # 코사인 유사도 중 비슷한 코사인 유사도를 가진 정보를 뽑아낸다.
    sim_index = menu_c_sim[target_store_index, :top].reshape(-1)
    sim_index = sim_index[sim_index != target_store_index]
    print(sim_index)
    
    # data frame으로 만들고 vote_count로 정렬한 뒤 return
#     result = df.iloc[sim_index].sort_values("predict_score", ascending=False)[:5]
    result = df.iloc[sim_index]
    return result

In [76]:
def second_recommend(recommend_list, address_list):
    gmaps = googlemaps.Client(key='AIzaSyCNetZW4eZiBmY7Zlwa9IDOj1CtZhgm_a0')
    latitude=[]
    longitude=[]
    coordinate=[]
    
    for address in address_list:
        geocode_result = gmaps.geocode(address)
        geometry=geocode_result[0].get("geometry")
        location=geometry.get("location")
        lng=location.get("lng")
        lat=location.get("lat")
        latitude.append(lat)
        longitude.append(lng)
        coordinate.append((lat, lng))
        
    center_point=(sum(latitude)/len(latitude), sum(longitude)/len(longitude))
    
    cluster = pd.read_csv("./중간지점 산출 4/data/cluster 중간지점 좌표모음(470m 기준).csv", sep=",")
    distance = []
    for i in range(len(cluster)):
        d = haversine(center_point, (cluster["0"][i], cluster["1"][i]))
        distance.append(d)
    s_distance= pd.Series(distance, name="distance")
    cluster_distance=pd.concat([cluster, s_distance], axis=1)
    idx=cluster_distance.nsmallest(3, "distance", keep="all").index
    
    for i in range(3):
        print("{}번째로 가까운 추천지역: {}, 거리 {}km".format(i+1, (cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]), cluster_distance["distance"][idx[i]]))
    
    
    map=folium.Map(location=[center_point[0], center_point[1]], zoom_start=12)
    #folium.Marker([center_point[0], center_point[1]], popup="중간 지점", icon=folium.Icon(color="blue")).add_to(map)
    
    #추천 cluster 표시
    for i in range(3):
        folium.Marker([cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]], popup="추천지역 {}".format(i+1), icon=folium.Icon(color="red")).add_to(map)
        folium.Circle([cluster_distance["0"][idx[i]], cluster_distance["1"][idx[i]]], radius=1200, color="skyblue", fill_color="skyblue").add_to(map)
    
    #출발지점 표시
    for i in range(len(coordinate)):
        folium.Marker([latitude[i], longitude[i]], popup="출발지점 {}".format(i)).add_to(map)
        #각 출발지점과 추천 cluster 연결선 긋기
        for j in range(3):
            folium.PolyLine(locations=[coordinate[i], (cluster_distance["0"][idx[j]], cluster_distance["1"][idx[j]])],weight=2, color = 'blue').add_to(map)

    #각 cluster 내 음식점 표시
    places = pd.read_csv("./중간지점 산출 4/data/점수포함 맛집리스트2.csv", sep=",")
    color_list = ['green', 'purple', 'orange']
    recommend_color = "black"
    
    for i in range(3):
        restaurants = pd.DataFrame(columns=places.columns)

        for j in range(len(places)):
            if idx[i] in ast.literal_eval(places['Cluster'][j]):
                restaurants = pd.concat([restaurants, places.iloc[j].to_frame().T])

        restaurants["점수"] = restaurants["점수"].astype(float) 
        hiscore=restaurants.nlargest(5, "점수", keep="all").index
        
        print(restaurants)
        print(hiscore)
        
        for k in range(len(hiscore)):
            folium.Marker([places["위도"][hiscore[k]], places["경도"][hiscore[k]]], popup=places["이름"][hiscore[k]], icon=folium.Icon(color=color_list[i])).add_to(map)
    
    # 추천 가게 마커
    for recommend in recommend_list:
        folium.Marker([places[places["이름"]==recommend]["위도"], 
                       places[places["이름"]==recommend]["경도"]], popup=places[places["이름"]==recommend]["이름"], 
                      icon=folium.Icon(color=recommend_color, icon="star")).add_to(map)

    
    return map

In [40]:
store_map, store_list, address_list = location_recommender(3)

도로명주소를 입력하세요: 홍대역
도로명주소를 입력하세요: 영등포역
도로명주소를 입력하세요: 종로역
1번째로 가까운 추천지역: (37.54066053333333, 126.943193425), 거리 0.8100606006520886km
2번째로 가까운 추천지역: (37.558333597402616, 126.92666148149344), 거리 1.7374171517154489km
3번째로 가까운 추천지역: (37.542436155, 126.971120575), 거리 2.705248664534579km


In [41]:
store_map

In [42]:
store_list

# 가게 고르기
store_dict = {}

print("다음 가게 중 한 곳을 골라주세요.")
for idx, store in enumerate(store_list):
    print("{} : {}".format(idx, store))
    store_dict[idx] = store
    
select = int(input("다음 가게들 중 번호를 입력해주세요 : "))

다음 가게 중 한 곳을 골라주세요.
0 : 양송이식당
1 : 옥정
2 : 고메오드
3 : 장가네곱창
4 : 녹기전에
5 : 부송국수
6 : 백색소음
7 : 전주상회
8 : 비아37
9 : 함반
10 : 스탠바이키친
11 : 행복감
12 : 쎄니에
13 : 프랭크버거
14 : 강너머 남촌 숯불 닭갈비
15 : 덕순루
16 : 미와쿠
다음 가게들 중 번호를 입력해주세요 : 7


In [43]:
store_dict[select]

'전주상회'

In [44]:
# places = pd.read_csv("/content/drive/MyDrive/에이콘/0117 등원작업물/data/맛집 리스트 및 소속 cluster.csv", sep=",")
places = pd.read_csv("./중간지점 산출 4/data/점수포함 맛집리스트2.csv", sep=",")
places

Unnamed: 0,이름,주소,좌표,구,위도,경도,Cluster,점수
0,청우참치,서울특별시 강남구 강남대로 632,"(37.5182046, 127.019356)",강남구,37.518205,127.019356,[0],3.47
1,정돈,서울특별시 강남구 강남대로110길 26 1F,"(37.5035911, 127.0269451)",강남구,37.503591,127.026945,[0],3.58
2,꼼다비뛰드,서울특별시 강남구 강남대로110길 62,"(37.5033264, 127.0294865)",강남구,37.503326,127.029487,[0],3.80
3,노들강,서울특별시 강남구 강남대로114길 19,"(37.5061534, 127.0258181)",강남구,37.506153,127.025818,[0],3.00
4,영동소금구이,서울특별시 강남구 강남대로124길 10 1F,"(37.5088173, 127.0234738)",강남구,37.508817,127.023474,[0],3.53
...,...,...,...,...,...,...,...,...
4571,막회무침나라횟집,서울특별시 금천구 시흥대로71길 40,"(37.45521069999999, 126.8993725)",금천구,37.455211,126.899373,[24],3.00
4572,포차인닭갈비,서울특별시 금천구 가산디지털1로 168 우림라이온스밸리 A동 지하,"(37.4800992, 126.8826202)",금천구,37.480099,126.882620,[17],2.67
4573,명화곱창,서울특별시 금천구 벚꽃로38길 5,"(37.4818785, 126.8832991)",금천구,37.481879,126.883299,[17],2.67
4574,혜화동돈까스,서울특별시 금천구 금하로5길 4 1F,"(37.4543357, 126.8988835)",금천구,37.454336,126.898883,[24],4.00


In [45]:
# 같은 클러스터 내의 가게 데이터

cluster_num = places[places["이름"]==store_dict[select]]
cluster_num = cluster_num.iloc[0]["Cluster"]

places[places["Cluster"] == cluster_num]

Unnamed: 0,이름,주소,좌표,구,위도,경도,Cluster,점수
1363,별버거,서울특별시 마포구 독막로 65,"(37.5479497, 126.9206934)",마포구,37.547950,126.920693,[37],3.40
1364,테이스티버거,서울특별시 마포구 독막로 67-11 행운빌딩 1F,"(37.54820369999999, 126.9206852)",마포구,37.548204,126.920685,[37],3.47
1365,맛이차이나,서울특별시 마포구 독막로 68 2F,"(37.5475555, 126.9208439)",마포구,37.547556,126.920844,[37],3.67
1366,오츠에스프레소,서울특별시 마포구 독막로14길 32,"(37.547439, 126.9218632)",마포구,37.547439,126.921863,[37],3.27
1367,아소토,서울특별시 마포구 독막로2길 34,"(37.5471016, 126.9141884)",마포구,37.547102,126.914188,[37],3.50
...,...,...,...,...,...,...,...,...
1733,탭스터,서울특별시 서대문구 증가로 1 103호,"(37.5686274, 126.9318779)",서대문,37.568627,126.931878,[37],3.50
1734,희게,서울특별시 서대문구 증가로 1 201호,"(37.5686274, 126.9318779)",서대문,37.568627,126.931878,[37],3.67
1735,포포브레드,서울특별시 서대문구 증가로 18,"(37.5699642, 126.9312486)",서대문,37.569964,126.931249,[37],3.60
1736,롱보트스모커,서울특별시 서대문구 증가로 27 1F,"(37.5705006, 126.9302788)",서대문,37.570501,126.930279,[37],4.00


In [46]:
# 추천알고리즘을 위해 중복되는 리뷰를 지운 가게 주력메뉴 데이터
review_df = pd.read_csv("./data/리뷰_6개구 수정_0112.csv")

main_dish = review_df.iloc[:,1:6]

main_dish_df = main_dish.drop_duplicates("이름")

# 주력 메뉴 결측치 제거
main_dish_df["주력 메뉴"].fillna("정보 없음", inplace=True)

main_dish_df["주력 메뉴"].isna().sum()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._update_inplace(new_data)


0

In [47]:
# 같은 클러스터내의 가게들 리스트 뽑기

cluster_store = places[places["Cluster"] == cluster_num]["이름"]
cluster_store

for i in cluster_store:
    print(i)
    
# 주력메뉴가 있는 데이터 프레임에서 이 가게들만 뽑기
cluster_in_store = pd.DataFrame()

for i in cluster_store:
    cluster_in_store = pd.concat([cluster_in_store,
                                  main_dish_df[main_dish_df["이름"]==i]])
cluster_in_store.reset_index(inplace=True)

별버거
테이스티버거
맛이차이나
오츠에스프레소
아소토
육지
어반플랜트
오레노라멘
야키토리나루토
카와카츠
멘야준
하연옥
바다회사랑
아날로그가든
중화복춘
랫댓
랜디스도넛
몽중식
홈보이서울
온정
베르데
스시올로지
228-9 (휴업중)
소이연남
상해소흘
과일가게
뭄미
망원동즉석우동
강화통통생고기
홍어한마리
카밀로라자네리아
첸토페르첸토
쿠리노키제빵
Quench Coffee
츄이구이브레드
남북통일
리밀커피&밀리
아각아각
17도씨
해피버거데이
하나라멘
코코시에나티하우스
수부니흐
연어롭다
리틀파파포
혼네
우주옥
아꽁뜨
라멘집아저씨
어수선
단고당
커피가게동경
미완성식탁
일등식당
조용한저녁
산울림1992 (휴업중)
연남살롱
티크닉
얼스어스
요코쵸
야키토리 미식
야경
포가
전주상회
오복수산
코메아벨렘
사월의물고기
르규옹
소점
파롤앤랑그
교다이야
김광석 신촌칼국수
평안도상원냉면
쿠차라
카와카츠오토코
손오공 마라탕
합정옥
파이리퍼블릭
더다이닝랩
오스테리아샘킴
스파카나폴리
쿠이신보
요요스시
옥동식
세상끝의라멘
태양커피
듁스커피
카페비하인드
빠넬로
사루카메
헬로인디아
제스티살룬
브레드럼
미야자키상점
1989버거스탠드
리틀빅토리
쿠루미
다엔조
연교
냉장고
상수동카스티야
뭄알로이
멘타카무쇼
예티
닭꼬얌
비스트로주라
지로우라멘
진만두
더리얼치즈버거
마시타야
아이엠어버거
쥬마뺄
하꼬
홈프롬귀
우리바다수산
너랑나랑호프
멘지라멘
앤트러사이트
라바즈
헤키
소금집델리 망원
장화신은고양이
블루쿠치나
마리오파스타
키오스크
함반
퓨전선술집
둥둥막창구이
최강금돈까스
담택
조선화로구이
리치몬드과자점
칼라스커피 로스터스
진진가연
젤라떼리아 에따
부부 드 꼼뜨와
리플로우
Osteria Ora
진진
오흐뒤구떼
한림돈가
이치류
멘야하나비
아키야라멘
토파
당도
이치젠
미에우
잇텐고
라무라
덕이손만두
프로그
천지양꼬치
세잔
과자산책
고타이
크레이지카츠
프롬하노이
복덕방
미자카야
비스트로망원
코코부코
카카오다다
라오삐약
웨스트사이드
락희안
망넛이네
고바우집
라구식당
벽제갈비
대명꼬기
비아 메렝게
피망과토마토
헌치브라운
초코

In [48]:
###### 추천 알고리즘 
# CountVectorizer
count_vect = CountVectorizer(min_df=0, ngram_range=(1,2))
menu_mat = count_vect.fit_transform(cluster_in_store["주력 메뉴"])

print(menu_mat.shape)

menu_sim = cosine_similarity(menu_mat, menu_mat)

menu_c_sim = cosine_similarity(menu_mat,menu_mat).argsort()[:,::-1]

(340, 109)


In [49]:
# 2번째 선택때 추천해줄 명단.
result = get_recommend_menu_list(cluster_in_store, store_title = store_dict[select])

recommend_list = result.sort_values("평점", ascending=False)[:5]

[63]
[255 233 309  55 293  17 138 165 133  24 299 275 230 295   2 292  14 175
   8 248 118 113 114 115 112 116 111 117 110]


In [51]:
recommend_list

Unnamed: 0,index,이름,평점,주소,주력 메뉴,가격대
55,12675,산울림1992 (휴업중),4.6,서울특별시 마포구 서강로9길 60,전통 주점 / 포차,만원-2만원
8,11909,야키토리나루토,4.6,서울특별시 마포구 독막로9길 26,정통 일식 / 일반 일식,만원-2만원
165,14334,락희안,4.5,서울특별시 서대문구 가재울로4길 53,정통 중식 / 일반 중식,만원 미만
118,13612,라바즈,4.4,서울특별시 마포구 월드컵로13길 19-23 2F,베이커리,만원 미만
112,13535,하꼬,4.4,서울특별시 마포구 와우산로3길 15,이자카야 / 오뎅 / 꼬치,만원-2만원


In [77]:
second_recommend(list(recommend_list["이름"].values), address_list)

1번째로 가까운 추천지역: (37.54066053333333, 126.943193425), 거리 0.8100606006520886km
2번째로 가까운 추천지역: (37.558333597402616, 126.92666148149344), 거리 1.7374171517154489km
3번째로 가까운 추천지역: (37.542436155, 126.971120575), 거리 2.705248664534579km
            이름                                          주소  \
1414    이요이요스시          서울특별시 마포구 마포대로 173-15 래미안5차상가 106호   
1415       후엘고                       서울특별시 마포구 마포대로11길 118   
1416     비파티세리                      서울특별시 마포구 마포대로14길 4 1F   
1417       고도식                         서울특별시 마포구 마포대로1길 16   
1423      녹기전에                        서울특별시 마포구 백범로 127-24   
1424  엘리스리틀이태리                   서울특별시 마포구 백범로 152 201동 1F   
1425   탑클라우드23                서울특별시 마포구 백범로 192 에쓰오일사옥 23F   
1426      돈카츠준          서울특별시 마포구 백범로 205 펜트라우스 101동 B226호   
1427      계고기집                          서울특별시 마포구 백범로24길 1   
1428      고메오드  서울특별시 마포구 백범로24길 1-9 공덕파크자이2단지 202동 1F 11호   
1429        기노                         서울특별시 마포구 삼개로3길 6-1   
1430  프릳츠커피컴퍼니                 

['산울림1992 (휴업중)', '야키토리나루토', '락희안', '라바즈', '하꼬']