In [2]:
%load_ext icypher

In [3]:
%cypher http://neo4j:neo4jadmin@localhost:7474/db/data

# 5장 Summary
> 디자인을 변경 방법  
>> 데이터 재설계는 최적화를 위해 수행되거나 비즈니스 이유에 의해 추진될 수 있다  
>> Neo4j와 같은 그래프 데이터베이스에서는 제대로 계획하면 시스템 중단 없이 변경 가능 하다  

# 6장 Modeling Communication Chains
호텔에 대한 리뷰를 모델링 방법
> • 리뷰에 대한 의견을 Chain 모델링
> • 시간 데이터를 Chain으로 모델링하기 위한 고려 사항

## 1. Capturing traveler reviews for hotels
호텔 평가 매개변수 추가 - 현재는 price 만 존재  
> • Food  
> •	Comfort  
> •	Service  
> •	Value for money ( 가격대비 가치)  

## 2. A model for reviews and comments

![figure%206-1.png](attachment:figure%206-1.png)
> Review
>> 모든 리뷰는 id 속성을 사용하는 고유하게 식별  
>> Food, Comfort, Service, 가격대비 가치 - 1~5 부여, 5가 가장 높은 것  
>> 리뷰 타임스탬프 : created_on  
>> 호텔 숙발일자 : stay_on  
>> 기타 추가 정보 : stay_year, stay_month, stay_day<br><br>

> Comment  
>> 모든 커멘트는 id 속성을 사용하는 고유하게 식별  
>> 커멘트 타임스탬프 : created_on  
>> text : 실제 communcation

![figure%206-2.png](attachment:figure%206-2.png)

> Review ==> Node,   (:Review) -> (:Hotel)  :FOR_HOTEL 관계  
> User 는 Review나 Comment에 대댓글을 남긴다.  
> 댓글과 댓글이 달린 댓글/리뷰 사이에 :ON 관계  
> User 는 Review/ Comment 에 :WROTE 관계  

![figure%206-3.png](attachment:figure%206-3.png)

> <strong> 시간순을 고려한 모델   </strong>
>> Comment 이 :IN_ REPLY_TO 관계로 연결 가정  
>> Comment 를 chain으로 모델링하면 Comment 사이의 순서를 명시적으로 유지할 수 있음  
>> 댓글이 연결되지 않으면 질문과 답변을 유지하며, 관련 정보를 찾기가 어렵다  

## 3. Adding reviews to Neo4j

### 3.1. Creating review

snippet_1_create_id_constraint_on_review.cqy

In [1]:
%%cypher
CREATE CONSTRAINT ON (review:Review) ASSERT review._id IS UNIQUE;

UsageError: Cell magic `%%cypher` not found.


snippet_2_add_a_review.cqy ( 리뷰 추가 )

In [4]:
%%cypher
CREATE (review:Review{ _id:"d11f1d66-2331-11e5-ab8f-6c40089a9424", value_for_money: 2, comfort: 3, food: 4, service: 3, stayed_on: 1388670309.210871, created_on: 1391157765.857148, stay_year: 2014, stay_month: 1, stay_day: 2, description:"Was a comfortable stay. Could improve a lot though"})
WITH review
MATCH (hotel:Hotel{_id: "19397f48-1c6f-11e5-8014-6c40089a9424"}), (user:User {email: "mahesh.lal@gmail.com"})
WITH review, user, hotel MERGE (user)-[:WROTE]->(review)-[:FOR_HOTEL]->(hotel);

ClientError: [Statement.SyntaxError] Invalid input 'a': expected
  "!="
  "%"
  "*"
  "+"
  ","
  "-"
  "."
  "/"
  ":"
  "<"
  "<="
  "<>"
  "="
  "=~"
  ">"
  ">="
  "AND"
  "CONTAINS"
  "ENDS"
  "IN"
  "IS"
  "OR"
  "STARTS"
  "XOR"
  "["
  "^"
  "}" (line 1, column 241 (offset: 240))
"CREATE (review:Review{ _id:d11f1d66-2331-11e5-ab8f-6c40089a9424, value_for_money: 2, comfort: 3, food: 4, service: 3, stayed_on: 1388670309.210871, created_on: 1391157765.857148, stay_year: 2014, stay_month: 1, stay_day: 2, description:Was a comfortable stay. Could improve a lot though})"
                                                                                                                                                                                                                                                 ^

reviews.cqy 수행해서 많은 review 생성 

In [5]:
%%cypher
//review.cqy 수행

UsageError: %%cypher is a cell magic, but the cell body is empty. Did you mean the line magic %cypher (single %)?


### 3.2. Listing reviews for a hotel

snippet_3_return_hotels_in_reverse_chronological_order_of_stay.cqy (역순으로 review 를 가지고 옴)

In [6]:
%%cypher
MATCH (hotel:Hotel{_id:'19397f48-1c6f-11e5-8014-6c40089a9424'})<-[:FOR_HOTEL]-(review:Review)<-[:WROTE]-(user:User)
WITH review, user, review.stayed_on as stayed ORDER BY stayed DESC
RETURN review.value_for_money as value_for_money, review.comfort as comfort, review.food as food, review.service as service, review.stay_year as year, review.stay_month as month, review.stay_day as day, user.name as name;

[{'value_for_money': 1,
  'comfort': 2,
  'food': 2,
  'service': 2,
  'year': 2015,
  'month': 6,
  'day': 18,
  'name': 'Brian Heritage'},
 {'value_for_money': 4,
  'comfort': 1,
  'food': 3,
  'service': 1,
  'year': 2014,
  'month': 12,
  'day': 20,
  'name': 'Amit Kumar'},
 {'value_for_money': 3,
  'comfort': 1,
  'food': 3,
  'service': 3,
  'year': 2014,
  'month': 9,
  'day': 3,
  'name': 'John Doe'},
 {'value_for_money': 3,
  'comfort': 4,
  'food': 2,
  'service': 4,
  'year': 2014,
  'month': 1,
  'day': 3,
  'name': 'Dave Coeburg'},
 {'value_for_money': 2,
  'comfort': 3,
  'food': 4,
  'service': 3,
  'year': 2014,
  'month': 1,
  'day': 2,
  'name': 'Mahesh Lal'},
 {'value_for_money': 2,
  'comfort': 4,
  'food': 1,
  'service': 4,
  'year': 2013,
  'month': 10,
  'day': 12,
  'name': 'Vishal P'}]

![figure%206-4.png](attachment:figure%206-4.png)

### 3.3. Using reviews to find the average rating of a hotel

snippet_4_all hotels in_new_york_ordered_by_overall_rating.cqy (리뷰내 평균 평점)  
[Aggregation functions-COLLECT()](https://neo4j.com/docs/cypher-manual/current/functions/aggregating/)  
[List function-REDUCE()](https://neo4j.com/docs/cypher-manual/current/functions/list/)

In [None]:
%%cypher
//호텔별로 그룹화된 모든 리뷰 가져오기
MATCH (city:City{name:"New York"})-[:HAS_AIRPORT]->(airport:Airport)-[:HAS_HOTEL]->(hotel:Hotel)<-[:FOR_HOTEL]-(review:Review)
//각 호텔에 대한 개별 리뷰 매개변수를 추가
WITH 
DISTINCT hotel.name AS hotel_name,
COLLECT(review.comfort) AS comfort_ratings,
COLLECT(review.food) AS food_ratings,
COLLECT(review.service) AS service_ratings,
COLLECT(review.value_for_money) as vfm_ratings,
airport.code AS airport,
COUNT(review) as total_reviews
// 합계를 총 리뷰 수로 나누어 평균 개별 리뷰 변수를 얻음                 
WITH
hotel_name,
tofloat(REDUCE(total = 0, rating in comfort_ratings | total + rating))/ total_reviews as comfort_rating,
tofloat(REDUCE(total = 0, rating in food_ratings | total + rating))/ total_reviews as food_rating,
tofloat(REDUCE(total = 0, rating in service_ratings | total + rating))/ total_reviews as service_rating,
tofloat(REDUCE(total = 0, rating in vfm_ratings | total + rating))/ total_reviews as vfm_rating,
airport,
total_reviews
//전체 평가를 모든 검토 매개변수의 평균으로 계산           
RETURN 
airport,
hotel_name,
comfort_rating,
service_rating,
food_rating,
vfm_rating,
(comfort_rating + service_rating + food_rating + vfm_rating)/4 as overall_rating
ORDER BY overall_rating DESC

![figure%206-5.png](attachment:figure%206-5.png)

## 4. Adding comments to Neo4j  
> 시간순이 중요하기 때문에 코멘트에 대한 체인을 만듬  
> 리뷰에 코멘트가 달린 응답으로 새로운 코멘트 체인이 시작  



### 4.1. Creating comment

snippet_5_add_constraint_on_comment_id.cqy  ( 호텔후기에 대한 constraint 추가 )

In [7]:
%%cypher
CREATE CONSTRAINT ON (comment:Comment) ASSERT comment._id IS UNIQUE;

[]

snippet_6_add_comment_to_query.cqy (호텔 리뷰에 Commnet 추가 )

In [8]:
%%cypher
CREATE (comment:Comment{_id:"df23c188-2349-11e5-8966-6c40089a9424", text:"What was wrong with the service?", created_on: 1391550607.342643})
WITH comment
MATCH (review:Review{_id:"d120a06e-2331-11e5-bf11-6c40089a9424"}), (user:User{email:"mahesh.lal@gmail.com"})
WITH review, user, comment
MERGE (review)<-[:IN_REPLY_TO]-(comment)<-[:WROTE]-(user)
RETURN review, comment, user

ClientError: [Statement.SyntaxError] Invalid input 'was': expected
  "!="
  "%"
  "*"
  "+"
  ","
  "-"
  "."
  "/"
  ":"
  "<"
  "<="
  "<>"
  "="
  "=~"
  ">"
  ">="
  "AND"
  "CONTAINS"
  "ENDS"
  "IN"
  "IS"
  "OR"
  "STARTS"
  "XOR"
  "["
  "^"
  "}" (line 1, column 77 (offset: 76))
"CREATE (comment:Comment{_id:df23c188-2349-11e5-8966-6c40089a9424, text:What was wrong with the service?, created_on: 1391550607.342643})"
                                                                             ^

![figure%206-6.png](attachment:figure%206-6.png)

snippet_7_add_comment_in_reply_to_a_comment.cqy ( comment 에 comment 달기)

In [None]:
%%cypher
CREATE (new_comment:Comment{_id:"a3da3c5c-2350-11e5-9006-6c40089a9424", text: "Some issues with the air conditioner which led to a sleepless night", created_on: 1391723407.342643})
WITH new_comment
MATCH (comment:Comment{_id:"df23c188-2349-11e5-8966-6c40089a9424"}), (user:User{email:"hale.orison@gmail.com"})
MERGE (user)-[:WROTE]->(new_comment)-[:IN_REPLY_TO]->(comment)
RETURN user, new_comment, comment

![figure%206-7.png](attachment:figure%206-7.png)

snippet_8_add_another_comment_to_review(추가 입력)

In [None]:
%%cypher
CREATE (comment:Comment{_id:"1e0a80de-2353-11e5-86b5-6c40089a942", text:"Thanks for updating this.", created_on:1390686607.342643})
WITH comment
MATCH (review:Review{_id:"d120a06e-2331-11e5-bf11-6c40089a9424"}), (user:User{email:"elijah.b@gmail.com"})
WITH review, user, comment
MERGE (review)<-[:IN_REPLY_TO]-(comment)<-[:WROTE]-(user)
RETURN review, comment, user

![figure%206-8.png](attachment:figure%206-8.png)

snippet_9_get_review_with_all_coments ( 리뷰와 그에 따른 모든 comment 가져 오기)

In [9]:
%%cypher
MATCH p = (review:Review{_id:"d120a06e-2331-11e5-bf11-6c40089a9424"})<-[:IN_REPLY_TO*1..]-(comment:Comment)<-[:WROTE]-(user:User)
RETURN p

ClientError: [Statement.SyntaxError] Variable `d120a06e` not defined (line 1, column 30 (offset: 29))
"MATCH p = (review:Review{_id:d120a06e-2331-11e5-bf11-6c40089a9424})<-[:IN_REPLY_TO*1..]-(comment:Comment)<-[:WROTE]-(user:User)"
                              ^

![figure%206-9.png](attachment:figure%206-9.png)

### 4.2. Considerations for modeling temporal data as chains (시간 데이터를 체인으로 모델링하기 위한 고려 사항)

> 시간 데이터를 Chain 으로 모델링 이점 경우  
>> • 데이터 간의 시간적 관계가 중요할 때 데이터는 체인으로 모델링되어야 한다. 요청-응답 구조(예: 댓글 및 이메일)은 Chain으로 모델링하는 데 적합하다. Comunication을 Chain으로 모델링하면 데이터가 입력 되는 순서가 유지 가능  
>> • 비자 신청과 같이 데이터의 암시적 순서로 여러 단계를 거칠 경우, 단계를 Chain 으로 모델링하는 것이 합리적  
>> • 어떤 경우에는 데이터를 표시하는 우선 순위가 있을 수 있는데, 데이터를 더 빠르게 가져올 수 있도록 데이터를 Chain으로 모델링할 수 있음.

> Chain 모델링 단점 
>> • 데이터를 Chain으로 모델링하면 특정 순서로 검색하는 것은 효율적이지만 검색 패턴을 변경해야 하는 경우 성능이 저하될 수 있다.
>> • 역순으로 정렬된 체인에 데이터를 쓰기 위해서는 복잡한 쿼리가 필요