#### 종합 과제: “충성 사용자 & 영화 인사이트 리포트”
영화 서비스의 이용자·댓글·영화 데이터를 바탕으로, 마케팅팀이 바로 사용할 수 있는 두 가지 리포트를 만들어 주세요.
 결과는 각각 별도의 출력 구조로 제출합니다.
```
1) 충성 사용자 리포트

이용자와 댓글 데이터를 결합해, 총 댓글 수가 10개 이상인 이용자만 추립니다.
각 이용자에 대해 다음 지표를 계산해 주세요:

commentsCount(총 댓글 수)
avgTextLen(댓글 평균 길이, null/missing은 길이 0으로 간주)
lastCommentDate(가장 최근 댓글 시점)
결과에는 **이름(name), 이메일(email)**만 식별 정보로 포함하고, 위 활동 지표 **내림차순(많이·길게·최근 순)**으로 정렬해 상위 이용자가 누구인지 한눈에 보이도록 합니다.

2) 영화 인사이트 리포트

영화 컬렉션만으로 한 번의 파이프라인에서 다음을 동시에 산출해 주세요.

* 최신 영화 5편: 제목(title)과 연도(year) 목록
* 고평점 영화 개수: imdb.rating ≥ 8 작품의 총 개수(숫자 1개)
* 장르별 상위 10: 장르별 작품 수를 집계해 상위 10개를 많이 나온 순으로 정렬
* 연도별 평균 평점(최근 10년): 최신 연도를 기준으로 최근 10개 연도의 평균 평점을 산출(연도-오름차순 표기)

출력 형식 가이드
충성 사용자 리포트: 리스트(배열) 형태. 각 원소는 {name, email, commentsCount, avgTextLen, lastCommentDate}.
영화 인사이트 리포트: 단일 문서(오브젝트) 형태.
키는 latest5, highRatedCount, genresTop10, yearlyAvgRecent10로 구성.
highRatedCount는 숫자 하나로 제출
```

In [1]:
from pymongo import MongoClient

client = MongoClient("mongodb://localhost:27017")

db = client.sample_mflix

In [2]:
movies = db.movies
users = db.users
comments = db.comments

In [7]:
# 1) 충성 사용자 리포트
pipeline = [
    {"$lookup": {
        "from": "comments",
        "localField": "email",
        "foreignField": "email",
        "as": "userComments"
    }},
    {"$unwind": "$userComments"},
    {"$group": {
        "_id": { "name": "$name", "email": "$email" },
        "commentsCount": { "$sum": 1 },
        "avgTextLen": { "$avg": { "$strLenCP": "$userComments.text" } },
        "lastCommentDate": { "$max": "$userComments.date" } 
    }},
    {"$sort": { "commentsCount": -1, "avgTextLen": -1, "lastCommentDate": -1 }},
    {"$project": { "_id": 1}}
]

for user in users.aggregate(pipeline):
    print(f"name: {user['_id']['name']} / email: {user['_id']['email']}")

name: Mace Tyrell / email: roger_ashton-griffiths@gameofthron.es
name: Missandei / email: nathalie_emmanuel@gameofthron.es
name: The High Sparrow / email: jonathan_pryce@gameofthron.es
name: Sansa Stark / email: sophie_turner@gameofthron.es
name: Rodrik Cassel / email: ron_donachie@gameofthron.es
name: Thoros of Myr / email: paul_kaye@gameofthron.es
name: Robert Jordan / email: robert_jordan@fakegmail.com
name: Brienne of Tarth / email: gwendoline_christie@gameofthron.es
name: Kathryn Sosa / email: kathryn_sosa@fakegmail.com
name: Javier Smith / email: javier_smith@fakegmail.com
name: Catherine Romero / email: catherine_romero@fakegmail.com
name: Andrea Le / email: andrea_le@fakegmail.com
name: Bradley Brooks / email: bradley_brooks@fakegmail.com
name: Megan Richards / email: megan_richards@fakegmail.com
name: Arya Stark / email: maisie_williams@gameofthron.es
name: Elizabeth Wiggins / email: elizabeth_wiggins@fakegmail.com
name: Richard Schmidt / email: richard_schmidt@fakegmail.com
n

In [18]:
# 2) 영화 인사이트 리포트

pipeline = [
    {"$facet": {
        "latest5": [
            {"$sort": {"released": -1}},
            {"$project": {"_id": "$title", "year": 1}},
            {"$limit": 5}
        ],
        "highRatedCount": [
            {"$match": {"imdb.rating": {"$gte": 8}}},
            {"$count": "HighRatedCount"}
        ],
        "genresTop10": [
            {"$unwind": "$genres"},
            {"$group": {"_id": "$genres", "movieCount": {"$sum": 1}}},
            {"$sort": {"movieCount": -1}},
            {"$limit": 10}
        ],
        "yearlyAvgRecent10": [
            {"$group": {"_id": "$year", "avgRating": {"$avg": "$imdb.rating"}}},
            {"$sort": {"_id": -1}},
            {"$limit": 10}
        ]
    }}
]

for movie in movies.aggregate(pipeline):
    print("=== Latest 5 ===")
    for m in movie['latest5']:
        print(f"{m['_id']} ({m['year']})")

    print("\n=== High Rated Count ===")
    print(movie['highRatedCount'][0]['HighRatedCount'])

    print("\n=== Top 10 Genres ===")
    for o in movie['genresTop10']:
        print(f"{o['_id']}: {o['movieCount']}")

    print("\n=== Yearly Avg Recent 10 ===")
    for v in movie['yearlyAvgRecent10']:
        print(f"{v['_id']} : {v['avgRating']}")

=== Latest 5 ===
The Treasure (2015)
Knight of Cups (2015)
Sand Castles (2014)
Shut In (2015)
Dègradè (2015)

=== High Rated Count ===
1596

=== Top 10 Genres ===
Drama: 13789
Comedy: 7024
Romance: 3665
Crime: 2678
Thriller: 2658
Action: 2539
Documentary: 2129
Adventure: 2045
Horror: 1703
Biography: 1404

=== Yearly Avg Recent 10 ===
2015è : 8.4
2014è : 7.25
2012è : 7.5
2011è : 7.75
2010è : 8.2
2009è : 8.3
2007è : 8.533333333333333
2006è2012 : 8.5
2006è2007 : 9.0
2006è : 7.2
