# **리뷰 통계 정리기** | 리팩토링 실습 과제

## **문제 설명**
다음은 쇼핑몰 사용자 리뷰 데이터를 바탕으로 **긍정/부정 단어 개수를 세고**,   
리뷰에서 **가장 자주 등장한 단어**를 출력하는 코드입니다.   

하지만 다음과 같은 문제가 있습니다:
* 코드가 **길고 중복이 많으며**, 기능별로 정리가 되어 있지 않습니다.
* **타입 힌트가 빠져 있고**, 반복문이 너무 많이 사용되었습니다.
* **리스트 컴프리헨션, 함수 추출, 조건 처리, 기초적인 클래스/제너레이터 활용** 없이 작성된 상태입니다.

## 🎯 **리팩터링 미션**
1. **의미별로 함수를 나누고**, 중복 코드를 제거하세요.
2. **리스트 컴프리헨션을 적극 활용**하세요.
3. **타입 힌트**를 모든 함수에 적용하세요.
4. **전역 변수 없이** 코드를 구성하세요.
5. **클래스나 제너레이터**는 선택사항으로 활용해보세요.

## 📌 **요구 조건 체크리스트**
- [ ] `analyze_reviews()` 같은 메인 로직 함수가 존재함
- [ ] `count_word_occurrences()` 등의 별도 함수로 분리
- [ ] 중복 반복문 제거 (예: 단어 개수 세기 이중 for 제거)
- [ ] 리스트 컴프리헨션 1회 이상 사용
- [ ] 타입 힌트 전면 적용
- [ ] 출력 내용 동일하게 유지

## 💡 **선택 확장 미션**
* 가장 많이 등장한 단어가 여러 개라면 사전순으로 먼저인 단어를 출력하도록 바꿔보세요.
* 제너레이터를 사용하여 split()한 단어를 하나씩 처리하는 방식으로 바꿔보세요.

## 🍎 **출력 예시**
```
긍정 단어 수: 20
부정 단어 수: 18
가장 많이 등장한 단어: 좋아요! (4회)
```

아래는 리팩토링이 필요한 기존 코드입니다.

In [3]:
# 리뷰 데이터
reviews = [
    "이 제품 정말 좋아요! 배송도 빠르고 품질도 훌륭합니다",
    "가격대비 그저 그래요... 아쉽네요",
    "좋은 상품입니다 또 구매할게요!",
    "별로에요 실망했어요 ㅠㅠ",
    "만족스럽습니다 좋아요 좋아요!",
    "품질이 훌륭하고 가성비도 좋네요",
    "배송이 너무 늦어서 실망했어요",
    "디자인도 예쁘고 성능도 만족스러워요",
    "AS가 불친절하고 제품도 별로네요",
    "가격도 합리적이고 좋은 선택이었어요",
    "포장이 허술해서 아쉽네요...",
    "기대 이상으로 만족스러운 제품입니다",
    "사용하기 불편하고 그저 그래요",
    "빠른 배송 감사합니다 좋아요!",
    "품질이 기대에 못미쳐서 실망이에요",
    "서비스가 친절하고 제품도 훌륭해요",
    "가격은 비싼데 성능이 별로네요",
    "전반적으로 만족스러운 구매였습니다",
    "오배송이라 너무 실망스러워요",
    "재구매 의사 있을 정도로 좋아요!"
]

# 긍정/부정 단어 리스트
positive_words = ['좋아요', '훌륭', '만족', '빠르고', '예쁘고', '친절', '합리적', '기대 이상', '감사', '재구매', '가성비']
negative_words = ['별로', '실망', '아쉽', '그저', '불친절', '허술', '불편', '못미쳐', '비싼', '오배송', '늦어',]

# 긍정 단어 개수 세기
positive_count = 0
for review in reviews:
    for word in positive_words:
        if word in review:
            positive_count = positive_count + 1

# 부정 단어 개수 세기
negative_count = 0
for review in reviews:
    for word in negative_words:
        if word in review:
            negative_count = negative_count + 1

print(f"긍정 단어 수: {positive_count}")
print(f"부정 단어 수: {negative_count}")

# 가장 많이 등장한 단어 찾기
word_count = {}
for review in reviews:
    words = review.split()
    for word in words:
        if word in word_count:
            word_count[word] = word_count[word] + 1
        else:
            word_count[word] = 1

# 최대 빈도수 찾기
max_frequency = 0
most_common = ''
for word in word_count:
    if word_count[word] > max_frequency:
        max_frequency = word_count[word]
        most_common = word

print(f"가장 많이 등장한 단어: {most_common} ({max_frequency}회)")

긍정 단어 수: 20
부정 단어 수: 18
가장 많이 등장한 단어: 좋아요! (4회)


## 리팩토링 코드

In [None]:
# 리뷰 데이터
reviews = [
    "이 제품 정말 좋아요! 배송도 빠르고 품질도 훌륭합니다",
    "가격대비 그저 그래요... 아쉽네요",
    "좋은 상품입니다 또 구매할게요!",
    "별로에요 실망했어요 ㅠㅠ",
    "만족스럽습니다 좋아요 좋아요!",
    "품질이 훌륭하고 가성비도 좋네요",
    "배송이 너무 늦어서 실망했어요",
    "디자인도 예쁘고 성능도 만족스러워요",
    "AS가 불친절하고 제품도 별로네요",
    "가격도 합리적이고 좋은 선택이었어요",
    "포장이 허술해서 아쉽네요...",
    "기대 이상으로 만족스러운 제품입니다",
    "사용하기 불편하고 그저 그래요",
    "빠른 배송 감사합니다 좋아요!",
    "품질이 기대에 못미쳐서 실망이에요",
    "서비스가 친절하고 제품도 훌륭해요",
    "가격은 비싼데 성능이 별로네요",
    "전반적으로 만족스러운 구매였습니다",
    "오배송이라 너무 실망스러워요",
    "재구매 의사 있을 정도로 좋아요!"
]
# 긍정/부정 단어 리스트
positive_words = ['좋아요', '훌륭', '만족', '빠르고', '예쁘고', '친절', '합리적', '기대 이상', '감사', '재구매', '가성비']
negative_words = ['별로', '실망', '아쉽', '그저', '불친절', '허술', '불편', '못미쳐', '비싼', '오배송', '늦어',]

def count_words(reviews: list, words: list) -> int:
    """특정 단어들이 리뷰에서 등장하는 횟수를 계산합니다."""
    count = sum(1 for review in reviews for word in words if word in review)
    return count

def find_most_common_word(reviews):
    """리뷰에서 가장 많이 등장한 단어와 그 빈도수를 반환합니다."""
    word_count = {}

    for review in reviews:
        words = review.split()
        for word in words:
            word_count[word] = word_count.get(word, 0) + 1
    
    most_common = max(word_count.items(), key=lambda x: x[1])
    return most_common

def analyzs_reviews(reviews: list, positive_words: list, negative_words: list) -> None:
    """리뷰를 분석하여 긍정/부정 단어 수와 가장 많이 등장한 단어를 출력합니다."""
    positive_count = count_words(reviews, positive_words)
    negative_count = count_words(reviews, negative_words)

    most_common_word, frequency = find_most_common_word(reviews)

    print(f"긍정 단어 수: {positive_count}")
    print(f"부정 단어 수: {negative_count}")
    print(f"가장 많이 등장한 단어: {most_common_word} ({frequency}회)")

analyzs_reviews(reviews, positive_words, negative_words)


긍정 단어 수: 20
부정 단어 수: 18
가장 많이 등장한 단어: 좋아요! (4회)


---
# **도서 리뷰 관리자 시스템 개선하기** | 리팩토링 심화 실습

## **문제 설명**
다음은 한 개발자가 급하게 작성한 도서 리뷰 관리 프로그램입니다.   

이 코드는 기본 기능은 있지만, 다음과 같은 문제가 있습니다:
* 책과 리뷰를 별도 클래스로 분리하지 않고 딕셔너리만 사용
* 코드가 기능별로 나뉘어 있지 않고 main 블록에 몰려 있음
* 중복된 코드와 가독성이 떨어지는 변수명
* 타입 힌트 누락, 모듈화 미비

여러분은 이 코드를 클래스 기반으로 재구성하고,   
py 파일로 분리하여 Jupyter Notebook에서 불러오는 구조로 리팩터링 해야 합니다.

## 🎯 **리팩터링 미션**
1. BookReview 클래스 만들기
    - **한 권의 책에 대한 리뷰 정보를 저장하고 처리하는 역할을 합니다.**
    - 책 제목(`title: str`)과 리뷰 점수 리스트(`scores: List[int]`)를 속성으로 가집니다.
    - 새로운 평점을 추가하는 `add_review(score: int)` 메서드를 제공합니다.
    - 현재까지의 평균 평점을 계산하는 `average_score() -> float` 메서드를 제공합니다.
    - `이 클래스는 개별 책 단위의 리뷰 데이터를 구조적으로 관리하고, 평점들을 스스로 처리할 수 있게 합니다.
2. ReviewManager 클래스 만들기
    - **여러 책(BookReview 객체)과 리뷰들을 통합적으로 관리하는 컨트롤러 역할을 합니다.**
    - 내부적으로는 `Dict[str, BookReview]` 구조를 사용하여, 책 제목별 리뷰 객체를 저장합니다.
    - 해당 책의 리뷰를 추가하는 `add_review(title: str, score: int) -> None` 메소드를 제공합니다.
    - 특정 책의 평균을 계산하는 `get_average(title: str) -> float` 메소드를 제공합니다.
    - 가장 평점이 높은 책을 반환하는 `get_top_book() -> Tuple[str, float]` 메소드를 제공합니다.
    - 전체 프로그램의 입출력 인터페이스 역할을 하며, BookReview 객체들과의 상호작용을 중개합니다
3. 코드 모듈화
    - 위 두 클래스를 각각 `book_review.py`, `review_manager.py`로 분리
    - ReviewManager 클래스에서는 `from book_review import BookReview`로 불러올 수 있도록 할 것
    - Jupyter Notebook에서는 `from review import ReviewManager`로 불러올 수 있도록 할 것
4. 타입 힌트 전면 적용

## 📌 **요구 조건 체크리스트**
- [ ] 클래스 분리 완료 (BookReview, ReviewManager)
- [ ] 기능별 메서드 분리
- [ ] 중복 제거
- [ ] 타입 힌트 적용
- [ ] py 파일로 분리 후 import 가능

## 💡 **선택 확장 미션**
* get_top_book()에서 동점 도서가 여러 개일 경우, 사전순으로 먼저인 책 반환
* 평점 평균이 소수점 둘째 자리까지만 나오도록 처리

## 🍎 **출력 예시**
```
파이썬 기초 평균: 4.50
딥러닝 입문 평균: 2.33
최고 평점 도서: 파이썬 기초 (4.5)
```

아래는 리팩토링이 필요한 기존 코드입니다.

In [None]:
reviews = {}

def add_review(title, score):
    if title in reviews:
        reviews[title].append(score)
    else:
        reviews[title] = [score]

def average(title):
    if title not in reviews:
        return 0
    total = 0
    for score in reviews[title]:
        total += score
    return total / len(reviews[title])

def top_book():
    max_avg = 0
    top_title = ""
    for title in reviews:
        avg = average(title)
        if avg > max_avg:
            max_avg = avg
            top_title = title
    return top_title, max_avg

add_review("파이썬 기초", 5)
add_review("파이썬 기초", 4)
add_review("딥러닝 입문", 5)
add_review("딥러닝 입문", 1)
add_review("웹 개발 입문", 4)
add_review("딥러닝 입문", 1)

print(f"파이썬 기초 평균: {average('파이썬 기초')}")
print(f"딥러닝 입문 평균: {average('딥러닝 입문')}")
print(f"최고 평점 도서: {top_book()[0]} ({top_book()[1]})")

파이썬 기초 평균: 4.5
딥러닝 입문 평균: 2.3333333333333335
최고 평점 도서: 파이썬 기초 (4.5)


## 개선 코드 

### 📄 book_review.py

In [None]:
from typing import List

class BookReview:
    def __init__(self, title: str):
        self.title: str = title
        self.scores: List[int] = []

    def add_review(self, score: int) -> None:
        self.scores.append(score)

    def average_score(self) -> float:
        if not self.scores:
            return 0.0
        return sum(self.scores) / len(self.scores)


### 📄 review_manager.py

In [None]:
from typing import Dict, Tuple
from book_review import BookReview

class ReviewManager:
    def __init__(self):
        self.books: Dict[str, BookReview] = {}

    def add_review(self, title: str, score: int) -> None:
        if title not in self.books:
            self.books[title] = BookReview(title)
        self.books[title].add_review(score)

    def get_average(self, title: str) -> float:
        if title not in self.books:
            return 0.0
        return self.books[title].average_score()

    def get_top_book(self) -> Tuple[str, float]:
        if not self.books:
            return ("", 0.0)
        max_title = ""
        max_avg = 0.0
        for title, book in self.books.items():
            avg = book.average_score()
            if avg > max_avg or (avg == max_avg and title < max_title):
                max_title = title
                max_avg = avg
        return max_title, max_avg

### 🌏 Jupyter Notebook 코드셀

In [2]:
from review_manager import ReviewManager

manager = ReviewManager()
manager.add_review("파이썬 기초", 5)
manager.add_review("파이썬 기초", 4)
manager.add_review("딥러닝 입문", 5)
manager.add_review("딥러닝 입문", 1)
manager.add_review("웹 개발 입문", 4)
manager.add_review("딥러닝 입문", 1)

print(f"파이썬 기초 평균: {manager.get_average('파이썬 기초'):.2f}")  # 4.5
print(f"딥러닝 입문 평균: {manager.get_average('딥러닝 입문'):.2f}")  # 4.0

top_title, top_score = manager.get_top_book()
print(f"최고 평점 도서: {top_title} ({top_score:.1f})")

파이썬 기초 평균: 4.50
딥러닝 입문 평균: 2.33
최고 평점 도서: 파이썬 기초 (4.5)
