# Pinecone DB (프리티어 사용)

In [1]:
!pip install pinecone

Collecting pinecone
  Downloading pinecone-7.3.0-py3-none-any.whl.metadata (9.5 kB)
Collecting pinecone-plugin-assistant<2.0.0,>=1.6.0 (from pinecone)
  Downloading pinecone_plugin_assistant-1.8.0-py3-none-any.whl.metadata (30 kB)
Collecting pinecone-plugin-interface<0.0.8,>=0.0.7 (from pinecone)
  Downloading pinecone_plugin_interface-0.0.7-py3-none-any.whl.metadata (1.2 kB)
Collecting packaging<25.0,>=24.2 (from pinecone-plugin-assistant<2.0.0,>=1.6.0->pinecone)
  Downloading packaging-24.2-py3-none-any.whl.metadata (3.2 kB)
Downloading pinecone-7.3.0-py3-none-any.whl (587 kB)
   ---------------------------------------- 0.0/587.6 kB ? eta -:--:--
   ---------------------------------------- 587.6/587.6 kB 20.3 MB/s  0:00:00
Downloading pinecone_plugin_assistant-1.8.0-py3-none-any.whl (259 kB)
Downloading packaging-24.2-py3-none-any.whl (65 kB)
Downloading pinecone_plugin_interface-0.0.7-py3-none-any.whl (6.2 kB)
Installing collected packages: pinecone-plugin-interface, packaging, pine

In [4]:
from pinecone import Pinecone, ServerlessSpec
from dotenv import load_dotenv
import os

load_dotenv()
PINECONE_API_KEY = os.getenv("PINECONE_API_KEY")

pc = Pinecone(api_key=PINECONE_API_KEY)

In [5]:
index_name = "reviewtest"

pc.create_index(
    name=index_name,
    dimension=384,       # 임베딩 모델의 출력 차원, All-MiniLM-L6-v2 모델의 출력 차원은 384
    metric='cosine',     # 유사도 측정 방법
    spec=ServerlessSpec(
        cloud='aws',
        region='us-east-1'
    )
)

{
    "name": "reviewtest",
    "metric": "cosine",
    "host": "reviewtest-51bii54.svc.aped-4627-b74a.pinecone.io",
    "spec": {
        "serverless": {
            "cloud": "aws",
            "region": "us-east-1"
        }
    },
    "status": {
        "ready": true,
        "state": "Ready"
    },
    "vector_type": "dense",
    "dimension": 384,
    "deletion_protection": "disabled",
    "tags": null
}

In [6]:
reviews = [
    {"id": "1", "text": "이 노트북 정말 좋아요! 속도도 빠르고 디자인도 마음에 들어요.", "sentiment": "positive"},
    {"id": "2", "text": "디스플레이가 너무 어두워요. 화면이 선명하지 않아서 불편합니다.", "sentiment": "negative"},
    {"id": "3", "text": "배터리가 오래가고, 가벼워서 휴대하기 좋아요.", "sentiment": "positive"},
    {"id": "4", "text": "노트북이 자주 끊겨서 작업하기 불편해요. 비추천합니다.", "sentiment": "negative"},
    {"id": "5", "text": "이 노트북은 성능이 뛰어나고 게임도 잘 돌아가요. 매우 만족합니다.", "sentiment": "positive"},
    {"id": "6", "text": "키보드가 불편하고, 손목이 아파요. 다음에는 다른 제품을 선택할 것 같아요.", "sentiment": "negative"},
    {"id": "7", "text": "가성비 최고! 가격에 비해 성능이 훌륭해요.", "sentiment": "positive"},
    {"id": "8", "text": "정말 실망이에요. 화면이 자주 깜빡거려서 사용하기 힘들어요.", "sentiment": "negative"},
    {"id": "9", "text": "디자인이 예쁘고, 성능도 괜찮아요. 오랜 시간 사용해도 발열이 적어요.", "sentiment": "positive"},
    {"id": "10", "text": "구매하고 나서 몇 달 안 가서 고장이 나버렸어요. 수리비가 비쌉니다.", "sentiment": "negative"},
    {"id": "11", "text": "어떤 작업이든 다 잘 처리되네요. 게임이나 영상 편집도 무리 없이 가능해요.", "sentiment": "positive"},
    {"id": "12", "text": "가격에 비해 성능이 너무 부족해요. 작업할 때 자주 느려져서 짜증이 나요.", "sentiment": "negative"},
    {"id": "13", "text": "이 노트북은 디자인도 멋지고, 속도도 빠릅니다. 정말 만족스러워요!", "sentiment": "positive"},
    {"id": "14", "text": "사용 중 너무 뜨겁고, 소음도 심해요. 절대 추천하지 않습니다.", "sentiment": "negative"},
    {"id": "15", "text": "경량이라 이동할 때 매우 편리하고, 배터리도 오래가요. 좋은 선택이었어요.", "sentiment": "positive"},
    {"id": "16", "text": "불량품이 왔어요. 화면에 이상이 생겨서 교환 요청했지만 번거로웠어요.", "sentiment": "negative"},
    {"id": "17", "text": "좋은 제품입니다! 화면이 선명하고, 멀티태스킹도 잘 되네요.", "sentiment": "positive"},
    {"id": "18", "text": "구매 후 사용 중 멈춤 현상이 자주 발생하고, 해결이 안 돼요.", "sentiment": "negative"},
    {"id": "19", "text": "너무 빠르고 효율적이에요! 업무용으로 딱 좋은 제품입니다.", "sentiment": "positive"},
    {"id": "20", "text": "키보드가 너무 불편하고, 자주 오작동이 일어나요. 실망했습니다.", "sentiment": "negative"}
]

In [None]:
from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-MiniLM-L6-v2')

In [8]:
idx  = pc.Index(index_name)

In [9]:
for review in reviews:
    review_embed = model.encode(review['text']).tolist()
    idx.upsert([
        (
            review['id'],
            review_embed,
            {
                'text': review['text'],
                'sentiment': review['sentiment']
            }
        )
    ])


### 리뷰 데이터 조회

In [10]:
query_text = "이 노트북의 성능은 괜찮은가요?"
query_embed = model.encode(query_text).tolist()

In [11]:
results = idx.query(
    vector=query_embed,
    top_k=3,
    include_metadata=True
)
results

{'matches': [{'id': '13',
              'metadata': {'sentiment': 'positive',
                           'text': '이 노트북은 디자인도 멋지고, 속도도 빠릅니다. 정말 만족스러워요!'},
              'score': 0.75298965,
              'values': []},
             {'id': '9',
              'metadata': {'sentiment': 'positive',
                           'text': '디자인이 예쁘고, 성능도 괜찮아요. 오랜 시간 사용해도 발열이 적어요.'},
              'score': 0.72577,
              'values': []},
             {'id': '14',
              'metadata': {'sentiment': 'negative',
                           'text': '사용 중 너무 뜨겁고, 소음도 심해요. 절대 추천하지 않습니다.'},
              'score': 0.713157713,
              'values': []}],
 'namespace': '',
 'usage': {'read_units': 1}}

In [14]:
for review in results['matches']:
    metadata = review['metadata']
    print(metadata['text'], f'(감성: {metadata["sentiment"]})')

이 노트북은 디자인도 멋지고, 속도도 빠릅니다. 정말 만족스러워요! (감성: positive)
디자인이 예쁘고, 성능도 괜찮아요. 오랜 시간 사용해도 발열이 적어요. (감성: positive)
사용 중 너무 뜨겁고, 소음도 심해요. 절대 추천하지 않습니다. (감성: negative)


### 리뷰 감성 분석

In [30]:
query_text = "배터리도 빨리 닳고 벽돌보다 무거워요. 완전 비추천"
query_embed = model.encode(query_text).tolist()

results = idx.query(
    vector=query_embed,
    top_k=5,
    include_metadata=True
)

for review in results['matches']:
    metadata = review['metadata']
    print(f"리뷰{review['id']} | 감성: {metadata['sentiment']} | 내용: {metadata['text']}")
print("="*100)


sentiment_counts = {
    'positive': 0,
    'negative': 0
}

for review in results['matches']:
    sentiment = review['metadata']['sentiment']
    sentiment_counts[sentiment] += 1

print(f"리뷰 분석 결과: {'positive' if sentiment_counts['positive'] > sentiment_counts['negative'] else 'negative'}")

리뷰2 | 감성: negative | 내용: 디스플레이가 너무 어두워요. 화면이 선명하지 않아서 불편합니다.
리뷰12 | 감성: negative | 내용: 가격에 비해 성능이 너무 부족해요. 작업할 때 자주 느려져서 짜증이 나요.
리뷰3 | 감성: positive | 내용: 배터리가 오래가고, 가벼워서 휴대하기 좋아요.
리뷰13 | 감성: positive | 내용: 이 노트북은 디자인도 멋지고, 속도도 빠릅니다. 정말 만족스러워요!
리뷰18 | 감성: negative | 내용: 구매 후 사용 중 멈춤 현상이 자주 발생하고, 해결이 안 돼요.
리뷰 분석 결과: negative
