In [1]:
1+1

2

In [2]:
# 필수 라이브러리 설치 (터미널에서 실행)
# pip install -U weaviate-client python-dotenv

import os
import weaviate
import weaviate.classes.config as wc
from weaviate.classes.init import Auth
from weaviate.classes.query import Filter
from dotenv import load_dotenv

# 환경변수 로드 (선택사항)
load_dotenv()



True

In [5]:
# OpenAI API Key 설정 (실제 키로 교체하세요)
# os.environ["OPENAI_APIKEY"] = "sk-your-actual-openai-api-key"

# Best practice: store your credentials in environment variables
weaviate_url = os.environ["WEAVIATE_URL"]
weaviate_api_key = os.environ["WEAVIATE_API_KEY"]

# Weaviate Cloud 연결 (OpenAI API Key 헤더 포함)
client = weaviate.connect_to_weaviate_cloud(
    cluster_url=weaviate_url,
    auth_credentials=Auth.api_key(weaviate_api_key),
    headers={"X-OpenAI-Api-Key": os.environ["OPENAI_APIKEY"]},
)

# 연결 상태 확인
print("Weaviate 연결 상태:", client.is_ready())

Weaviate 연결 상태: True


In [6]:
# 기존 컬렉션 삭제 (있다면)
collection_name = "ArticleCollection"
if collection_name in client.collections.list_all():
    client.collections.delete(collection_name)
    print(f"기존 {collection_name} 삭제됨")

# 새 컬렉션 생성 (최신 방식)
collection = client.collections.create(
    name=collection_name,
    vector_config=wc.Configure.Vectors.text2vec_openai(model="text-embedding-3-small"),
    generative_config=wc.Configure.Generative.openai(model="gpt-4o-mini"),
    properties=[
        wc.Property(name="title", data_type=wc.DataType.TEXT),
        wc.Property(name="content", data_type=wc.DataType.TEXT),
        wc.Property(name="category", data_type=wc.DataType.TEXT),
        wc.Property(name="author", data_type=wc.DataType.TEXT),
    ],
)

print(f"컬렉션 '{collection.name}' 생성 완료!")
print("전체 컬렉션 목록:", list(client.collections.list_all().keys()))

컬렉션 'ArticleCollection' 생성 완료!
전체 컬렉션 목록: ['ArticleCollection', 'MyFirstCollection']


In [7]:
# 컬렉션 객체 가져오기
my_collection = client.collections.get(collection_name)

# 단일 객체 추가
print("=== 단일 데이터 추가 ===")
uuid1 = my_collection.data.insert(
    {
        "title": "Python 기초 가이드",
        "content": "Python 프로그래밍의 기본 개념과 문법을 소개합니다.",
        "category": "programming",
        "author": "김개발",
    }
)
print(f"단일 데이터 추가 완료, UUID: {uuid1}")

# 여러 객체 일괄 추가
print("\n=== 여러 데이터 일괄 추가 ===")
data_objects = [
    {
        "title": "AI와 머신러닝 소개",
        "content": "인공지능과 기계학습의 기본 원리를 설명합니다.",
        "category": "ai",
        "author": "박AI",
    },
    {
        "title": "웹 개발 완전 정복",
        "content": "HTML, CSS, JavaScript를 활용한 웹 개발 방법입니다.",
        "category": "web",
        "author": "이웹",
    },
    {
        "title": "데이터베이스 설계 패턴",
        "content": "효율적인 데이터베이스 설계와 최적화 기법입니다.",
        "category": "database",
        "author": "최DB",
    },
    {
        "title": "Python 고급 기법",
        "content": "Python의 고급 프로그래밍 패턴과 모범 사례입니다.",
        "category": "programming",
        "author": "김고급",
    },
]

uuids = my_collection.data.insert_many(data_objects)
print(f"{len(data_objects)}개 데이터 일괄 추가 완료!")

=== 단일 데이터 추가 ===
단일 데이터 추가 완료, UUID: 02fbc955-a2f9-4919-bf14-9d12348787ac

=== 여러 데이터 일괄 추가 ===
4개 데이터 일괄 추가 완료!


In [8]:
print("\n=== 전체 데이터 조회 ===")
response = my_collection.query.fetch_objects(limit=10)

for i, obj in enumerate(response.objects, 1):
    print(f"{i}. 제목: {obj.properties['title']}")
    print(f"   저자: {obj.properties['author']}")
    print(f"   카테고리: {obj.properties['category']}")
    print(f"   UUID: {obj.uuid}")
    print("---")


=== 전체 데이터 조회 ===
1. 제목: Python 기초 가이드
   저자: 김개발
   카테고리: programming
   UUID: 02fbc955-a2f9-4919-bf14-9d12348787ac
---
2. 제목: 웹 개발 완전 정복
   저자: 이웹
   카테고리: web
   UUID: 36479be9-ca2e-42c2-9721-37a35d70cb70
---
3. 제목: Python 고급 기법
   저자: 김고급
   카테고리: programming
   UUID: 65bb69f7-8f20-48ef-90fe-de0ac663127f
---
4. 제목: 데이터베이스 설계 패턴
   저자: 최DB
   카테고리: database
   UUID: 9b772d51-8ad2-4794-bd37-c6d80bdbb441
---
5. 제목: AI와 머신러닝 소개
   저자: 박AI
   카테고리: ai
   UUID: d1fcc417-ad7e-4cef-869f-06c709413642
---


In [9]:
print("\n=== 'programming' 카테고리 필터링 ===")
response = my_collection.query.fetch_objects(
    filters=Filter.by_property("category").equal(
        "programming"
    ),  # filters 매개변수 사용
    limit=5,
)

for obj in response.objects:
    print(f"제목: {obj.properties['title']}")
    print(f"내용: {obj.properties['content']}")
    print(f"저자: {obj.properties['author']}")
    print("---")

print("\n=== 여러 조건 결합 (OR) ===")
response = my_collection.query.fetch_objects(
    filters=Filter.any_of(
        [
            Filter.by_property("category").equal("programming"),
            Filter.by_property("category").equal("ai"),
        ]
    ),
    limit=5,
)

for obj in response.objects:
    print(f"제목: {obj.properties['title']} (카테고리: {obj.properties['category']})")


=== 'programming' 카테고리 필터링 ===
제목: Python 기초 가이드
내용: Python 프로그래밍의 기본 개념과 문법을 소개합니다.
저자: 김개발
---
제목: Python 고급 기법
내용: Python의 고급 프로그래밍 패턴과 모범 사례입니다.
저자: 김고급
---

=== 여러 조건 결합 (OR) ===
제목: Python 기초 가이드 (카테고리: programming)
제목: Python 고급 기법 (카테고리: programming)
제목: AI와 머신러닝 소개 (카테고리: ai)


In [13]:
# 벡터 유사도 검색 시 metadata 반환 요청
response = my_collection.query.near_text(
    query="프로그래밍 개발 기술",
    limit=3,
    return_metadata=["score"],  # score 반환 명시적 요청
)

for obj in response.objects:
    print(f"제목: {obj.properties['title']}")
    print(f"내용: {obj.properties['content']}")
    print(f"유사도 점수: {obj.metadata.score}")  # 이제 정상 작동
    print("---")

제목: Python 기초 가이드
내용: Python 프로그래밍의 기본 개념과 문법을 소개합니다.
유사도 점수: 0.0
---
제목: 웹 개발 완전 정복
내용: HTML, CSS, JavaScript를 활용한 웹 개발 방법입니다.
유사도 점수: 0.0
---
제목: Python 고급 기법
내용: Python의 고급 프로그래밍 패턴과 모범 사례입니다.
유사도 점수: 0.0
---


In [11]:
print("\n=== 하이브리드 검색 (키워드 + 벡터) ===")
response = my_collection.query.hybrid(query="Python", limit=3)

for obj in response.objects:
    print(f"제목: {obj.properties['title']}")
    if hasattr(obj.metadata, "score"):
        print(f"검색 점수: {obj.metadata.score}")
    print("---")


=== 하이브리드 검색 (키워드 + 벡터) ===
제목: Python 기초 가이드
검색 점수: None
---
제목: Python 고급 기법
검색 점수: None
---
제목: AI와 머신러닝 소개
검색 점수: None
---


In [12]:
print("\n=== 생성형 검색 (RAG) ===")
response = my_collection.generate.near_text(
    query="Python 프로그래밍에 대해 설명해줘",
    limit=2,
    single_prompt="다음 내용을 바탕으로 Python에 대해 간단히 설명해주세요: {content}",
)

print("🤖 AI 생성 답변:")
print(response.generated)
print("\n📚 참조된 문서들:")
for obj in response.objects:
    print(f"- {obj.properties['title']} (저자: {obj.properties['author']})")


=== 생성형 검색 (RAG) ===
🤖 AI 생성 답변:


📚 참조된 문서들:
- Python 기초 가이드 (저자: 김개발)
- Python 고급 기법 (저자: 김고급)
