In [1]:
%pip install llama-index-embeddings-cohere

Collecting llama-index-embeddings-cohere
  Using cached llama_index_embeddings_cohere-0.4.0-py3-none-any.whl (4.7 kB)
Collecting cohere<6.0.0,>=5.2.5
  Downloading cohere-5.14.2-py3-none-any.whl (259 kB)
     -------------------------------------- 259.2/259.2 kB 5.4 MB/s eta 0:00:00
Collecting types-requests<3.0.0,>=2.0.0
  Downloading types_requests-2.32.0.20250328-py3-none-any.whl (20 kB)
Installing collected packages: types-requests, cohere, llama-index-embeddings-cohere
Successfully installed cohere-5.14.2 llama-index-embeddings-cohere-0.4.0 types-requests-2.32.0.20250328
Note: you may need to restart the kernel to use updated packages.




In [3]:
from dotenv import load_dotenv
import os

# dotenv를 사용하여 환경 변수 로드
load_dotenv()

# 환경 변수에서 API 키 가져오기
api_key = os.getenv("COHERE_API_KEY")

In [4]:
from llama_index.embeddings.cohere import CohereEmbedding
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

# Cohere 다국어 임베딩 모델 설정
embed_model = CohereEmbedding(
    model_name="embed-multilingual-v3.0",
    api_key=api_key)

In [7]:
# 텍스트를 벡터로 변환
embeddings = embed_model.get_text_embedding("Cohere Embeddings.")

# 결과 출력
print(f"Dimension of embeddings: {len(embeddings)}")
print(embeddings[:5])

Dimension of embeddings: 1024
[0.0015039444, 0.040618896, -0.045837402, 0.022201538, 0.0075302124]


In [11]:
# 문서 로드
documents = SimpleDirectoryReader(input_files=["../data/txt_example.txt"]).load_data()

# 벡터 인덱스 생성 (임베딩 모델 적용)
index = VectorStoreIndex.from_documents(documents, embed_model=embed_model)

# 쿼리 엔진 생성
query_engine = index.as_query_engine()

# 질의 수행
response = query_engine.query("이 문서에서 가장 중요한 내용은 무엇인가요? 한국어로 작성해주세요.")
print(response)

이 문서에서 가장 중요한 내용은 '인공지능의 정의'와 '인공지능의 응용 분야'입니다.
