## 임베딩 생성 방법

이 노트북에서는 자체 텍스트 데이터와 Amazon SageMaker의 엔드포인트로 호스팅되는 Hugging Face의 오픈 소스 모델에 대한 임베딩을 생성하는 방법을 보여줍니다.

## 0. 설정

Amazon SageMaker에서 `easyllm`을 사용하려면 먼저 모델을 SageMaker 엔드포인트에 배포해야 합니다. 아래 블로그 게시물 중 하나를 따라 이 작업을 수행할 수 있습니다.

* [Hugging Face의 Transformers 및 Amazon SageMaker를 사용하여 문서 임베딩 만들기](https://www.philschmid.de/custom-inference-huggingface-sagemaker)

엔드포인트 배포가 완료되면 엔드포인트 이름을 복사합니다. 엔드포인트 이름이 `model` 매개변수가 됩니다. AWS 관리 콘솔의 Amazon SageMaker에서 "추론" -> "엔드포인트" -> "이름"으로 이동하거나 sagemaker SDK를 사용하여 모델을 배포한 경우 `predictor.endpoint_name` 속성에서 엔드포인트 이름을 가져올 수 있습니다.


### 1. easyllm 라이브러리 가져오기

In [None]:
# 필요한 경우 OpenAI Python 라이브러리의 최신 버전으로 설치 및/또는 업그레이드합니다.
%pip install --upgrade easyllm 

In [None]:
# EasyLLM API를 호출하기 위한 EasyLLM Python 라이브러리를 가져옵니다.
import easyllm

### 2. 채팅 API 호출 예제

임베딩 API 호출에는 두 가지 필수 입력이 있습니다.
- `model`: 사용하려는 모델의 이름(예: `sentence-transformers/all-MiniLM-L6-v2`) 또는 API만 호출하려면 비워 둡니다.
- `input`: 임베딩하려는 문자열 또는 문자열 목록

채팅 형식이 실제로 어떻게 작동하는지 확인하기 위해 예제 API 호출을 살펴보겠습니다.

In [3]:
import os 
# 프롬프트 빌더용 환경 변수 설정
os.environ["HUGGINGFACE_PROMPT"] = "llama2" # vicuna, wizardlm, stablebeluga, open_assistant
os.environ["AWS_REGION"] = "us-east-1"  # 해당 지역으로 변경
# os.environ["AWS_ACCESS_KEY_ID"] = "XXX" # boto3 세션을 사용하지 않는 경우 필요
# os.environ["AWS_SECRET_ACCESS_KEY"] = "XXX" # boto3 세션을 사용하지 않는 경우 필요

from easyllm.clients import sagemaker

embedding = sagemaker.Embedding.create(
    model="SageMakerModelEmbeddingEndpoint24E49D09-64prhjuiWUtE",
    input="저 차 멋지네요.",
)

len(embedding["data"][0]["embedding"])

768