# Sentiment Analysis with LLM

## 1. 개발 환경 설정
### 1.1 필요한 라이브러리 설치
!pip install transformers torch

## 2. 데이터 준비
### 2.1 데이터 다운로드 또는 생성
# data/ 디렉토리에 positive.txt와 negative.txt 파일 생성

## 3. 데이터 전처리
### 3.1 데이터 로딩 및 토큰화

In [ ]:
from src.data_preprocessing import preprocess_data
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained('distilbert-base-uncased')
input_ids, attention_masks, labels = preprocess_data('data/positive.txt', 'data/negative.txt', tokenizer)

## 4. 모델 선택 및 로딩

In [ ]:
from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained('distilbert-base-uncased', num_labels=2)

## 5. 모델 훈련

In [ ]:
from src.model_training import train_model

trainer = train_model(model, input_ids, attention_masks, labels)

## 6. 모델 평가

In [ ]:
from src.model_evaluation import evaluate_model

evaluate_model(trainer)

## 7. 모델 저장

In [ ]:
model.save_pretrained('models/fine_tuned_model')

## 8. 모델 사용

In [ ]:
def predict_sentiment(text, model, tokenizer):
    inputs = tokenizer(text, return_tensors='pt')
    outputs = model(**inputs)
    predicted_class = torch.argmax(outputs.logits).item()
    return 'Positive' if predicted_class == 1 else 'Negative'

text = "I really enjoyed this movie!"
sentiment = predict_sentiment(text, model, tokenizer)
print(f"The sentiment of the text is: {sentiment}")