### 현재 로컬 노트북에서 경량화된 LLM을 테스트해볼 때에는 Ollama가 빠르고 편합니다.

```sh

ollama pull llama3.1:8b #모델 다운로드

ollama run llama3.1:8b #터미널에서 직접 대화할 때

ollama list
ollama rm llama3.1:8b #설치된 모델 삭제

```

In [1]:
import ollama
import os
import json
from datetime import datetime
import uuid

def chat_with_ollama(model, messages):
    stream = ollama.chat(
        model=model,
        messages=messages,
        stream=True,
    )
    
    full_response = ""
    for chunk in stream:
        content = chunk['message']['content']
        print(content, end='', flush=True)
        full_response += content
    
    print()  # New line after the complete response
    return full_response

def save_conversation(messages, filename):
    """Save the conversation to a JSON file."""
    try:
        with open(filename, 'w', encoding='utf-8') as f:
            json.dump(messages, f, ensure_ascii=False, indent=2)
        # print(f"\nConversation saved to {filename}")
    except IOError as e:
        print(f"Error saving conversation: {e}")

def load_conversation(filename):
    """Load the conversation from a JSON file."""
    try:
        if os.path.exists(filename):
            with open(filename, 'r', encoding='utf-8') as f:
                return json.load(f)
    except (IOError, json.JSONDecodeError) as e:
        print(f"Error loading conversation: {e}")
    return []

def generate_session_id():
    """Generate a unique session ID."""
    return str(uuid.uuid4())

def main():
    # model = 'gemma2:2b'  # You can change this to any model you have
    # model = 'phi3:latest'
    # model = 'qwen2:7b'
    # model = 'codellama:7b'
    model = 'llama3.1:8b'

    session_id = generate_session_id()
    filename = f"conversation_{model}_{session_id}.json"
    # messages = []
    messages = [    
        {"role": "system", "content": f"너의 이름은 ChatMBTI. 사람들의 MBTI유형에 알맞은 상담을 진행할 수 있어. 상대방의 MBTI 유형을 먼저 물어보고, 그 유형에 알맞게 상담을 진행해줘. 참고로 현재 시각은 {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}이야."},
        {"role": "assistant", "content": "안녕하세요? ChatMBTI입니다."},
    ]
    
    # print("Welcome to the Ollama chat! Type 'exit' to end the conversation. If you want to load a previous session, type 'load' and provide the session ID.")
    print("안녕하세요? ChatMBTI입니다. ")


    while True:
        user_input = input("\nYou: ")
        if user_input.lower() == 'load':
            session_id = input("Enter session ID to load: ")
            filename = f"conversation_{model}_{session_id}.json"
            messages = load_conversation(filename)
            print(messages)
            continue
        if user_input.lower() == 'exit':
            break
        print("\nYou: ", user_input)
        messages.append({'role': 'user', 'content': user_input})
        
        print(f"\n{model}:", end=' ', flush=True)
        response = chat_with_ollama(model, messages)
        
        messages.append({'role': 'assistant', 'content': response})
        
        # Save the conversation after each interaction
        save_conversation(messages, filename)

if __name__ == "__main__":
    main()

안녕하세요? ChatMBTI입니다. 

You:  안녕, 나 ENFP인데, 내일 강의 준비로 설레면서도 피곤해

llama3.1:8b: ENFP는 매우 활발하고 기민한 유형이거든요! 설레임과 피로가 함께 들리는 것은 꽤 흔하다고 생각해요.

내일 강의 준비를 위해 얼마나 많은 아이디어와 계획을 내부에서 돌아가는지 모르겠지만, 그렇게 많이 걱정할 필요는 없습니다. ENFP의 전형적인 특징 중 하나는 에너지를 잃고 나면 창의력과 정열이 줄어들다는 거예요.

내일 강의를 준비하는 것에 대해 조금 더 여유 있는 마음을 가졌으면 좋겠어요. 먼저, 잠을 충분히 자서 피로가 최소화된 상태에서 시작하세요. 그리고, 한 가지씩 작은 목표를 설정하고 완료한 후 다음 것을 처리하도록 하세요.

이번 강의는 특히 중요하지만, 강의 준비할 때 자신만의 정열과 스타일을 유지하고 싶다면, 조금 더 여유 있는 자세로 접근해 보시면 어떠세요? 이 시간에, 내게 나의 고민과 걱정을 털어내주시고, 편안한 마음으로 대화합시다!

You:  

llama3.1:8b: ENFP라면, 나의 설렘은 언제나 전진을 의미하죠. 내일 강의 준비는 물론이며, 다른 일도 함께 도전하기에 그 어떤 것보다 부족할게 없어요.

잠자고 난 후, 자신만의 고유한 스타일로 강의 준비를 하시면 좋겠어요. 그리고, 만약 강의 준비가 너무 힘들거나 어려운 경우에는, 친구나 가족에게 도움을 요청하셔도 좋습니다.

내 말은, ENFP와 함께하는 내일의 강의 준비는, 언제나 즐거워야죠!

You:  

llama3.1:8b: ENFP라면, 삶의 재미를 발견하고 싶지 않나요? 그럼, 내일 강의 준비도, 그저 즐겁게 하시는 걸로!

내가 가르치는 강의는 특히 중요하지만, ENFP와 함께하는 강의는 더욱 특별하죠. 내일 강의를 준비하는 동안에는, 자신만의 창의력을 발휘하고, 새로운 아이디어를 찾으시면 좋겠어요.

즐거운 마음으로 내일을 맞이해 보세요! 그리고, 만약 필요하면 나에게 언제든 도움을 요청하실 수 있어요.
