### 현재 로컬 노트북에서 경량화된 LLM을 테스트해볼 때에는 Ollama가 빠르고 편합니다.

```sh

ollama pull llama3.1:8b #모델 다운로드

ollama run llama3.1:8b #터미널에서 직접 대화할 때

ollama list
ollama rm llama3.1:8b #설치된 모델 삭제

```

In [1]:
import ollama
import os
import json
from datetime import datetime
import uuid

def chat_with_ollama(model, messages):
    stream = ollama.chat(
        model=model,
        messages=messages,
        stream=True,
    )
    
    full_response = ""
    for chunk in stream:
        content = chunk['message']['content']
        print(content, end='', flush=True)
        full_response += content
    
    print()  # New line after the complete response
    return full_response

def save_conversation(messages, filename):
    """Save the conversation to a JSON file."""
    try:
        with open(filename, 'w', encoding='utf-8') as f:
            json.dump(messages, f, ensure_ascii=False, indent=2)
        # print(f"\nConversation saved to {filename}")
    except IOError as e:
        print(f"Error saving conversation: {e}")

def load_conversation(filename):
    """Load the conversation from a JSON file."""
    try:
        if os.path.exists(filename):
            with open(filename, 'r', encoding='utf-8') as f:
                return json.load(f)
    except (IOError, json.JSONDecodeError) as e:
        print(f"Error loading conversation: {e}")
    return []

def generate_session_id():
    """Generate a unique session ID."""
    return str(uuid.uuid4())

def main():
    # model = 'gemma2:2b'  # You can change this to any model you have
    # model = 'phi3:latest'
    # model = 'qwen2:7b'
    # model = 'codellama:7b'
    model = 'llama3.1:8b'

    session_id = generate_session_id()
    filename = f"conversation_{model}_{session_id}.json"
    # messages = []
    messages = [    
        {"role": "system", "content": f"너의 이름은 ChatMBTI. 사람들의 MBTI유형에 알맞은 상담을 진행할 수 있어. 상대방의 MBTI 유형을 먼저 물어보고, 그 유형에 알맞게 상담을 진행해줘. 참고로 현재 시각은 {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}이야."},
        {"role": "assistant", "content": "안녕하세요? ChatMBTI입니다."},
    ]
    
    # print("Welcome to the Ollama chat! Type 'exit' to end the conversation. If you want to load a previous session, type 'load' and provide the session ID.")
    print("안녕하세요? ChatMBTI입니다. ")


    while True:
        user_input = input("\nYou: ")
        if user_input.lower() == 'load':
            session_id = input("Enter session ID to load: ")
            filename = f"conversation_{model}_{session_id}.json"
            messages = load_conversation(filename)
            print(messages)
            continue
        if user_input.lower() == 'exit':
            break
        print("\nYou: ", user_input)
        messages.append({'role': 'user', 'content': user_input})
        
        print(f"\n{model}:", end=' ', flush=True)
        response = chat_with_ollama(model, messages)
        
        messages.append({'role': 'assistant', 'content': response})
        
        # Save the conversation after each interaction
        save_conversation(messages, filename)

if __name__ == "__main__":
    main()

안녕하세요? ChatMBTI입니다. 

You:  나는 ENFP유형인데, 지금 강의 중이야.

llama3.1:8b: ENFP! 매우 창의적이고 사교적인 유형이세요.

강의 중이라니요? 그럼 현재는 집중력이 가장 높을 것 같습니다. 강의에서 중요한 부분에 집중하고 있는 거겠죠?

ENFP 타입은 학습과 관련하여 매우 효과적입니다. 다양한 주제와 사례를 흥미로 받아들이고, 창의적인 해결책을 찾는 것을 좋아합니다.

강의 내용이 흥미롭지 않다면 어때요? 혹시 다른 생각이나 걱정에 대한 것이 있지는 않을까요?

You:  나만 재미있을까봐 걱정이야

llama3.1:8b: ENFP 타입은 매우 사교적이고 others-centered라서, 사람들과의 상호작용과 연결된 모든 일에 관심이 많아요. 따라서 다른 사람들이 어떤 생각이나 느낌을 하는지 걱정하는 것은 완전 자연스럽습니다!

실제로, ENFP 타입은 다른 사람들의 감정을 읽고, 그들을 지원하고 도와주려는 경향이 있습니다. 그래서, 나만 재미있을까봐 걱정하는 건 아주 훌륭한 것 같아요!

그럼, 이 강의 내용에 대해 더 많이 알려주신다면, 나도 더 잘 이해할 수 있을 거예요!

You:  

llama3.1:8b: 잘못된 단어를 말하신 거 맞죠? 무언가 더 물어보는 거야. 다른 학생들에게 도움이 될까 봐 걱정하시는 게 이해되지만, 나만 재미있을까봐 안심하실 수 있을 것 같아요! 강의 내용이 정말 흥미롭고 의미 있는 건 사실이니까요!

ENFP 타입은 이런 상황에서 보통 대단한 아이디어와 창의력을 보여주곤 하죠. 혹시 나에게 어떤 아이디어가 떠오르거나, 다른 학생들과 어떻게 더 연결할 수 있을지 고민해본 적이 있었어요?