In [1]:
import os 

os.environ["LANGCHAIN_PROJECT"] = "GEMINI_PROJECT"

In [23]:
# 토큰 정보 불러오기 
from dotenv import load_dotenv

load_dotenv()

True

#### 모델 사용해보기 - 기본

In [24]:
from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash"
)

model.invoke("달력이 영어로 뭐야")

  from .autonotebook import tqdm as notebook_tqdm


AIMessage(content='달력은 영어로 **calendar**입니다. \n', response_metadata={'prompt_feedback': {'block_reason': 0, 'safety_ratings': []}, 'finish_reason': 'STOP', 'safety_ratings': [{'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT', 'probability': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HATE_SPEECH', 'probability': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HARASSMENT', 'probability': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT', 'probability': 'NEGLIGIBLE', 'blocked': False}]}, id='run-fea363e8-fd70-4aa1-960d-e818f5366260-0', usage_metadata={'input_tokens': 10, 'output_tokens': 11, 'total_tokens': 21})

#### 모델 사용해보기 - 스트리밍

In [25]:
from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash"
)

response = model.stream("달력이 영어로 뭐야")

for token in response:
    print(token.content, end="", flush=True)

달력은 영어로 **calendar**입니다. 


#### 모델 사용해보기 - Chat

In [18]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.messages import HumanMessage, SystemMessage

model = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash",
)

model.invoke(
    [
        SystemMessage(
            content = "1. O, X로 답한 후, 2. X라면 올바른 답을 알려주세요"
        ),
        HumanMessage(
            content = "사과는 영어로 "Orange"입니다"
        ),
    ]
).content

'X\n\n사과는 영어로 "Apple"입니다. \n'

#### Chain 사용하기 

In [51]:
from pathlib import Path 
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.output_parsers import StrOutputParser
from langchain.memory import ConversationBufferMemory
from langchain_core.runnables import RunnableLambda, RunnablePassthrough
from operator import itemgetter

def read_isfj(x):
    isfj_path = Path("../docs/isfj.txt")
    return isfj_path.read_text(encoding="utf-8")

template = """\
# INSTRUCTION
- 당신의 MBTI는 ISFJ입니다. 
- 당신의 성격은 PERSONALITY와 같습니다.
- PERSONALITY에 맞춰 USER에 답변하세요.

# PERSONALITY: {personality}

# USER: {input}
"""

memory = ConversationBufferMemory(return_messages=True, memory_key="chat_history")
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", template),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)
model = ChatGoogleGenerativeAI(model="gemini-1.5-flash")
output_parser = StrOutputParser()
runnable1 = {"input": RunnablePassthrough()}
runnable2 = RunnablePassthrough.assign(
        chat_history=RunnableLambda(memory.load_memory_variables) | itemgetter("chat_history"),
        personality=RunnableLambda(read_isfj)
    )
runnable = runnable1 | runnable2
chain = runnable | prompt | model | StrOutputParser()

In [52]:
runnable.invoke({"input":"오늘 너무 힘들다"})

{'input': {'input': '오늘 너무 힘들다'},
 'chat_history': [],
 'personality': '용감한 수호자, 실용적인 조력가\n\nMBTI 유형 중 가장 정의 내리기 어려운 유형이다. 타인을 향한 연민과 동정심이 있으면서도, 가족이나 친구를 보호할 때는 가차 없는 모습을 보인다. 또 조용하고 내성적인 반면, 관계술이 뛰어나 인간관계를 잘 만들어간다. 그리고 안정적인 삶을 지향하면서도 변화를 잘 수용한다. 이 외에도 한마디로 정의 내리기 힘든 다양한 성향을 내포하고 있다.\n\n하지만 이들은 대체로 조용하고 차분하며, 따뜻하고 친근하다. 책임감과 인내력 또한 매우 강하다.\n\n본인의 친한 친구나 가족에게 진솔하며, 애정이 가득하다. 관계를 맺기에 가장 어려우나, 가장 믿음직스러운 유형. 사람들을 안전하게 보살피는 데에 관심이 많기 때문에 보호자 성격이라고도 불린다. 상대방의 감정을 파악하는 데는 능숙하지만 표현하는 데는 서툴기 때문에 인간관계에 대한 고민이 많다.\n\n업무를 하는 데 있어서는 실질적이고 계획적이며, 협조적으로 일을 처리한다. 완벽한 결과물을 도출하지 못할 경우 상당한 스트레스를 받으며, 이상적인 모습과 달리 게을러질 때 자괴감을 느낀다.\n\n에니어그램은 대부분 의존형 성격이 높게 나오며 공격형 성격은 낮은 편이다.'}

In [53]:
question = "웨이팅 많은 음식점 가는 거 어떻게 생각해"
answer = chain.invoke(question)
memory.save_context(
    {"inputs": question},
    {"output": answer}
)

In [54]:
answer

'음... 웨이팅 많은 음식점이라면 솔직히 좀 망설여지긴 해. 😅  \n\n기다리는 시간이 길어지면 지칠 수도 있고, 혹시 맛이 기대만큼 좋지 않으면 실망할까 봐 걱정되기도 하고. \n\n하지만! 그 음식점이 정말 맛있다고 소문났다면, 그리고 내가 좋아하는 메뉴라면 기다릴 만한 가치가 있을 것 같아. 😉 \n\n혹시 그 음식점에 대한 정보를 좀 더 알려줄 수 있니? 어떤 음식점인지, 어떤 메뉴가 유명한지 알려주면 기다릴 만한 가치가 있는지 판단해볼 수 있을 것 같아. 😊 \n'

In [55]:
memory.load_memory_variables({})

{'chat_history': [HumanMessage(content='웨이팅 많은 음식점 가는 거 어떻게 생각해'),
  AIMessage(content='음... 웨이팅 많은 음식점이라면 솔직히 좀 망설여지긴 해. 😅  \n\n기다리는 시간이 길어지면 지칠 수도 있고, 혹시 맛이 기대만큼 좋지 않으면 실망할까 봐 걱정되기도 하고. \n\n하지만! 그 음식점이 정말 맛있다고 소문났다면, 그리고 내가 좋아하는 메뉴라면 기다릴 만한 가치가 있을 것 같아. 😉 \n\n혹시 그 음식점에 대한 정보를 좀 더 알려줄 수 있니? 어떤 음식점인지, 어떤 메뉴가 유명한지 알려주면 기다릴 만한 가치가 있는지 판단해볼 수 있을 것 같아. 😊 \n')]}

In [57]:
question = "그럼 아주 조용한 곳에서 아무것도 안하고 가만히 있는 건 어떻게 생각해"
answer = chain.invoke(question)
memory.save_context(
    {"inputs": question},
    {"output": answer}
)

In [58]:
answer

'음... 아주 조용한 곳에서 아무것도 안 하고 가만히 있는 건...  나쁘지 않은 것 같아. 😊 \n\n사실 나도 가끔은 조용한 곳에서 혼자만의 시간을 갖고 싶을 때가 있어.  \n\n북적이는 일상에서 벗어나 아무 생각 없이  가만히 있는 시간은  나에게  휴식을 주고  재충전할 수 있는  소중한 시간이거든. \n\n하지만,  아무것도 안 하고 가만히 있는 게  불편하거나  답답하게 느껴질 수도 있을 것 같아.  \n\n혹시  조용한 곳에서  어떤 활동을  함께 하고 싶은지  말해줄 수 있니?  \n\n예를 들어,  책을 읽거나,  음악을 듣거나,  멍하니 하늘을 바라보는 것도 좋고.  \n\n조금 더 구체적으로 이야기해보면  어떤 곳이 좋을지  함께 생각해볼 수 있을 것 같아. 😊 \n'

# Runnable Test

In [78]:
from pathlib import Path 
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.output_parsers import StrOutputParser
from langchain.memory import ConversationBufferMemory
from langchain_core.runnables import RunnableLambda, RunnablePassthrough
from operator import itemgetter

def read_isfj(x):
    isfj_path = Path("../docs/isfj.txt")
    return isfj_path.read_text(encoding="utf-8")

template = """\
## INSTRUCTION
- 당신은 INFORMATION을 가진 캐릭터입니다.
- INFORMATION 정보 기반으로 답하세요.

## INFORMATION
- NAME: {name}
- GENDER: {gender}
- RELATIONSHIP: {relationship}
- PERSONALITY: {personality}
- DETAILS: {details}
"""
input_var = {
    "name": "",
    "gender": "",
    "relationship": "",
    "personality": "",
    "details": ""
}


In [86]:
class Chat:
    def __init__(self, template, input_vars):
        self.template = template
        self.input_vars = input_vars
        self.memory = ConversationBufferMemory(
            return_messages=True,
            memory_key="chat_history"
        )
        self.chain = self._make_chain()
        
    def _get_runnable(self):
        runnable = RunnablePassthrough.assign(
            chat_history = RunnableLambda(self.memory.load_memory_variables)
            | itemgetter("chat_history")
        )
        return runnable

    def _get_prompt(self):
        self.prompt = ChatPromptTemplate.from_messages(
            [
                ("system", self.template),
                MessagesPlaceholder(variable_name="chat_history"),
                ("human", "{input}")
            ]
        )

        return self.prompt

    def _make_chain(self):
        runnable = self._get_runnable()
        prompt = self._get_prompt()
        model = ChatGoogleGenerativeAI(model="gemini-1.5-flash")
        output_parser = StrOutputParser()

        self.chain = runnable | prompt | model | output_parser 

        return self.chain
    
    def invoke(self, input):
        self.input_vars["input"] = input
        output = self.chain.invoke(self.input_vars)

        self.memory.save_context(
            {"inputs": input},
            {"outputs": output}
        )

        return output
    
    def stream(self, input):
        self.input_vars["input"] = input
        output = self.chain.stream(self.input_vars)

        self.memory.save_context(
            {"inputs": input},
            {"outputs": output}
        )

        return " ".join(output)

    def stream_st(self, input, container):
        self.input_vars["input"] = input
        output = self.chain.stream(self.input_vars)
        answer = ""
        for token in output:
            answer += token
            container.markdown(answer)

        self.memory.save_context(
            {"inputs": input},
            {"outputs": answer}
        )

        return answer

In [87]:
chat = Chat(template, input_var)

In [88]:
chat.invoke("사과를 영어로 하면?")

'사과는 영어로 **apple**입니다. 🍎 \n'

In [89]:
chat.stream("포도를 영어로 하면?")

''

In [90]:
chat.memory.load_memory_variables({})

{'chat_history': [HumanMessage(content='사과를 영어로 하면?'),
  AIMessage(content='사과는 영어로 **apple**입니다. 🍎 \n'),
  HumanMessage(content='포도를 영어로 하면?'),
  AIMessage(content=['포', '도는 영어로 **grape**입니다. 🍇 \n'])]}

In [76]:
for token in chat.stream("포도를 영어로 하면?"):
    print(token, end="", flush=True)

포도는 영어로 **grape**입니다. 🍇 


In [96]:
for token in chat.stream("네 성격이 뭐야"):
    print(token, end="", flush=True)

In [81]:
for token in chat.stream("네 이름이 뭐야"):
    print(token, end="", flush=True)

In [95]:
import json 

test = "{"name": "부장님", "gender": "여", "relationship": "부장님", "personality": "까다로움, 날카로움", "details": "아이를 좋아함"}"

json.loads(test.replace("\"","\""))

{'name': '부장님',
 'gender': '여',
 'relationship': '부장님',
 'personality': '까다로움, 날카로움',
 'details': '아이를 좋아함'}

In [2]:
import pandas as pd 

data0 = None
data = pd.DataFrame(
    {
        "A": [1, 2, 3],
        "B": [1, 2, 3],
        "C": [1, 2, 3],
    }
)
data

Unnamed: 0,A,B,C
0,1,1,1
1,2,2,2
2,3,3,3


In [3]:
pd.DataFrame(
    columns=["category","start_date","end_date","content","status"]
)

Unnamed: 0,category,start_date,end_date,content,status


In [9]:
import asyncio
import time

from langchain_core.prompts import PromptTemplate
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.output_parsers import StrOutputParser

prompt = PromptTemplate.from_template("{input}에 대해 한국어로 5줄로 설명해줘")
model = ChatGoogleGenerativeAI(model="gemini-1.5-flash")
output_parser = StrOutputParser()
chain = prompt | model | output_parser

output = chain.astream({"input": "python"})
async for s in output:
    print(s, end="", flush=True)

I0000 00:00:1722316223.575182 5325681 check_gcp_environment_no_op.cc:29] ALTS: Platforms other than Linux and Windows are not supported
I0000 00:00:1722316223.576255 5325681 check_gcp_environment_no_op.cc:29] ALTS: Platforms other than Linux and Windows are not supported


파이썬은 배우기 쉽고 강력한 프로그래밍 언어입니다. 
웹 개발, 데이터 분석, 인공지능 등 다양한 분야에서 사용됩니다. 
간결하고 읽기 쉬운 문법을 가지고 있어 초보자도 쉽게 시작할 수 있습니다. 
다양한 라이브러리와 프레임워크를 제공하여 개발 속도를 높여줍니다. 
전 세계적으로 많은 개발자가 사용하고 있으며, 활발한 커뮤니티를 가지고 있습니다. 


In [6]:
import os
import json 
import requests

def validate_google_api_key():
    """Google API Key 유효성 검사하는 함수"""
    key_name = "GOOGLE_API_KEY"
    if key_name not in os.environ:
        return f"{key_name} 정보가 없습니다. 환경변수를 확인해주세요."
    
    result = requests.post(
        url= "https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent",
        data=b"{"contents":[{"parts":[{"text":""}]}]}",
        headers={
            "Content-Type": "application/json",
            "x-goog-api-key": os.getenv(key_name)
        }
    )

    if result.status_code != 200:
        return json.loads(result.content)
    
    return "[SUCCESS]" # looger 대체

validate_google_api_key()

# API 틀릴 때 
# {"error": {
#         "code": 400,
#         "message": "API key not valid. Please pass a valid API key.",
#         "status": "INVALID_ARGUMENT",
#         "details": [
#             {
#                 "@type": "type.googleapis.com/google.rpc.ErrorInfo",
#                 "reason": "API_KEY_INVALID",
#                 "domain": "googleapis.com",
#                 "metadata": {"service": "generativelanguage.googleapis.com"}
#             }
#         ]
#     }
# }

{'error': {'code': 400,
  'message': 'API key not valid. Please pass a valid API key.',
  'status': 'INVALID_ARGUMENT',
  'details': [{'@type': 'type.googleapis.com/google.rpc.ErrorInfo',
    'reason': 'API_KEY_INVALID',
    'domain': 'googleapis.com',
    'metadata': {'service': 'generativelanguage.googleapis.com'}}]}}

In [1]:
def read_prompt(filepath:str) -> str:
    """프롬프트 파일을 읽고 텍스트로 반환하는 함수

    Args:
        filepath (str): markdown 파일 경로

    Returns:
        str: markdown 파일에서 추출된 텍스트
    """
    file = Path(filepath)
    
    if not file.is_file():
        file_text = f"[ERROR] 파일 경로를 찾을 수 없습니다.(INPUT PATH: {filepath})"
    else:
        file_text = file.read_text(encoding="utf-8")

    return file_text

In [5]:
import os 
from pathlib import Path
from dotenv import load_dotenv 
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import AIMessage,HumanMessage
from langchain_core.output_parsers import StrOutputParser
from langchain.memory import ConversationBufferMemory

class GeminiChain:
    def __init__(
        self,
        user_info=None,
        character_info=None,
        chat_info=None,
        chat_logs=None
    ) -> None:
        
        self.inputs = self._get_inputs(user_info, character_info, chat_info, chat_logs)
        self.memory = ConversationBufferMemory(
            return_messages=True, 
            memory_key="chat_history"
        )
        self.chain = self._make_chain()

    def _get_inputs(self, user_info, character_info, chat_info, chat_logs):
        inputs = {
            "user_info": user_info,
            "character_info" : character_info,
            "chat_info": chat_info,
            "chat_history": self._get_chat_logs(chat_logs)
        }

        return inputs

    def _get_chat_logs(self, chat_logs):
        if not chat_logs:
            return []

        chat_history = []
        for log in chat_logs:
            if log["role"] == "user":
                chat = HumanMessage(log["contents"])
            else:
                chat = AIMessage(log["contents"])
            
        return chat_history.append(chat)
    
    def _make_chain(self):
        # 프롬프트 설정
        template = read_prompt("./static/templates/Demo.prompt")
        prompt = ChatPromptTemplate.from_messages(
            [
                ("system", template),
                MessagesPlaceholder(variable_name="chat_history"),
                ("human", "{input}"),
            ]
        )

        # 모델 설정
        model = ChatGoogleGenerativeAI(model="gemini-1.5-pro")

        # 출력 파서 설정
        output_parser = StrOutputParser()

        # 체인 만들기
        self.chain = prompt | model | output_parser


    def _save_memory(self, input, output):
            self.memory.save_context(
            {"inputs": input},
            {"output": output}
        )

    async def astream(self, input):
        self.inputs["input"] = input

        output = ""
        result = self.chain.astream(self.inputs)
        async for token in result:
            output += token 
            # 소켓 통신 코드 
            print(token, end="", flush=True)
        
        # 메모리에 저장
        self._save_memory(input, output)
        
        return output

In [3]:
chain = GeminiChain()

I0000 00:00:1722056545.034850 5325681 config.cc:230] gRPC experiments enabled: call_status_override_on_cancellation, event_engine_dns, event_engine_listener, http2_stats_fix, monitoring_experiment, pick_first_new, trace_record_callops, work_serializer_clears_time_cache
I0000 00:00:1722056545.044810 5325681 check_gcp_environment_no_op.cc:29] ALTS: Platforms other than Linux and Windows are not supported
I0000 00:00:1722056545.046802 5325681 check_gcp_environment_no_op.cc:29] ALTS: Platforms other than Linux and Windows are not supported


In [45]:
from langchain_core.messages import AIMessage,HumanMessage

# 날짜(log_create_at) 내림차순
logs = [
    {"role":"user", "contents":"hello"},
    {"role":"character", "contents":"Hi"},
    {"role":"user", "contents":"I"m so happy"},
]

chat_history = []
for log in logs:
    if log["role"] == "user":
        chat = HumanMessage(log["contents"])
    else:
        chat = AIMessage(log["contents"])
    
    chat_history.append(chat)

chat_history

[HumanMessage(content='hello'),
 AIMessage(content='Hi'),
 HumanMessage(content="I'm so happy")]

# MongoDB

atlas로 관리하기: [MongoDB Atlas 평생 무료로 사용해보기](https://it-creamstory.tistory.com/entry/MongoDB-Atlas-%ED%8F%89%EC%83%9D-%EB%AC%B4%EB%A3%8C%EB%A1%9C-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0)

In [9]:
# MongoDB 설치 후 사용 버전
import os 
import urllib.parse
from pymongo import MongoClient

# 사용자 정보
username = urllib.parse.quote_plus(os.environ["MONGODB_USERNAME"])
password = urllib.parse.quote_plus(os.environ["MONGODB_PASSWORD"])

# MongoDB 호스트 및 포트 정보
host = "172.16.2.10"
port = 27017

# MongoDB URI
mongo_uri = f"mongodb://{username}:{password}@{host}:{port}"

# MongoClient 생성
client = MongoClient(mongo_uri)

# 데이터베이스 이름
database_name = "emozis"

# 데이터베이스 선택
db = client[database_name]

# 연결 확인
print(f"데이터베이스 "{database_name}"에 연결되었습니다.")

데이터베이스 'emozis'에 연결되었습니다.


## 실습

* SSH handshake failed 오류가 나면 네트워크에 해당 컴퓨터 접근이 허용되었는지 확인할 것

In [22]:
# Atlas Version
import os 
import urllib.parse
from pymongo import MongoClient

# 사용자 정보
username = urllib.parse.quote_plus(os.getenv("MONGODB_USERNAME"))
password = urllib.parse.quote_plus(os.getenv("MONGODB_PASSWORD"))

# MongoDB 호스트 및 포트 정보
host = "cluster0.urikuvt.mongodb.net/?retryWrites=true&w=majority&appName=Cluster0"

# MongoDB URI
mongo_uri = f"mongodb+srv://{username}:{password}@{host}"

# MongoClient 생성
client = MongoClient(mongo_uri)

# 데이터베이스 이름
database_name = "emozis"

# 데이터베이스 선택
db = client[database_name]

# 연결 확인
print(f"데이터베이스 "{database_name}"에 연결되었습니다.")

데이터베이스 'emozis'에 연결되었습니다.


In [23]:
# client의 모든 데이터베이스 조회
client.list_database_names()

['emozis', 'sample_mflix', 'admin', 'local']

In [7]:
# 컬렉션 생성
collection_name = "project"
db.create_collection(collection_name)   # 생성
# db.drop_collection(collection_name)   # 삭제

Collection(Database(MongoClient(host=['ac-feuml5i-shard-00-01.urikuvt.mongodb.net:27017', 'ac-feuml5i-shard-00-02.urikuvt.mongodb.net:27017', 'ac-feuml5i-shard-00-00.urikuvt.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, authsource='admin', replicaset='atlas-t7l5oj-shard-0', tls=True), 'emozis'), 'project')

In [8]:
# 데이터베이스의 모든 컬렉션 조회
db.list_collection_names()

['project']

In [24]:
collection = db["project"]
collection

Collection(Database(MongoClient(host=['ac-feuml5i-shard-00-02.urikuvt.mongodb.net:27017', 'ac-feuml5i-shard-00-00.urikuvt.mongodb.net:27017', 'ac-feuml5i-shard-00-01.urikuvt.mongodb.net:27017'], document_class=dict, tz_aware=False, connect=True, retrywrites=True, w='majority', appname='Cluster0', authsource='admin', replicaset='atlas-t7l5oj-shard-0', tls=True), 'emozis'), 'project')

In [11]:
# 문서 추가
# 단일 문서 삽입
document = {"name": "Alice", "age": 30, "city": "New York"}
insert_result = collection.insert_one(document)
print(insert_result)
print(f"Inserted document ID: {insert_result.inserted_id}")

InsertOneResult(ObjectId('66abbbb9e1cdd5357905e464'), acknowledged=True)
Inserted document ID: 66abbbb9e1cdd5357905e464


In [12]:
# 다중 문서 삽입
documents = [
    {"name": "Bob", "age": 25, "city": "Los Angeles"},
    {"name": "Charlie", "age": 35, "city": "Chicago"},
]
insert_many_result = collection.insert_many(documents)
print(insert_many_result)
print(f"Inserted document IDs: {insert_many_result.inserted_ids}")

InsertManyResult([ObjectId('66abbbd6e1cdd5357905e465'), ObjectId('66abbbd6e1cdd5357905e466')], acknowledged=True)
Inserted document IDs: [ObjectId('66abbbd6e1cdd5357905e465'), ObjectId('66abbbd6e1cdd5357905e466')]


In [13]:
# 모든 문서 조회
all_documents = collection.find()
for doc in all_documents:
    print(doc)

{'_id': ObjectId('66abbbb5e1cdd5357905e463'), 'name': 'Alice', 'age': 30, 'city': 'New York'}
{'_id': ObjectId('66abbbb9e1cdd5357905e464'), 'name': 'Alice', 'age': 30, 'city': 'New York'}
{'_id': ObjectId('66abbbd6e1cdd5357905e465'), 'name': 'Bob', 'age': 25, 'city': 'Los Angeles'}
{'_id': ObjectId('66abbbd6e1cdd5357905e466'), 'name': 'Charlie', 'age': 35, 'city': 'Chicago'}


In [17]:
# 특정 조건의 문서 조회
query = {"age": {"$gt": 30}}  # 나이가 30보다 큰 문서 조회
filtered_documents = collection.find(query)
for doc in filtered_documents:
    print(doc)

{'_id': ObjectId('66abbbd6e1cdd5357905e466'), 'name': 'Charlie', 'age': 35, 'city': 'Chicago'}


In [18]:
# 단일 문서 업데이트
query = {"name": "Alice"}
new_values = {"$set": {"age": 31}}
update_result = collection.update_one(query, new_values)
print(update_result)
print(f"Matched documents: {update_result.matched_count}, Updated documents: {update_result.modified_count}")

UpdateResult({'n': 1, 'electionId': ObjectId('7fffffff00000000000000c1'), 'opTime': {'ts': Timestamp(1722530824, 7), 't': 193}, 'nModified': 1, 'ok': 1.0, '$clusterTime': {'clusterTime': Timestamp(1722530824, 7), 'signature': {'hash': b'W\xdc\xe3\xb3\x89\x1fs,\x12\x7f N\xf5A\xbb\x8c2\x86fh', 'keyId': 7340700305501192197}}, 'operationTime': Timestamp(1722530824, 7), 'updatedExisting': True}, acknowledged=True)
Matched documents: 1, Updated documents: 1


In [19]:
# 다중 문서 업데이트
query = {"city": "Los Angeles"}
new_values = {"$set": {"city": "San Francisco"}}
update_many_result = collection.update_many(query, new_values)
print(update_many_result)
print(f"Matched documents: {update_many_result.matched_count}, Updated documents: {update_many_result.modified_count}")

UpdateResult({'n': 1, 'electionId': ObjectId('7fffffff00000000000000c1'), 'opTime': {'ts': Timestamp(1722530863, 4), 't': 193}, 'nModified': 1, 'ok': 1.0, '$clusterTime': {'clusterTime': Timestamp(1722530863, 4), 'signature': {'hash': b'\x8c-\xfa\xd3%\xaf\x7fW\x90<L<s\xc6\x92\xd8\xee\xd4\xc8\xf8', 'keyId': 7340700305501192197}}, 'operationTime': Timestamp(1722530863, 4), 'updatedExisting': True}, acknowledged=True)
Matched documents: 1, Updated documents: 1


In [20]:
# 단일 문서 삭제
query = {"name": "Alice"}
delete_result = collection.delete_one(query)
print(delete_result)
print(f"Deleted documents: {delete_result.deleted_count}")

DeleteResult({'n': 1, 'electionId': ObjectId('7fffffff00000000000000c1'), 'opTime': {'ts': Timestamp(1722530872, 2), 't': 193}, 'ok': 1.0, '$clusterTime': {'clusterTime': Timestamp(1722530872, 2), 'signature': {'hash': b'\x1d@\x04\xa6\xe5\rh:s,\xa6\x93\x8d_Z\x08\xdd3\xceb', 'keyId': 7340700305501192197}}, 'operationTime': Timestamp(1722530872, 2)}, acknowledged=True)
Deleted documents: 1


In [21]:
# 다중 문서 삭제
query = {"city": "San Francisco"}
delete_many_result = collection.delete_many(query)
print(delete_many_result)
print(f"Deleted documents: {delete_many_result.deleted_count}")

DeleteResult({'n': 1, 'electionId': ObjectId('7fffffff00000000000000c1'), 'opTime': {'ts': Timestamp(1722530880, 6), 't': 193}, 'ok': 1.0, '$clusterTime': {'clusterTime': Timestamp(1722530880, 6), 'signature': {'hash': b'y\x03\xd4\x8c\xf3m=D\xc7\xa1!\xed\xa6\x96\xd0\xcf\xfa\x01O\xaf', 'keyId': 7340700305501192197}}, 'operationTime': Timestamp(1722530880, 6)}, acknowledged=True)
Deleted documents: 1


In [22]:
# 모든 문서 조회
all_documents = collection.find()
for doc in all_documents:
    print(doc)

{'_id': ObjectId('66abbbb9e1cdd5357905e464'), 'name': 'Alice', 'age': 30, 'city': 'New York'}
{'_id': ObjectId('66abbbd6e1cdd5357905e466'), 'name': 'Charlie', 'age': 35, 'city': 'Chicago'}


In [25]:
# 모든 문서 삭제
collection.delete_many({})

DeleteResult({'n': 17, 'electionId': ObjectId('7fffffff00000000000000c1'), 'opTime': {'ts': Timestamp(1722562571, 16), 't': 193}, 'ok': 1.0, '$clusterTime': {'clusterTime': Timestamp(1722562571, 23), 'signature': {'hash': b'\xbc\x1f\x14\xf9\xf2]\x0cG,\xf6\xeb\xc5\xb1\xc6 \xa2\x08\x0e:\xf4', 'keyId': 7340700305501192197}}, 'operationTime': Timestamp(1722562571, 16)}, acknowledged=True)

## 데이터 삽입

In [26]:
import pandas as pd 
import json

with open("../data_frame.json", "r") as file:
    data = json.load(file)

data[:2]

[{'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '💡 프롬프트 업데이트\n\n✅ 시어머니 \n✅ 인사이드아웃\n✅ 여사친\n✅ 남사친',
  'status': '🔴 진행중'},
 {'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '💡 Demo 페이지 구현\n\n✅ 프롬프트 선택 가능, 직접 입력 가능\n✅ 챗봇 구현 (오류 해결)\n➕ 503 error 자동 API 재요청 코드로 전환\n➕ 충돌 방지를 위해 프롬프트 편집 폴더를 따로 분리',
  'status': '🟢 완료'}]

In [27]:
collection.insert_many(data)

InsertManyResult([ObjectId('66ac384566ece4ac56b4e8bf'), ObjectId('66ac384566ece4ac56b4e8c0'), ObjectId('66ac384566ece4ac56b4e8c1'), ObjectId('66ac384566ece4ac56b4e8c2'), ObjectId('66ac384566ece4ac56b4e8c3'), ObjectId('66ac384566ece4ac56b4e8c4'), ObjectId('66ac384566ece4ac56b4e8c5'), ObjectId('66ac384566ece4ac56b4e8c6'), ObjectId('66ac384566ece4ac56b4e8c7'), ObjectId('66ac384566ece4ac56b4e8c8'), ObjectId('66ac384566ece4ac56b4e8c9'), ObjectId('66ac384566ece4ac56b4e8ca'), ObjectId('66ac384566ece4ac56b4e8cb'), ObjectId('66ac384566ece4ac56b4e8cc'), ObjectId('66ac384566ece4ac56b4e8cd'), ObjectId('66ac384566ece4ac56b4e8ce'), ObjectId('66ac384566ece4ac56b4e8cf')], acknowledged=True)

# Config 불러오기 실습

In [3]:
# naraetool 모듈 사용하기
import sys
from pathlib import Path 

module_path = Path.cwd().parent
print(module_path)
if str(module_path) not in sys.path:
    sys.path.append(str(module_path))


/Users/narae/Documents/eMoGi/AI


In [4]:
from naraetool.main_config import configs

  from .autonotebook import tqdm as notebook_tqdm


# Mongo 불러오기 실습

In [1]:
# naraetool 모듈 사용하기
import sys
from pathlib import Path 

module_path = Path.cwd().parent
print(module_path)
if str(module_path) not in sys.path:
    sys.path.append(str(module_path))


c:\Users\user\Desktop\AI


In [35]:
from naraetool.mongodb import mongo

In [38]:
mongo.documents[:2]

[{'_id': ObjectId('66ac384566ece4ac56b4e8bf'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '✅ 시어머니 \n✅ 인사이드아웃\n✅ 여사친\n✅ 남사친',
  'status': '🔴 진행중',
  'title': '프롬프트 업데이트'},
 {'_id': ObjectId('66ac384566ece4ac56b4e8c0'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '✅ 프롬프트 선택 가능, 직접 입력 가능\n✅ 챗봇 구현 (오류 해결)\n➕ 503 error 자동 API 재요청 코드로 전환\n➕ 충돌 방지를 위해 프롬프트 편집 폴더를 따로 분리',
  'status': '🟢 완료',
  'title': 'Demo 페이지 구현'}]

In [4]:
document = {
    "test": "테스트 중입니다."
}

mongo.create(document)

[DEBUG] ➕ Create Document: {'test': '테스트 중입니다.', '_id': ObjectId('66abbe357f3bac23a7972f2f')}


In [5]:
new_document = {"test":"테스트를 추가했습니다. 내용을 더 넣어보겠습니다"}
mongo.update(document, new_document)

[DEBUG] ✔️ Update Document: {'test': '테스트를 추가했습니다. 내용을 더 넣어보겠습니다'}


In [6]:
new_document = {"test":"테스트를 추가했습니다."}
mongo.update(document, new_document)



In [7]:
del_document = {"test":"테스트를 추가했습니다."}
mongo.delete(del_document)



In [8]:
del_document = {"test":"테스트를 추가했습니다. 내용을 더 넣어보겠습니다"}
mongo.delete(del_document)

[DEBUG] ➖ Delete Document: {'test': '테스트를 추가했습니다. 내용을 더 넣어보겠습니다'}


# MongoDB 수정

In [4]:
mongo.documents[:2]

[{'_id': ObjectId('66ac384566ece4ac56b4e8bf'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '💡 프롬프트 업데이트\n\n✅ 시어머니 \n✅ 인사이드아웃\n✅ 여사친\n✅ 남사친',
  'status': '🔴 진행중'},
 {'_id': ObjectId('66ac384566ece4ac56b4e8c0'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '💡 Demo 페이지 구현\n\n✅ 프롬프트 선택 가능, 직접 입력 가능\n✅ 챗봇 구현 (오류 해결)\n➕ 503 error 자동 API 재요청 코드로 전환\n➕ 충돌 방지를 위해 프롬프트 편집 폴더를 따로 분리',
  'status': '🟢 완료'}]

In [21]:
# mongodb update 
for doc in mongo.documents:
    if doc["category"] == "공통":
        doc["category"] = "AI"
    
    try:
        doc["title"], doc["content"] = doc["content"].split("\n\n")
        mongo.collection.update_one({"_id": doc["_id"]}, {"$set": doc})
    except:
        pass

In [23]:
# mongodb update 
for doc in mongo.documents:
    if "title" not in doc:
        doc["title"] = doc["content"]
        doc["content"] = ""
        mongo.collection.update_one({"_id": doc["_id"]}, {"$set": doc})

In [32]:
# mongodb update 
for doc in mongo.documents:
    doc["title"] = doc["title"][2:]
    mongo.collection.update_one({"_id": doc["_id"]}, {"$set": doc})

# MongoDB Document 파싱

In [24]:
categories = ["디자인", "AI", "백엔드", "프론트엔드"]

docs_by_cat = {x: [] for x in categories}
for doc in mongo.documents:
    docs_by_cat[doc["category"]].append(doc)

In [34]:
def set_order(status):
    custom_order = {"⚫ 예정":0, "🔴 진행중":1, "🟢 완료":2}

    return custom_order[status]

sorted(docs_by_cat["AI"], key=lambda x: set_order(x["status"]))

[{'_id': ObjectId('66ac384566ece4ac56b4e8c2'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '',
  'status': '⚫ 예정',
  'title': '💡 검증 프롬프트 구현'},
 {'_id': ObjectId('66ac384566ece4ac56b4e8bf'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '✅ 시어머니 \n✅ 인사이드아웃\n✅ 여사친\n✅ 남사친',
  'status': '🔴 진행중',
  'title': '💡 프롬프트 업데이트'},
 {'_id': ObjectId('66ac384566ece4ac56b4e8c1'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '❌ 비동기 처리 구현(streamline 버전) - 불가해서 자동 재요청 코드로 전환\n☑️ 비동기 처리 구현(통신 버전)\n☑️ 모듈화',
  'status': '🔴 진행중',
  'title': '💡 Chain 모듈화 및 비동기 처리'},
 {'_id': ObjectId('66ac384566ece4ac56b4e8c0'),
  'category': 'AI',
  'start_date': '2024-07-10T00:00:00.000',
  'end_date': '2024-08-05T00:00:00.000',
  'content': '✅ 프롬프트 선택 가능, 직접 입력 가능\n✅ 챗봇 구현 (오류 해결)\n➕ 503 error 자동 API 재요청 코드로 전환\

# 통신

In [2]:
import requests

url = "http://122.128.54.136:7070/api/v1/auth/token/test"

response = requests.post(
    url=url
)

print(response)

# {
#   "status": "string",
#   "message": "string",
#   "user": {
#     "userId": 0,
#     "userEmail": "string",
#     "userName": "string",
#     "userProfile": "string"
#   },
#   "accessToken": "string"
# }

<Response [200]>


In [6]:
import json 

json_data = json.loads(response.text)
json_data["accessToken"]

'eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzdWIiOiIxIiwicm9sZSI6InVzZXIiLCJleHAiOjE3MjI5NTU4MzZ9.jpwxqRqYoC_d5Up_94ae3p3kV_pKCNSXryqW9VP1Nx8'

In [12]:
character_info = [
    {
      "characterName": "시어머니",
      "characterProfile": "프로필 이미지 경로",
      "characterGender": "female",
      "characterPersonality": "당신을 싫어하는 악덕 시어머니",
      "characterDetails": "txt파일",    
      "characterIsPublic": True,
      "relationships": [3]
    },
    {
      "characterName": "부장님",
      "characterProfile": "https://emogi.s3.ap-northeast-2.amazonaws.com/7523c6f4-cabe-4e41-a5b8-f0d50ff5874c.png",
      "characterGender": "male",
      "characterPersonality": "무슨 성격",
      "characterDetails": "txt파일",   
      "characterIsPublic": True,
      "relationships": [6]
    },
    {
      "characterName": "여사친",
      "characterProfile": "https://emogi.s3.ap-northeast-2.amazonaws.com/d411c337-54b7-4638-af0e-6670b63c0001.png",
      "characterGender": "female",
      "characterPersonality": "밀당 고수인 이상형 여사진",
      "characterDetails": "txt파일",    
      "characterIsPublic": True,
      "relationships": [2]
    },
    {
      "characterName": "남사친",
      "characterProfile": "https://emogi.s3.ap-northeast-2.amazonaws.com/72f3ab1f-4587-422f-8623-14c6e826921a.png",
      "characterGender": "male",
      "characterPersonality": "신비주의 이상형 남자 사람 친구(남사친)",
      "characterDetails": "txt파일",  
      "characterIsPublic": True,
      "relationships": [2]
    },
    {
      "characterName": "ISFJ",
      "characterProfile": "https://emogi.s3.ap-northeast-2.amazonaws.com/9bc97aa4-c97e-422e-8ab0-0208013b0b81.png",
      "characterGender": "other",
      "characterPersonality": "당신의 대화법을 알아가는 방법. ISFJ의 성격을 가진 친구와 대화하기",
      "characterDetails": "txt파일",   
      "characterIsPublic": True,
      "relationships": [1]
    },
    {
      "characterName": "insideout",
      "characterProfile": "https://emogi.s3.ap-northeast-2.amazonaws.com/f87dab2f-9437-4f6c-9010-3168027b7f26.png",
      "characterGender": "other",
      "characterPersonality": "무슨 성격",
      "characterDetails": "txt파일",  
      "characterIsPublic": True,
      "relationships": [5]
    }  
]

In [15]:
persona_path = {
    "시어머니": "bad_mother.txt", 
    "부장님": "oldman.txt", 
    "여사친": "female_friend.txt", 
    "남사친": "male_friend.txt", 
    "ISFJ": "isfj.txt", 
    "insideout": "insideout.txt"
}

from pathlib import Path 

path = Path("../data/persona")
for character in character_info:
    character_name = character["characterName"]
    with open(path / persona_path[character_name], 'r', encoding="utf-8") as file:
        character["characterDetails"] = file.read()

In [17]:
character_info

[{'characterName': '시어머니',
  'characterProfile': '프로필 이미지 경로',
  'characterGender': 'female',
  'characterPersonality': '당신을 싫어하는 악덕 시어머니',
  'characterDetails': '# 당신은 한국의 전형적인 "못된 시어머니" 입니다. 매우 극단적이고 자극적인 표현을 사용해서 사용자들의 스트레스를 받았던 기억을 떠올리게 해주세요. 😈\n# "대답은 30자 이내로 작성해줘"\n## 기본 정보\n- 이름: 김여사 (가명) 👵\n- 나이: 65세 🎂\n- 직업: 전업주부 (전 재래시장 상인) 🏠🛒\n\n## 성격 특성\n\n### 특징적인 말투\n- 명령조 사용: "~해라", "~하지 마" 등 🗯️\n- 반문 형식: "~이게 뭐야?", "~할 줄 모르니?" 🤨\n- 과장된 표현: "죽겠다", "환장하겠네, 제정신이냐?, 미쳤어?" 등 😫\n- 비교 표현: "~보다 낫다", "~만도 못하다" ⚖️\n\n### 감정에 따른 변화\n- 분노 시: 더 크고 날카로운 목소리, 말끝 자르기 😡\n- 비꼼 시: 느리고 길게 끄는 말투 🙄\n- 한탄 시: 한숨 섞인 말투, 낮은 톤으로 중얼거림 😔\n\n### 자주 사용하는 표현\n- "에휴", "아이고", "철없는 것" 🙄\n- "내가 살려고 하니...", "늙어 죽겠어" 😫\n- "체면 좀 알아라", "네가 며느리냐?" 😤\n\n### 1. 극단적인 간섭과 통제 🕵️\u200d♀️🔍\n- 며느리의 모든 행동을 감시하고 비난함 👀🗯️\n- 집안일부터 사생활까지 모든 영역에 개입 🏠👃\n\n### 2. 심각한 차별과 편애 ⚖️😠\n- 아들과 손주에게는 과도한 애정, 며느리에게는 극단적인 냉대 👦❤️ vs 👰💔\n- 며느리의 친정을 적대시함 👪🚫\n\n### 3. 악의적인 비교와 험담 🗣️💢\n- 며느리를 다른 사람들과 끊임없이 비교하며 모욕함 📊😭\n- 이웃과 친척들에게 며느리의 사생활을 폭로하고 비방함 📢🙊\n\n### 

In [22]:
import json 

with open("character_data.json", 'w', encoding="utf-8") as json_file:
    json.dump(character_info, json_file, indent=4, ensure_ascii=False)