In [1]:
from dotenv import load_dotenv
import json
from IPython.display import Image, display
import os
from pydantic import BaseModel
from typing import Annotated, Literal
from typing_extensions import TypedDict

from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_openai import ChatOpenAI
from langchain_core.messages import BaseMessage, ToolMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate

from langgraph.graph import StateGraph, START, END
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode, tools_condition
from langgraph.checkpoint.memory import MemorySaver

In [2]:
load_dotenv()
llm = ChatOpenAI(model="gpt-4o")

In [3]:
from schemas import DraftOutline
from prompts import draft_refiner_prompt

In [4]:
test_bot = draft_refiner_prompt | llm.with_structured_output(DraftOutline)

In [5]:
text = """
모델이  학습되는  과정에서,  각  epoch 마다  정해진  metric 을  기록할  수  있도록 
시스템을  구현  하였음.  웹  상에서  UI 로  쉽게  확인하기  위해, WandB 를 
도입하였으며, DiceScore, DiceLoss 를  학습과  검증  과정에서  모두  기록해  보았음. 
CNN 계열의  Unet-3D 와  Vnet, Transformer 계열의  Unetr, Swin-Unetr  총  4 개의 
모델을  학습시켜본  결과는  아래와  같음 
Vnet 과  Swin-Unetr 의  모델이  Unet-3D 와  Unetr 에  비해  좋은  Dice Socre 를  가짐 
Vnet   
Dice Coefficient → 0.956 
Swin-Unetr   
Dice Coefficient → 0.956 
Unet-3D   
Dice Coefficient → 0.931 
Unetr   
Dice Coefficient → 0.891 
수치적인  성능으로  만  봤을  때는  Swin-Unet 과  Vnet 이  가장  좋은  성능을 
가졌지만,  이  두  모델에  대해서  시각화  하여  결과를  살펴  보았음. 
두  모델  모두  비슷하게  잘  예측하지만, Vent 은  가끔씩  예측영역이  잘게  쪼개지는 
현상이  나타났음.  이에  반해, SwinUnetr 은  전체적으로  시각화  품질  상태가 
양호해음.  때문에, SwinUnetr 을  다낭신  데이터에  한해  SOTA 모델이라  채택하여, 
해당  모델의  성능을  높여보는데  집중  하기로  함. 
"""

In [6]:
a = test_bot.invoke(text)

In [7]:
a.title

'모델 학습 및 성능 평가 연구'

In [8]:
for i in a.sections:
    print(i)

section_title='연구 배경' contents='모델 학습 과정에서 각 epoch마다 정해진 metric을 기록할 수 있도록 시스템을 구현하였음. 이러한 기록을 웹 UI 상에서 쉽게 확인하기 위해 WandB를 도입함.'
section_title='연구 방법' contents='DiceScore, DiceLoss를 학습과 검증 과정에서 모두 기록함. CNN 계열의 Unet-3D와 Vnet, Transformer 계열의 Unetr, Swin-Unetr 총 4개의 모델을 학습시킴.'
section_title='연구 결과' contents='Vnet과 Swin-Unetr 모델이 Unet-3D와 Unetr에 비해 좋은 Dice Score를 가짐. \n- Vnet Dice Coefficient → 0.956 \n- Swin-Unetr Dice Coefficient → 0.956 \n- Unet-3D Dice Coefficient → 0.931 \n- Unetr Dice Coefficient → 0.891'
section_title='결론 및 향후 연구' contents='수치적인 성능만 봤을 때는 Swin-Unetr과 Vnet이 가장 좋은 성능을 가졌음. 두 모델을 시각화하여 결과를 살펴보았는데, Vnet은 가끔 예측영역이 잘게 쪼개지는 현상이 나타났음. Swin-Unetr은 전체적으로 시각화 품질 상태가 양호하여, Swin-Unetr을 다낭신 데이터에 한해 SOTA 모델로 채택하고 해당 모델의 성능을 높이는 데 집중하기로 하였음.'
