In [1]:
from opentelemetry import trace
from opentelemetry.sdk.trace import TracerProvider
from opentelemetry.sdk.trace.export import SimpleSpanProcessor
from openinference.instrumentation.smolagents import SmolagentsInstrumentor
from opentelemetry.exporter.otlp.proto.http.trace_exporter import OTLPSpanExporter

from dotenv import load_dotenv
from kiwipiepy import Kiwi
import os
from huggingface_hub import login

# Hugging Face 로그인 코드
def huggingface_login():
    login(token=os.getenv("HUGGING_FACE_API_KEY"))

huggingface_login()
load_dotenv()
kiwi = Kiwi()

def kiwi_tokenize(text):
    return [token.form for token in kiwi.tokenize(text)] 


endpoint = "http://0.0.0.0:6006/v1/traces"
trace_provider = TracerProvider()
trace_provider.add_span_processor(SimpleSpanProcessor(OTLPSpanExporter(endpoint)))

SmolagentsInstrumentor().instrument(tracer_provider=trace_provider)

  from .autonotebook import tqdm as notebook_tqdm


In [None]:
from langchain_community.document_loaders import PDFPlumberLoader
from langchain.docstore.document import Document
from smolagents import CodeAgent, HfApiModel, ToolCallingAgent, MultiStepAgent, OpenAIServerModel
from src.tools import GetResponse, OpenAPIGuideRetriever
        
def list_pdf_files(directory: str) -> list:
    """
    주어진 디렉토리에서 PDF 파일 목록(전체 경로)을 반환합니다.
    """
    return [os.path.join(directory, f) for f in os.listdir(directory) if f.lower().endswith('.pdf')]

def load_pdf_documents(pdf_files: list) -> list:
    """
    PDF 파일 목록을 받아 각 파일을 Document 객체로 변환합니다.
    PyMuPDFLoader를 사용하여 PDF 파일의 모든 페이지 텍스트를 추출하고,
    이를 하나의 Document 객체로 결합합니다.
    """
    documents = []
    for pdf_path in pdf_files:
        try:
            loader = PDFPlumberLoader(pdf_path)
            docs = loader.load()  # 각 페이지별 Document 객체 리스트
            # 모든 페이지 텍스트를 하나로 결합
            full_text = "\n".join([doc.page_content for doc in docs])
            document = Document(page_content=full_text, metadata={"source": pdf_path})
            documents.append(document)
        except Exception as e:
            print(f"Error loading {pdf_path}: {e}")
    return documents

openapi_dir = '..docs/openapi/'
pdf_files = list_pdf_files(openapi_dir)

print(f"{len(pdf_files)}개의 PDF 파일을 발견하였습니다.")
docs = load_pdf_documents(pdf_files)
print(f"총 {len(docs)}개의 Document 객체를 생성하였습니다.")

model = HfApiModel()
model = OpenAIServerModel(model_id='gpt-4o-mini')

get_response = GetResponse()
open_api_guide_retriever = OpenAPIGuideRetriever(docs)
tools =[open_api_guide_retriever,get_response]

tool_agent = ToolCallingAgent(
    model=model,
    tools=tools,
    name = "OpenAPI guide document retrieve agent",
    description="""
    You are an agent that reads the API guide document and finds the necessary information to report. The report must include the Call Back URL (not the service URL), request parameter, response parameter, and response message JSON structure.
    """,
    max_steps = 1
)
rag_agent = MultiStepAgent(
    tools = tools,
    model = model,
    name="managed_agent",
    description="""
    You are an agent that reads the API guide document and finds the necessary information to report. The report must include the callback URL, request parameter, response parameter, and response message JSON structure.
    """,
    managed_agents=[tool_agent],
    max_steps=3
)
LH_agent = CodeAgent(
    tools=tools,
    model=model,
    additional_authorized_imports=["json","requests"],
    use_e2b_executor=False,
    max_steps = 6
)

open_api_query = '분양임대공고조회'
LH_opt = {'지역' : "서울",
       '기간' : "2024.12.01 ~ 2025.04.10",
       '청약유형' : "주택 임대",
       '공고상태' : ""
       }

#open_api_parameter = tool_agent.run("분양임대공고조회")
#rag_output = rag_agent.run(f"{open_api_query} 관련 문서를 참고해서 API 호출에 필요한 callback url, request 파라미터, response로 받는 파라미터를 작성해서 보고하는데 포맷은 조회한 문서 이름 : 문서이름, callback url : callback url, resquest parameter : parameters")
final_answer = LH_agent.run(task=f'조건(지역, 기간, 청약 유형)을 고려한 주택 임대 공고를 찾기 위해 get_response tool을 호출하여 공고의 공고 제목, 공고문 상세 주소, 공고문 상세 내용(시작일, 마감일, 상태, 유형, 지역)을 보기좋게 정리해서 답변해줘',additional_args=LH_opt,stream=False)

5개의 PDF 파일을 발견하였습니다.
총 5개의 Document 객체를 생성하였습니다.


In [63]:
from smolagents import OpenAIServerModel
from src.tools import SH_NoticeScraper
import datetime
from smolagents import CodeAgent, HfApiModel, ToolCallingAgent

model = OpenAIServerModel(model_id='gpt-4o-mini')
sh_notice_scraper = SH_NoticeScraper()
sh_url = "https://housing.seoul.go.kr/site/main/sh/publicLease/list?sc=titl&startDate=&endDate=&sv="
sh_agent = CodeAgent(
    description=
    """
    sh_notice_scraper를 사용해서 웹사이트의 게시판 글 목록을 스크래핑하여, 조건(예: 제목에 '장기미임대' 포함, 기간이 '2024-01-01 ~ 2025-05-05')에 맞게 게시글 정보를 정리해서 반환하는 agent.
    """,
    tools=[sh_notice_scraper],
    model=model,
    use_e2b_executor=False,
    max_steps = 6
)
opt = {}
opt['조건']= {'지역' : "서울",
      '기간' : "2024.12.01 ~ 2025.04.10",
      '청약유형' : "",
      'keyword' : "",
      'sh_url' : "https://housing.seoul.go.kr/site/main/sh/publicLease/list?sc=titl&startDate=&endDate=&sv=",
      '공고상태' : ""
      }
today = datetime.date.today()
task_prompt = f"""
<STEP 1>: max_pages(int) 수는 조건기간, 1 pages per 3 month를 고려해서 sh_notice_parser를 호출하고 그 결과를 keyword로 요청이 있지 않으면 '공고명'에 '발표','합격자','경쟁률','결과'가 있는 결과는 필터링해. STEP 1 코드 한번에 작성. </STEP 1>
<STEP 2>: !important 조건(기간, 청약유형, 공고상태)들을 고려해서 결과를 다시 필터링. '공고게시일'이 기간안에 반드시 포함되어야한다. 만약 공고상태나 청약유형 없으면 고려안해도 된다. STEP 2 코드 한번에 작성.</STEP 2>
"""
sh_final_answer = sh_agent.run(task=task_prompt, additional_args=opt, stream=False)
#print(sh_final_answer)

In [None]:
from src.tools import YouthNoticeScraper

model = HfApiModel()
model = OpenAIServerModel(model_id='gpt-4o')
youth_notice_scraper = YouthNoticeScraper()
youth_agent =ToolCallingAgent(
    description=
    """
    youth_notice_scraper를 사용해서 웹사이트의 게시판 글 목록을 스크래핑하고 조건(예: 제목에 '공공임대' 포함, 기간이 '2024-01-01 ~ 2025-05-05', 공고명에 포함되어야 하는 keyword '공공')에 맞게 게시글 정보를 정리해서 반환하는 Tool Calling agent.
    """,
    tools=[youth_notice_scraper],
    model=model,
  #  use_e2b_executor=False,
    max_steps = 3
)
opt = {'지역' : "서울",
      '기간' : "2024.07.01 ~ 2025.04.10",
      '청약유형' : "청년안심주택",
      'keyword' : "공공",
      'sh_url' : "https://housing.seoul.go.kr/site/main/sh/publicLease/list?sc=titl&startDate=&endDate=&sv="
      }

task_prompt = f"""
청년안심주택 모집 공고를 youth_notice_scraper을 찾고 조건(지역, 기간)에 맞는 게시글들을 찾아서 결과를 정리해.
참고 사항 1: max_pages 수는 조건 기간이 5개월 당 페이지 4개를 고려해서 tool 호출.
"""
youth_final_answer = youth_agent.run(task=task_prompt, additional_args={'조건':{'지역':opt['지역'],'기간':opt['기간'],'keyword':opt['keyword']}}, stream=False)
print(youth_final_answer)

Here are the 청년안심주택 모집 공고 that meet your criteria:

1. **[공공임대] 2024년 3차 청년안심주택 모집공고**
   - 게시일: 2024-12-23
   - 마감일: 2025-01-02
   - 시행사: SH 맞춤주택공급부
   - [상세 링크](https://soco.seoul.go.kr/youth/bbs/BMSR00015/view.do?boardId=6152&menuNo=400008)

These postings are located in Seoul and are within the specified date range of 2024.12.01 to 2025.04.10, and include the keyword '공공'. Only relevant entries were selected based on the criteria you provided.
