In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
!pip install pypdf
!pip install langchain-chroma
!pip install langchain-community
!pip install tiktoken



In [None]:
from langchain.document_loaders import PyPDFLoader
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA, ConversationalRetrievalChain
import os
from openai import OpenAI
import re

In [None]:
OPENAI_API_KEY = "API키"
os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY

loader = PyPDFLoader("/content/drive/MyDrive/컨퍼런스/rag/company/ICT_merge.pdf")

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
    )

pages = loader.load_and_split(text_splitter)
pages[2].page_content
# print(f"Total pages loaded: {len(pages)}") # design: 3 / ICT: 6

Total pages loaded: 6


In [None]:
directory = '/content/drive/MyDrive/컨퍼런스/rag/DB/ICT'
vector_index = Chroma.from_documents(
    pages, # Documents
    OpenAIEmbeddings(), # Text embedding model
    persist_directory=directory # persists the vectors to the file system
    )

vector_index.persist()

  OpenAIEmbeddings(), # Text embedding model
  vector_index.persist()


In [None]:
retriever = vector_index.as_retriever(
    search_type="similarity", # Cosine Similarity
    search_kwargs={
        "k": 5, # Select top k search results
    }
)

In [None]:
qa_chain = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(temperature=0, model="ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel:AIenIBIz"),
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True # source document which were used as source files
)

  llm=ChatOpenAI(temperature=0, model="ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel:AIenIBIz"),


In [None]:
qa_chain.invoke("ICT 직무에 필요한 역량은 뭐야?")

{'query': 'ICT 직무에 필요한 역량은 뭐야?',
 'result': 'ICT 직무에 필요한 역량은 HTML, CSS, Javascript 등 웹 프론트엔드 개발에 관한 기본 지식, php, jsp 등 서버사이드 스크립트 개발에 관한 기본 지식, 구조화 질의어(SQL) 해독 지식, DB 설계 및 DB 정규화 등 DBMS에 관한 기본 지식, 웹사이트 보안에 대한 지식이 필요합니다. 또한, Linux/Windows Server 운영에 관한 지식, 시스템 용어에 관한 지식, TCP/IP 등 컴퓨터 네트워크에 관한 기본 지식, 정보보호 관리체계에 관한 지식, 개인업무환경 및 공용업무환경에 관한 보안지식, 시스템의 취약점 및 보안위협에 관한 지식이 필요합니다.',
 'source_documents': [Document(metadata={'page': 1, 'source': '/content/drive/MyDrive/컨퍼런스/rag/company/ICT_merge.pdf'}, page_content='필요지식\n○ HTML, CSS, Javascript 등 웹 프론트엔드 개발에 관한 기본 지식, php, jsp 등 서버사이드 \n스크립트 개발에 관한 기본 지식, 구조화 질의어(SQL) 해독 지식, DB 설계 및 DB 정규화 \n등 DBMS에 관한 기본 지식, 웹사이트 보안에 대한 지식\n○ Linux/Windows Server 운영에 관한 지식, 시스템 용어에 관한 지식, TCP/IP 등 컴퓨터 \n네트워크에 관한 기본 지식, 정보보호 관리체계에 관한 지식, 개인업무환경 및 \n공용업무환경에 관한 보안지식, 시스템의 취약점 및 보안위협에 관한 지식\n○ 방송시스템의 기술기준과 표준에 관한 지식, 방송 시스템 설치와 구성에 관한 지식, 라이선스 \n및 라이선스 활용 지식, 방송서비스의 전반적인 특성에 관한 지식\n필요기술\n○ 문서 작성 능력, 사업계획서 작성 기술, 기초 통계 능력, 도표 분석 및 작성 능력, 엑셀 \n등 사무자동화 활용 능력,\u20

In [None]:
result = qa_chain.invoke("창의력")
source_documents = result['source_documents']
docs = [source_documents[i].page_content for i in range(len(source_documents))]
doc = re.sub(r"\\n|\n|\"|○", "", str(docs))
doc

"['인지하고 주어진 자원 내에서 반드시 완수하려는 의지, 문제점 및 이슈를 해결하려는 적극적인 태도 기본보고서, 명세서 등 문서 작성과 자료 구축을 성실하고 꼼꼼하게 수행하는 자세 객관적인 관점으로 종합적으로 사고하려는 자세, 이해당사자간의 이슈사항을 종합하고 이견사항을 적극적으로 수용하는 자세, 공정하고 합리적으로 업무를 수행하는 태도, 문제 해결을 위해 상호협조적인 태도와 노력 의견을 내는 데 두려움이 없으며 공유가 일상화되어 있는 태도, 좋은 것을 제대로 즐기고 기꺼이 나눌 줄 아는 태도 회사 안에만 머무르지 않고 세상 속에 있고자 하는 자세, 새로운 기술과 자신이 모르는 분야에 대한 탐구를 멈추지 않고 학습하며 비판적으로 수용하는 자세필요자격 -우대자격  정보처리기사, 네트워크관리사, 정보보안기사, 정보시스템보안전문가(CISSP), 정보시스템심사원(CISA), 방송통신기사, 정보통신기사직업기초능력  의사소통능력, 문제해결능력, 직업윤리, 정보능력, 기술능력참고사이트  www.ncs.go.kr 홈페이지 -> NCS 학습모듈 검색 www.kcmf.or.kr 홈페이지 참고', '위해 방화벽(Firewall), 프락시(Proxy), 침입방지시스템(IPS), 침입탐지시스템(IDS), 가상사설망(VPN), 네트워크 접근제어(NAC) 등 장비의 운영과 정책 설정을 실시함. (정보 보호 관리) 개인정보 유출 방지를 위한 각종 활동을 실시하고 민원에 대응함. 내부정보 유출 피해 방지를 위한 디지털저작권관리(DRM), 데이터유출방지(DLP), 문서중앙화 시스템의 도입 검토 등을 수행함. (보안관리 및 비상기획) 조직의 주요 자산을 보호하기 위하여 인적, 시설물, 정보 유출 등의 사전 예방과 보안사고 발생에 대응함. 재해재난과 전시를 대비한 계획, 준비, 훈련과 안전관리 관련 업무를 수행함. (자산관리 및 시설관리) 자산의 관리계획을 수립하고 자산의 취득, 운영, 처분 및 평가보고, 재물조사 등을 수행함. (방송 인프라 구축) 방송기술 표준과 매체환경의 변화에 따라 전문

---

# 함수

In [None]:
OPENAI_API_KEY = "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"
os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY

# task1에서 뽑아온 키워드를 DB에서 검색 -> 관련 내용 들고 오기
def keyword_pdf(keyword):
  database = Chroma(persist_directory= f'/content/drive/MyDrive/컨퍼런스/rag/DB/{job_field}',  # 경로 지정(현 위치에서 db 폴더 생성)
                    embedding_function = OpenAIEmbeddings()
  )

  retriever = database.as_retriever(
      search_type="similarity", # Cosine Similarity
      search_kwargs={
          "k": 3, # Select top k search results
      }
  )

  qa_chain = RetrievalQA.from_chain_type(
      llm=ChatOpenAI(temperature=0, model="ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel:AIenIBIz"),
      chain_type="stuff",
      retriever=retriever,
      return_source_documents=True # source document which were used as source files
  )

  result = qa_chain.invoke(keyword)
  source_documents = result['source_documents']
  docs = [source_documents[i].page_content for i in range(len(source_documents))]
  doc = re.sub(r"\\n|\n|\"|○", "", str(docs))
  return doc

In [None]:
client = OpenAI()

def finetune_generate(job_field, previous_response): # job_field 가 디자인 또는 ICT

    for keyword in previous_response:
      doc = keyword_pdf(keyword)

      message = [
    {"role": "system", "content": f"""
        당신은 {job_field}와 {previous_response} 안에 있는 각 키워드, 각 키워드와 관련된 자료 {doc}를 바탕으로,
        각 키워드별로 비유 문장을 생성하는 전문가입니다.
        {keyword}를 강조하는 문장을 비유 표현을 사용하여 생성해주세요.
        {keyword}로 1개씩 총 5개의 문장을 생성해주세요."""},
    {"role": "user", "content": f"{job_field} 직무와 {doc}을 바탕으로 비유 문장을 생성해주세요: "},
    {"role": "user", "content": f"각 {keyword}가 포함된 자기소개 문장을 비유 표현을 사용하여 '저의 {keyword} 역량은 ~입니다.' 형식으로 작성해 주세요."}
]

      # API 호출
      response = client.chat.completions.create(
          model="ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel:AIenIBIz",
          messages=message,
          temperature=0,
          max_tokens=4096,
          top_p=1,
          frequency_penalty=0,
          presence_penalty=0
      )
      print(f"{keyword}: ")
      # print(doc)
      print(response.choices[0].message.content)
      print()

    return 'finish'

### 프롬프트 1

In [None]:
# 전 모델: ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel:AIenIBIz
job_field = "디자인"
previous_response = ["창의력", "최적화", "균형", "문제 해결", "효율성"]

f1 = finetune_generate(job_field, previous_response)
print(f1)

창의력: 
저의 창의력 역량은 마치 빛을 받아 반짝이는 다이아몬드처럼, 새로운 아이디어와 콘셉트를 도출해내는 능력입니다.

최적화: 
저의 최적화 역량은 수정사항을 신속하게 반영하는 능력과 기한 내 콘텐츠의 제작을 완료할 수 있는 프로젝트 관리 역량입니다.

균형: 
저의 균형 역량은 마치 색감의 조화처럼, 다양한 디자인 요소를 조화롭게 조합하여 완성도 높은 작품을 만들어내는 능력입니다.

문제 해결: 
저의 문제 해결 역량은 마치 새로운 아이디어와 콘셉트를 도출하는 것처럼, 다양한 이해관계자와 소통하고 요구에 대해 포용하는 자세로 문제를 해결하는 데 있습니다.

효율성: 
저의 효율성 역량은 마치 공장의 생산 라인처럼, 작업을 체계적으로 관리하고 빠르게 완료하는 능력입니다.

finish


In [None]:
# 나중 모델: ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel-withcategory-more2-shuffle:AQuN1d2D
job_field = "iCT"
previous_response = ["분석적 사고", "최적화", "균형", "문제 해결", "효율성"]

f1 = finetune_generate(job_field, previous_response)
print(f1)

분석적 사고: 
분석적 사고를 통해 문제를 파악하는 것은 마치 미세한 데이터에서 패턴을 찾는 것과 같습니다.

최적화: 
최적화는 마치 정교한 조정으로 최상의 성능을 끌어내는 것과 같습니다.

균형: 
균형을 이루는 것은 마치 저울의 양쪽 접시가 평형을 이루는 것과 같습니다.

문제 해결: 
문제 해결은 마치 어두운 길에 불을 밝혀주는 손전등과 같습니다.

효율성: 
효율성은 마치 작은 히터로도 방을 따뜻하게 하는 것과 같습니다.

finish


In [None]:
# 그냥 gpt-3.5-turbo-1106
job_field = "iCT"
previous_response = ["분석적 사고", "최적화", "균형", "문제 해결", "효율성"]

f1 = finetune_generate(job_field, previous_response)
print(f1)

분석적 사고: 
1. "저의 분석적 사고 역량은 마치 문제 해결을 위한 마법의 돋보기처럼, 복잡한 상황에서 핵심을 짚어내고 최적의 해결책을 찾아내는 데 있습니다."

2. "저의 분석적 사고 역량은 마치 미로 속에서 길을 찾아내는 나침반처럼, 혼란스러운 정보 속에서 핵심을 찾아내고 목표를 효율적으로 이루어내는 데 있습니다."

3. "저의 분석적 사고 역량은 마치 퍼즐 조각을 맞추는 것처럼, 다양한 정보를 조합하여 문제의 해답을 찾아내는 데 있습니다."

4. "저의 분석적 사고 역량은 마치 탐험가가 미지의 대륙을 발견하는 것처럼, 새로운 정보를 탐구하고 문제의 해결책을 발견하는 데 있습니다."

5. "저의 분석적 사고 역량은 마치 과학자가 실험 결과를 분석하는 것처럼, 데이터를 철저히 분석하여 현상의 원인과 결과를 파악하는 데 있습니다."

최적화: 
1. 저의 최적화 역량은 마치 공을 굴리는 것처럼, 제품 작동에 필요한 에너지를 최소화하고 설비 테스트 시간을 단축하여 효율성을 극대화하는 데에 있습니다.

2. 저의 최적화 역량은 마치 화려한 퍼포먼스를 연출하는 것처럼, 고효율 설비와 습식 스크러버 중성화를 통해 전력 사용을 최소화하고 온실가스 배출량을 최대한 줄이는 데에 있습니다.

3. 저의 최적화 역량은 마치 미세한 조정으로 완벽한 조화를 이루는 것처럼, 이미지 센서의 해상도를 최대화하고 프리뷰 동작 전력을 최소화하여 전력 효율을 향상시키는 데에 있습니다.

4. 저의 최적화 역량은 마치 엔진을 튜닝하는 것처럼, 고해상도 업스케일링 IC를 통합하고 소비전력을 낭비 최소화하여 전력 효율을 극대화하는 데에 있습니다.

5. 저의 최적화 역량은 마치 정교한 작업으로 완벽한 조화를 이루는 것처럼, 반도체 제조 공정을 최적화하여 전력 사용량을 절감하고 온실가스 배출량을 최소화하는 데에 있습니다.

균형: 
1. "저의 균형 역량은 마치 춤을 추는 듯한 것입니다. 어떤 상황에서도 안정감 있게 균형을 유지하고, 유연하게 움직이며 문제를 해결해 나갈 수 있습니다."

### 프롬프트 2

- 입력값 설정 a

In [None]:
# 함수 정의
client = OpenAI()

def finetune_generate(job_field, previous_response):

    for keyword in previous_response:
      doc = keyword_pdf(keyword)

      message = [
    {"role": "system", "content": f"""
        당신은 {job_field}와 {previous_response} 안에 있는 각 키워드, 각 키워드와 관련된 자료를 바탕으로,
        각 키워드별로 비유 문장을 생성하는 전문가입니다.
        {keyword}를 강조하는 문장을 비유 표현을 사용하여 생성해주세요."""},
    {"role": "user", "content": f"{job_field} 직무 관련 단어들과 {doc} 내용의 핵심 단어들을 바탕으로 비유 문장을 생성해주세요: "},
    {"role": "user", "content": f"각 {keyword}가 포함된 자기소개 문장을 비유 표현을 사용하여 '저의 {keyword} 역량은 ~입니다.' 형식으로 5개 문장을 작성해 주세요."}
]

      # API 호출
      response = client.chat.completions.create(
          model="ft:gpt-3.5-turbo-1106:personal:1-jobinteview-finetunemodel-withcategory-more2-shuffle:AQuN1d2D",
          messages=message,
          temperature=0,
          max_tokens=4096,
          top_p=1,
          frequency_penalty=0,
          presence_penalty=0
      )
      print(f"{keyword}: ")
      # print(doc)
      print(response.choices[0].message.content)
      print()

    return 'finish'

In [None]:
# 입력값 설정
job_field = "ICT"
previous_response = ["분석적 사고", "최적화", "균형", "문제 해결", "효율성"]

f2 = finetune_generate(job_field, previous_response)
print(f2)

분석적 사고: 
저의 분석적 사고 역량은 마치 퍼즐 조각을 맞추듯, 복잡한 데이터를 조합하여 패턴을 찾아내는 데 있습니다.
저의 분석적 사고 역량은 마치 현미경으로 세밀하게 조사하는 것처럼, 세부적인 정보를 파악하고 문제의 근본 원인을 찾아내는 데 있습니다.
저의 분석적 사고 역량은 마치 GPS처럼, 방향을 잃지 않고 데이터를 정확하게 분석하여 목표 지점을 찾아가는 데 있습니다.
저의 분석적 사고 역량은 마치 화학 실험에서 정확한 계량을 하는 것처럼, 데이터를 정확하게 측정하고 분석하여 결론을 도출하는 데 있습니다.
저의 분석적 사고 역량은 마치 수학 문제를 푸는 것처럼, 논리적으로 데이터를 분석하고 최적의 해결책을 도출하는 데 있습니다.

최적화: 
저의 최적화 역량은 마치 AMIGO 솔루션처럼, 고화질 게임을 효율적으로 구동시키는 능력입니다.
저의 최적화 역량은 이미지 센서처럼, 최대 해상도를 확보하고 동작 전력을 최소화하는 능력입니다.
저의 최적화 역량은 DTV SoC처럼, 소비전력을 최소화하고 효율적으로 기능을 통합하는 능력입니다.
저의 최적화 역량은 고해상도 업스케일링 IC처럼, 세부적인 부분까지 최적화하는 능력입니다.
저의 최적화 역량은 TCON처럼, 여러 칩을 하나로 통합하여 소비전력을 낭비하지 않는 능력입니다.

균형: 
저의 균형 역량은 마치 ICT 시스템에서 각 부분이 조화롭게 작동하는 것처럼, 다양한 요소를 조화롭게 조율하는 능력입니다.

문제 해결: 
저의 문제 해결 역량은 마치 보안의 취약점을 시험하여 문제점을 사전에 제거하는 것과 같습니다.
저의 문제 해결 역량은 마치 실시간으로 변조 여부를 감지하고 새로운 위협을 빠르고 정확하게 해결하는 것과 같습니다.
저의 문제 해결 역량은 마치 제품의 출시 의도대로 안전하게 유지될 수 있도록 변경 조작을 탐지하여 차단하는 것과 같습니다.
저의 문제 해결 역량은 마치 최신 보안 업데이트를 제공하여 진화하는 악성 앱에 대응하는 것과 같습니다.
저의 문제 해결 역량은 마치 보안의 취약점을 시험하여 문제

In [None]:
# 입력값 설정
job_field = "ICT"
previous_response = ["분석적 사고", "최적화", "균형", "문제 해결", "효율성"]

f2 = finetune_generate(job_field, previous_response)
print(f2)

분석적 사고: 
분석적 사고는 마치 작은 조각들을 모아 큰 그림을 완성하는 것과 같습니다.

최적화: 
최적화 역량은 마치 시스템의 불필요한 부분을 정리하여 최적의 상태로 만드는 것과 같습니다.

균형: 
균형을 이루는 것은 마치 모든 픽셀이 조화를 이루어 완성된 화면을 만드는 것과 같습니다.

문제 해결: 
분석적 사고는 마치 데이터의 깊이 있는 의미를 파악하는 것과 같습니다.

효율성: 
효율성은 마치 최적화된 코드로 시스템 부하를 줄이는 것과 같습니다.

finish


### 프롬프트 3