## 0. CUDA 사용 확인

In [17]:
# CUDA 사용 확인
import torch
torch.cuda.is_available()
# True인 경우 정상 작동

True

## 1. NAVER NEWS API 예시

In [23]:
import requests
from dotenv import load_dotenv
from bs4 import BeautifulSoup
import json
import os

# .env 파일 활성화
load_dotenv()

True

In [24]:
# 네이버 API 인증 정보 (ClientID와 ClientSecret)
CLIENT_ID = os.getenv('MY_CLIENT_ID')
CLIENT_SECRET = os.getenv('MY_CLIENT_SECRET')

In [25]:
# 네이버 뉴스 API 검색 URL
url = "https://openapi.naver.com/v1/search/news.json"

# 검색할 키워드
query = "AI"  # 검색할 뉴스 키워드

# 파라미터
params = {
    'query': query,  # 검색어
    'display': 100,  # 한 번에 표시할 검색 결과 개수(기본값: 10, 최댓값: 100)
    'start': 1,  # 검색 시작 위치(기본값: 1, 최댓값: 1000)
    'sort': 'date'  # 검색 결과 정렬 방법
#     sim: 정확도순으로 내림차순 정렬(기본값)
#     date: 날짜순으로 내림차순 정렬
}


# 헤더에 인증 정보 추가
headers = {
    'X-Naver-Client-Id': CLIENT_ID,
    'X-Naver-Client-Secret': CLIENT_SECRET
}

# 네이버 API에 요청
response = requests.get(url, headers=headers, params=params)

# 응답 결과 확인
if response.status_code == 200:
    data = response.json()
    print(json.dumps(data, indent=2, ensure_ascii=False))
else:
    print(f"Error Code: {response.status_code}")

{
  "lastBuildDate": "Wed, 11 Sep 2024 14:24:01 +0900",
  "total": 3395689,
  "start": 1,
  "display": 100,
  "items": [
    {
      "title": "&quot;구인·구직 커진다&quot; M&amp;A 전략 나선 취업포털",
      "originallink": "http://www.fnnews.com/news/202409110723489427",
      "link": "https://n.news.naver.com/mnews/article/014/0005240417?sid=101",
      "description": "인공지능(<b>AI</b>) 매칭 모델을 적용하기 위한 전략적 파트너십을 체결했다. 이후 지분 투자까지 이어지면서 양사간 협력이 보다 구체화될 전망이다. 실제로 원티드랩은 라프라스가 보유한 일본 현지 채용 데이터에 <b>AI</b> 매칭 채용... ",
      "pubDate": "Wed, 11 Sep 2024 14:23:00 +0900"
    },
    {
      "title": "SKT, <b>AI</b> 동시 통역 솔루션 ‘트랜스 토커’ 공급 확대",
      "originallink": "https://www.ceoscoredaily.com/page/view/2024091114201121822",
      "link": "https://www.ceoscoredaily.com/page/view/2024091114201121822",
      "description": "또 SKT는 영남대학교와도 손을 잡고 지난 7월부터 <b>AI</b> 동시 통역 서비스를 제공하고 있다. 영남대학교는 외국인... 지점’에서 <b>AI</b> 동시 통역 서비스를 운영하고, 향후 서비스 도입을 확대할 계획이다. 김경덕 SKT 엔터프라이즈... ",
      "pubDate": "Wed, 11 Sep 2024 14:22:00 +0

In [27]:
# 뉴스 본문 크롤링
def get_news_content(news_link):
    try:
        news_response = requests.get(news_link)
        news_soup = BeautifulSoup(news_response.content, 'html.parser')
        
        # 뉴스 본문 추출 (뉴스 포털마다 구조가 다를 수 있음)
        content = ""
        if 'naver.com' in news_link:
            # 예시: 네이버 뉴스 본문 크롤링 (단순화된 버전)
            article_body = news_soup.find('article')
            if article_body:
                content = article_body.get_text(strip=True)
        return content
    except Exception as e:
        print(f"Error occurred while fetching the news content: {e}")
        return ""

# 뉴스 링크마다 본문 크롤링
for item in data['items']:
    title = item['title']
    link = item['link']
    print(f"Title: {title}")
    print(f"Link: {link}")
    
    # 뉴스 본문 크롤링
    conte원티드랩, 일본 라프라스 지분 투자잡코리아, 나인하이어 경영권 확보사람인, '동네알바' 라라잡 96억 투자앞서 사람인, 베트남 앱렌서 인수도후발주자 진입에 채용시장 경쟁 '치열'"M&A 통해 지배력 강화, 해외도 진출"잡코리아 회사 내부 전경. 잡코리아 제공사람인 회사 내부 전경. 사람인 제공[파이낸셜뉴스]취업포털 운영사들이 인수합병(M&A) 시장에 뛰어 들고 있다. 꾸준히 늘어나는 국내외 구인·구직 시장에서 지배력을 높여 경쟁 우위에 서기 위함이다.11일 관련 업계에 따르면 원티드랩은 일본에서 정보기술(IT) 인재 매칭 서비스를 운영하는 라프라스에 지분을 투자했다. 원티드랩은 지난해 라프라스와 일본 채용 시장에 인공지능(AI) 매칭 모델을 적용하기 위한 전략적 파트너십을 체결했다. 이후 지분 투자까지 이어지면서 양사간 협력이 보다 구체화될 전망이다.실제로 원티드랩은 라프라스가 보유한 일본 현지 채용 데이터에 AI 매칭 채용 서비스 '원티드' 핵심 기술을 결합해 AI 이력서 코칭, 면접코칭 등 다양한 AI 서비스를 제공한다. 실제로 지난 2월 원티드 채용 당 과금 사업 모델과 운영 노하우를 적용한 '라프라스 잡 보드 플랜'을 일본 현지에 선보이기도 했다.앞서 원티드랩은 실시간 알바 매칭 플랫폼 '급구'를 운영하는 니더에 지분을 투자했다. 니더가 운영하는 급구는 맞춤형 알바 정보를 구직자와 구인자에 실시간 제공한다. 특히 구직자 이력서를 바탕으로 구인자에 적합한 인재를 추천해 빠른 채용을 돕는다. 근무 제안부터 면접, 근로계약서 작성까지 채팅으로 한 번에 진행할 수 있다.잡코리아는 채용관리 솔루션 운영업체 나인하이어를 인수한 뒤 경영권을 확보했다. 나인하이어는 채용 공고 게시부터 합격 통보에 이르는 채용 전 과정을 효율적으로 관리할 수 있도록 돕는 원스톱 인력관리(HR) 솔루션을 운영한다. 이와 관련 △채용 사이트 제작 △채용 공고 및 지원서 취합 △지원자 통합 관리 △지원자 다면 평가 △채용 데이터 분석 등을 제공한다.잡코리아는 나인하이어를 인수한 뒤 채용 공고 연동 서비스를 출시했다. 나인하이어 기업회원이 채용 공고를 게시하면, 클릭 한 번으로 잡코리아에도 공고가 등록되는 방식이다. 잡코리아에 자동 등록된 공고를 통해 나인하이어 기업회원은 더 많은 지원자를 확보할 수 잇으며, 한 번의 공고 등록을 통해 반복되는 채용 과정을 단축하는 등 양사간 시너지 효과가 가능하다.잡코리아 관계자는 "나인하이어 인수를 계기로 기업이 가장 필요로 하는 채용 솔루션 영역을 강화하고 기술 기반 경영 혁신을 선도하는 종합 커리어 플랫폼으로서 입지를 확고히 할 계획"이라고 말했다.사람인은 알바 매칭 플랫폼 '동네알바' 운영사 라라잡을 인수했다. 총 96억원을 들여 라라잡 지분 87.85%를 확보했다. 동네알바는 알바 구직자와 구인자가 거주 또는 활동하는 지역을 기반으로 일자리를 추천해주는 매칭 플랫폼이다.사람인은 라라잡 인수를 통해 채용 사업에 있어 포트폴리오를 완성하고 종합 커리어 플랫폼으로 도약을 준비하고 있다. 이와 관련 △전일제(풀타임) 일자리를 중심으로 하는 '사람인' △프리랜서 일자리를 연결하는 '사람인 긱' △알바 매칭 플랫폼 '동네알바'까지 갖췄다.사람인은 앞서 베트남 채용정보업체 앱랜서를 인수하기도 했다. 앱랜서는 베트남 2위 취업포털 '탑데브'를 운영 중이다. 사람인은 이미 국내에서 검증한 취업포털 모델을 앱렌서에 적용해 베트남 취업포털 시장에서 지배력을 강화하는 중이다.업계 관계자는 "취업포털 업계는 사람인과 잡코리아, 인크루트에 이어 원티드랩, 진학사 캐치 등이 등장하면서 치열한 경쟁이 이뤄지는 분야"라며 "이들 업체는 M&A와 전략적 협력 전략을 통해 시장 지배력을 강화하는 한편, 해외 시장 진출을 모색 중"이라고 말했다.nt = get_news_content(link)
    print(f"Content: {content}\n")

Title: &quot;구인·구직 커진다&quot; M&amp;A 전략 나선 취업포털
Link: https://n.news.naver.com/mnews/article/014/0005240417?sid=101
Content: 원티드랩, 일본 라프라스 지분 투자잡코리아, 나인하이어 경영권 확보사람인, '동네알바' 라라잡 96억 투자앞서 사람인, 베트남 앱렌서 인수도후발주자 진입에 채용시장 경쟁 '치열'"M&A 통해 지배력 강화, 해외도 진출"잡코리아 회사 내부 전경. 잡코리아 제공사람인 회사 내부 전경. 사람인 제공[파이낸셜뉴스]취업포털 운영사들이 인수합병(M&A) 시장에 뛰어 들고 있다. 꾸준히 늘어나는 국내외 구인·구직 시장에서 지배력을 높여 경쟁 우위에 서기 위함이다.11일 관련 업계에 따르면 원티드랩은 일본에서 정보기술(IT) 인재 매칭 서비스를 운영하는 라프라스에 지분을 투자했다. 원티드랩은 지난해 라프라스와 일본 채용 시장에 인공지능(AI) 매칭 모델을 적용하기 위한 전략적 파트너십을 체결했다. 이후 지분 투자까지 이어지면서 양사간 협력이 보다 구체화될 전망이다.실제로 원티드랩은 라프라스가 보유한 일본 현지 채용 데이터에 AI 매칭 채용 서비스 '원티드' 핵심 기술을 결합해 AI 이력서 코칭, 면접코칭 등 다양한 AI 서비스를 제공한다. 실제로 지난 2월 원티드 채용 당 과금 사업 모델과 운영 노하우를 적용한 '라프라스 잡 보드 플랜'을 일본 현지에 선보이기도 했다.앞서 원티드랩은 실시간 알바 매칭 플랫폼 '급구'를 운영하는 니더에 지분을 투자했다. 니더가 운영하는 급구는 맞춤형 알바 정보를 구직자와 구인자에 실시간 제공한다. 특히 구직자 이력서를 바탕으로 구인자에 적합한 인재를 추천해 빠른 채용을 돕는다. 근무 제안부터 면접, 근로계약서 작성까지 채팅으로 한 번에 진행할 수 있다.잡코리아는 채용관리 솔루션 운영업체 나인하이어를 인수한 뒤 경영권을 확보했다. 나인하이어는 채용 공고 게시부터 합격 통보에 이르는 채용 전 과정을 효율적으로 관리할 수 있도록

## 2. Transformers 예시

In [16]:
from transformers import PreTrainedTokenizerFast, BartForConditionalGeneration
import re

# KoBART 모델과 토크나이저 로드
tokenizer = PreTrainedTokenizerFast.from_pretrained('gogamza/kobart-base-v1')
model = BartForConditionalGeneration.from_pretrained('gogamza/kobart-base-v1')

# 텍스트 전처리 함수 (특수 문자 제거)
def clean_text(text):
    # 한글과 공백을 제외한 특수 문자 제거
    text = re.sub(r'[^가-힣\s]', '', text)
    # 연속된 공백을 하나로 변환
    text = re.sub(r'\s+', ' ', text).strip()
    return text

# 텍스트를 일정 길이로 나누는 함수
def chunk_text(text, max_length=512):
    words = text.split()
    for i in range(0, len(words), max_length):
        yield ' '.join(words[i:i + max_length])

# 요약할 한국어 뉴스 텍스트
news_text = """
성진이가 밥을 먹었다.
"""

# 전처리된 텍스트
cleaned_news_text = clean_text(news_text)

# 뉴스 텍스트를 나누고 각 부분 요약
summaries = []
for chunk in chunk_text(cleaned_news_text, max_length=512):
    input_ids = tokenizer.encode(chunk, return_tensors='pt')
    summary_ids = model.generate(input_ids, max_length=150, num_beams=5, early_stopping=True)
    summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
    summaries.append(summary)

# 모든 요약을 하나로 병합
final_summary = " ".join(summaries)

print("최종 요약 결과:", final_summary)


You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.
You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.


최종 요약 결과: 먼저 채용 없이 채용 채용히히히히히히히히히히히히히히히히히히히히히히히히 많이 채용 채용 시장 시장 먼저 먼저 채용히히히히히히히히 많이 많이 많이 많이 많이 많이 인 인 인 인 순 순 순 순 순순순순순시장시장 시장 시장 시장 시장 경쟁 치열 치열 통해 지배력 강화 해외도인 사람인 사람인 것 하나 하나 사람인 제공파이대한뉴스 취업포털 운영사들이 인수합병 시장에 뛰어 들고 있다 꾸준히 늘어나는 국내외 구인구직 시장에서 지배력을 높여 경쟁 우위에 서기기기 위함이다다일 관련 업계에 따르면 원 원 원히히히히히히히히히 채용 채용을 채용 채용을


In [10]:
# from transformers import PreTrainedTokenizerFast, BartForConditionalGeneration

# # KoBART 모델과 토크나이저 로드
# tokenizer = PreTrainedTokenizerFast.from_pretrained('gogamza/kobart-base-v1')
# model = BartForConditionalGeneration.from_pretrained('gogamza/kobart-base-v1')

# # 요약할 한국어 뉴스 텍스트
# news_text = """
# 테일러 스위프트 인스타그램 게시물 갈무리세계적인 팝스타 테일러 스위프트가 오는 11월 대선에서 민주당 후보인 카멀라 해리스 부통령을 지지한다고 10일(현지시각) 밝혔다. 미국 젊은 층에 영향력이 큰 그가 해리스 부통령 지지 선언을 하면서 초접전 양상으로 치달은 이번 대선에 미칠 영향이 적지 않을 것으로 관측된다.스위프트는 이날 자신의 인스타그램에 글을 올려 “2024년 대선에서 카멀라 해리스와 팀 월즈에게 투표할 예정”이라고 공개적으로 밝혔다. 그는 이어 “해리스가 권리와 대의를 위해 싸운다”며 “그들을 옹호할 전사가 필요하다고 믿기 때문”이라고 했다. 또 “그가 안정적이고 재능있는 지도자라고 생각한다”, “혼란이 아닌 침착함으로 이 나라에서 더 많은 것들을 성취할 수 있다고 믿는다”고 했다.스위프트는 아울러 “수십 년 동안 성 소수자의 권리와 시험관 시술(IVF), 여성 그 자신의 몸에 대한 권리 등을 지지해 온 팀 월즈를 러닝메이트로 선택한 것에 대해 고무됐고 깊은 인상을 받았다”고 했다.스위프트는 게시글 초반에는 이날 열린 미국 대선 후보 텔레비전 토론회에 대해 언급하며 “아직 보지 않으셨다면, 중요한 주제와 이슈에 대한 후보자들의 입장을 알 수 있는 좋은 시기”라고 관심을 촉구했다. 또 이날 자신의 지지 후보를 밝히게 된 이유로는 “최근 도널드 트럼프 전 대통령의 대선 출마를 지지한다는 ‘나’의 인공지능(AI)이 그의 사이트에 게시돼 있다는 사실을 알게 됐다. 인공지능에 대한 두려움, 잘못된 정보 확산 등의 위험성이 떠오르게 했다”며 “유권자로서 이번 선거에 대한 나의 실제 계획을 투명하게 알려야 한다고 결론 내렸다”고 설명했다.스위프트는 그러면서 “나는 찾았고 선택했다. 여러분의 조사는 여러분이 해야 하는 것”이라며 “선택은 여러분의 몫”이라고 강조했다. 또 “특히 처음 투표하는 유권자들에게 말하고 싶다. 투표하려면 등록해야 한다는 것을 기억해야 한다. 사전 투표는 훨씬 쉬워졌다. 어디에서 등록할 수 있는지, 사전투표 일정과 관련 정보는 스토리에 올리겠다”고 했다.그는 마지막에 “테일러 스위프트, 자식 없는 캣 레이디(Childless Cat Lady)”라고 적었다. 이는 제이 디(J. D) 밴스 공화당 부통령 후보가 2021년 인터뷰에서 해리스 부통령 등을 겨냥해 “자식이 없는 ‘캣 레이디’(cat lady)들이 사실상 국가를 운영하고 있고, 이들은 미국을 자신의 인생처럼 비참하게 만들려고 한다”고 주장한 것을 비판한 것이다.스위프트는 인스타그램 팔로어가 2억8천만명에 달하는 세계 최정상 가수로 여느 정·재계 인사들과 견줘 영향력이 뒤지지 않는다. 트럼프 전 대통령은 지난달 20일 자신의 소셜미디어에 자신이 스위프트의 지지를 받았다는 조작 사진을 게시해 논란을 일으킨 바 있다.
# """

# # 인코딩
# input_ids = tokenizer.encode(news_text, return_tensors='pt')

# # 모델을 사용해 요약 생성
# summary_ids = model.generate(input_ids, max_length=100, num_beams=4, early_stopping=True)

# # 요약 결과 디코딩
# summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
# print("요약 결과:", summary)

You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.
You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.


요약 결과: “ “에 앞서 앞서 앞서   갈무리세계적인 팝스타 테일러 스위프트가 오는 11월 대선에서 민주당 후보인 카멀라 해리스 부통령을 지지한다고 10일(현지시각) 밝혔다. 미국 젊은 층에 영향력이 큰 그가 해리스 부통령 지지 선언을 하면서 초접전 양상으로 치달은 이번접전 양상으로 치달은 이번 대선에 미칠 영향이 적지 않을 것으로 관측된다.스위프트는 이날 자신의 인스타그램에 글을 올려 “ “ “


In [12]:
# from transformers import PreTrainedTokenizerFast, BartForConditionalGeneration

# # KoBART 모델과 토크나이저 로드
# tokenizer = PreTrainedTokenizerFast.from_pretrained('gogamza/kobart-base-v1')
# model = BartForConditionalGeneration.from_pretrained('gogamza/kobart-base-v1')

# # 요약할 한국어 뉴스 텍스트
# news_text = """
# 한국 경제는 현재 다양한 도전 과제에 직면해 있다. 최근 발표된 통계에 따르면 경제 성장률이 둔화되고 있으며, 
# 특히 수출 감소와 물가 상승이 주요 원인으로 꼽히고 있다. 전문가들은 이러한 경제적 어려움을 해결하기 위해 
# 정부의 적극적인 개입이 필요하다고 주장하고 있다.
# """

# # 인코딩
# input_ids = tokenizer.encode(news_text, return_tensors='pt')

# # 모델을 사용해 요약 생성
# summary_ids = model.generate(input_ids, max_length=100, num_beams=4, early_stopping=True)

# # 요약 결과 디코딩
# summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
# print("요약 결과:", summary)

You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.
You passed along `num_labels=3` with an incompatible id to label map: {'0': 'NEGATIVE', '1': 'POSITIVE'}. The number of labels wil be overwritten to 2.


요약 결과: 반면,침해하였으며,하였으며,퍽퍽퍽퍽퍽퍽퍽퍽퍽퍽퍽퍽 클래식 클래식 클래식 클래식 클래식 클래식 클래식특히 수출 감소와 수출 감소와 물가 상승이 주요 원인으로 근 근 추 추 추 추 추 추 추 추 추 하고 하고 하고 하고 하고 하고 하고 있다. 있다.하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,에에정에 적극적인 개입이 필요하다고 주장하고 주장하고 주장하고 교실 교실간의 적극적인 개입이 필요하다고 주장하고 주장하고 교실 교실간의 적극적인 개입이 필요하다고 주장하고하였으며,하였으며,하였으며,하였으며,하였으며,하였으며,
