# 구현

### 네이버 뉴스 크롤링

In [1]:
import requests
from bs4 import BeautifulSoup
import bs4.element
import datetime

# BeautifulSoup 객체 생성
def get_soup_obj(url):
    headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'}
    res = requests.get(url, headers = headers)
    soup = BeautifulSoup(res.text,'lxml')

    return soup


# 뉴스의 기본 정보 가져오기
def get_top3_news_info(sec, sid):
    # 임시 이미지
    default_img = "https://search.naver.com/search.naver?where=image&sm=tab_jum&query=naver#"

    # 해당 분야 상위 뉴스 목록 주소
    sec_url = "https://news.naver.com/main/list.nhn?mode=LSD&mid=sec" \
            + "&sid1=" \
            + sid
    print("section url : ", sec_url)

    # 해당 분야 상위 뉴스 HTML 가져오기
    soup = get_soup_obj(sec_url)

    # 해당 분야 상위 뉴스 3개 가져오기
    news_list3 = []
    lis3 = soup.find('ul', class_='type06_headline').find_all("li", limit=3)
    for li in lis3:
        # title : 뉴스 제목, news_url : 뉴스 URL, image_url : 이미지 URL
        news_info = {
            "title" : li.img.attrs.get('alt') if li.img else li.a.text.replace("\n", "").replace("\t","").replace("\r","") ,
            "date" : li.find(class_="date").text,
            "news_url" : li.a.attrs.get('href'),
            "image_url" : li.img.attrs.get('src') if li.img else default_img
        }
        news_list3.append(news_info)

    return news_list3

# 뉴스 본문 가져오기
def get_news_contents(url):
    soup = get_soup_obj(url)
    body = soup.find('div', class_="_article_body")

    news_contents = ''
    for content in body:
        if type(content) is bs4.element.NavigableString and len(content) > 50:
            # content.strip() : whitepace 제거 (참고 : https://www.tutorialspoint.com/python3/string_strip.htm)
            # 뉴스 요약을 위하여 '.' 마침표 뒤에 한칸을 띄워 문장을 구분하도록 함
            news_contents += content.strip() + ' '

    return news_contents


# '정치', '경제', '사회' 분야의 상위 3개 뉴스 크롤링
def get_naver_news_top3():
    # 뉴스 결과를 담아낼 dictionary
    news_dic = dict()

    # sections : '정치', '경제', '사회'
    sections = ["pol", "eco","soc"]
    # section_ids : URL에 사용될 뉴스 각 부문 ID
    section_ids = ["100", "101","102"]

    for sec, sid in zip(sections, section_ids):
        # 뉴스의 기본 정보 가져오기
        news_info = get_top3_news_info(sec, sid)
        #print(news_info)
        for news in news_info:
            # 뉴스 본문 가져오기
            news_url = news['news_url']
            news_contents = get_news_contents(news_url)

            # 뉴스 정보를 저장하는 dictionary를 구성
            news['news_contents'] = news_contents

        news_dic[sec] = news_info

    return news_dic

# 함수 호출 - '정치', '경제', '사회' 분야의 상위 3개 뉴스 크롤링
news_dic = get_naver_news_top3()
# 경제의 첫번째 결과 확인하기
news_dic['eco'][0]

section url :  https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100
section url :  https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=101
section url :  https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=102


{'title': '김영섭 KT 대표, 세계이통사업자聯 이사회 멤버 선임',
 'date': '10분전',
 'news_url': 'https://n.news.naver.com/mnews/article/005/0001734322?sid=101',
 'image_url': 'https://imgnews.pstatic.net/image/origin/005/2024/10/28/1734322.jpg?type=nf106_72',
 'news_contents': ''}

### 뉴스 요약

In [4]:
import requests
from bs4 import BeautifulSoup

# BeautifulSoup 객체 생성
def get_soup_obj(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'
    }
    res = requests.get(url, headers=headers)
    
    if res.status_code != 200:
        print(f"HTTP 오류 발생: {res.status_code}")
        return None

    soup = BeautifulSoup(res.text, 'lxml')
    return soup

# 뉴스의 기본 정보 가져오기
def get_top3_news_info(sec, sid):
    default_img = "https://search.naver.com/search.naver?where=image&sm=tab_jum&query=naver#"
    sec_url = f"https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1={sid}"
    print("section url:", sec_url)

    soup = get_soup_obj(sec_url)
    news_list3 = []
    lis3 = soup.find('ul', class_='type06_headline').find_all("li", limit=3)
    for li in lis3:
        news_info = {
            "title": li.img.attrs.get('alt') if li.img else li.a.text.replace("\n", "").replace("\t", "").replace("\r", ""),
            "date": li.find(class_="date").text,
            "news_url": li.a.attrs.get('href'),
            "image_url": li.img.attrs.get('src') if li.img else default_img
        }
        news_list3.append(news_info)

    return news_list3

# 뉴스 본문 가져오기
def get_news_contents(url):
    soup = get_soup_obj(url)
    if soup is None:
        return "본문을 가져올 수 없습니다."

    # <article> 태그에서 본문 찾기
    body = soup.find('article', id='dic_area')
    if body is None:
        print(f"본문을 찾을 수 없습니다: {url}")
        return "본문을 가져올 수 없습니다."

    news_contents = ''
    for content in body.find_all(['p', 'span', 'b', 'strong', 'em'], recursive=True):
        text = content.get_text(strip=True)
        if text:  # 내용이 있는 경우만 추가
            news_contents += text + ' '

    # 중복된 내용 제거
    news_contents = remove_duplicates(news_contents)
    
    return news_contents.strip()

# 중복된 문장 제거 함수
def remove_duplicates(text):
    seen = set()
    unique_lines = []
    for line in text.split('\n'):
        if line.strip() and line not in seen:  # 빈 줄 및 중복 제거
            seen.add(line)
            unique_lines.append(line)
    return '\n'.join(unique_lines)

# '정치', '경제', '사회' 분야의 상위 3개 뉴스 크롤링
def get_naver_news_top3():
    news_dic = dict()
    sections = ["pol", "eco", "soc"]
    section_ids = ["100", "101", "102"]

    for sec, sid in zip(sections, section_ids):
        news_info = get_top3_news_info(sec, sid)
        for news in news_info:
            news_url = news['news_url']
            news_contents = get_news_contents(news_url)
            news['news_contents'] = news_contents

        news_dic[sec] = news_info

    return news_dic

# 함수 호출 - '정치', '경제', '사회' 분야의 상위 3개 뉴스 크롤링
news_dic = get_naver_news_top3()

# 경제의 첫번째 결과 확인하기
for news in news_dic['eco']:
    print(f"제목: {news['title']}")
    print(f"날짜: {news['date']}")
    print(f"뉴스 URL: {news['news_url']}")
    print(f"본문: {news['news_contents']}\n")


section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100
section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=101
section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=102
제목: 김영섭 KT 대표, 세계이통사업자聯 이사회 멤버 선임
날짜: 12분전
뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734322?sid=101
본문: 사진

제목: 최태원 대한상의 회장, APEC CEO 서밋 의장 맡는다
날짜: 13분전
뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734321?sid=101
본문: 사진

제목: 에코프로그룹 에코프로이엠 제대군인 고용 우수기업 인증
날짜: 15분전
뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734319?sid=101
본문: 사진



In [28]:
import requests
from bs4 import BeautifulSoup
from gensim.summarization.summarizer import summarize

# BeautifulSoup 객체 생성
def get_soup_obj(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36'}
    res = requests.get(url, headers=headers)
    
    if res.status_code != 200:
        print(f"HTTP 오류 발생: {res.status_code}")
        return None

    soup = BeautifulSoup(res.text, 'lxml')
    return soup

# 뉴스의 기본 정보 가져오기
def get_top3_news_info(sec, sid):
    default_img = "https://search.naver.com/search.naver?where=image&sm=tab_jum&query=naver#"
    sec_url = f"https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1={sid}"
    print("section url:", sec_url)

    soup = get_soup_obj(sec_url)
    news_list3 = []
    lis3 = soup.find('ul', class_='type06_headline').find_all("li", limit=3)
    for li in lis3:
        news_info = {
            "title": li.img.attrs.get('alt') if li.img else li.a.text.replace("\n", "").replace("\t", "").replace("\r", ""),
            "date": li.find(class_="date").text,
            "news_url": li.a.attrs.get('href'),
            "image_url": li.img.attrs.get('src') if li.img else default_img
        }
        news_list3.append(news_info)

    return news_list3

# 뉴스 본문 가져오기
def get_news_contents(url):
    soup = get_soup_obj(url)
    if soup is None:
        return "본문을 가져올 수 없습니다."
    
    # 본문 가져오기 시도
    body = soup.find('div', class_="_article_body")
    if not body:
        body = soup.find('div', class_="article")
    
    if not body:
        body = soup.find('div', class_="news_end")  # 추가 시도

    if body:
        news_contents = ''
        for content in body.find_all(['p', 'span', 'b'], recursive=True):
            news_contents += content.get_text(strip=True) + ' '
    else:
        news_contents = "본문을 가져올 수 없습니다."
        
    return news_contents.strip()

# '정치', '경제', '사회' 분야의 상위 3개 뉴스 크롤링
def get_naver_news_top3():
    news_dic = dict()
    sections = ["pol", "eco", "soc"]
    section_ids = ["100", "101", "102"]

    for sec, sid in zip(sections, section_ids):
        news_info = get_top3_news_info(sec, sid)
        for news in news_info:
            news_url = news['news_url']
            news_contents = get_news_contents(news_url)
            news['news_contents'] = news_contents

        news_dic[sec] = news_info

    return news_dic

# 뉴스 크롤링
news_dic = get_naver_news_top3()

# 섹션 지정
my_section = 'eco'
news_list3 = news_dic[my_section]

# 뉴스 요약하기
for news_info in news_list3:
    try:
        snews_contents = summarize(news_info['news_contents'], word_count=20)
    except:
        snews_contents = None

    if not snews_contents:
        news_sentences = news_info['news_contents'].split('.')
        if len(news_sentences) > 3:
            snews_contents = '.'.join(news_sentences[:3]) + '.'
        else:
            snews_contents = '.'.join(news_sentences) + '.'

    news_info['snews_contents'] = snews_contents

# 요약 결과 출력
for i in range(len(news_list3)):
    print(f"==== {i + 1}번째 뉴스 원문 ====")
    print(news_list3[i]['news_contents'])
    print("\n==== 요약문 ====")
    print(news_list3[i]['snews_contents'])
    print("\n" + "=" * 50 + "\n")


section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100
section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=101
section url: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=102
==== 1번째 뉴스 원문 ====
희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”

==== 요약문 ====
희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”.


==== 2번째 뉴스 원문 ====
안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩

==== 요약문 ====
안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩.


==== 3번째 뉴스 원문 ====
(서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024.5.8/뉴스1

==== 요약문 ====
(서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024.




In [29]:
from gensim.summarization.summarizer import summarize

# 섹션 지정
my_section = 'eco'
news_list3 = news_dic[my_section]

# 뉴스 요약하기
for index, news_info in enumerate(news_list3):
    # 뉴스 본문이 10 문장 이하일 경우 결과가 반환되지 않음.
    # 이때는 요약하지 않고 본문에서 앞 3문장을 사용함.
    try:
        snews_contents = summarize(news_info['news_contents'], word_count=20)
    except:
        snews_contents = None

    if not snews_contents:
        news_sentences = news_info['news_contents'].split('.')

        if len(news_sentences) > 3:
            snews_contents = '.'.join(news_sentences[:3])
        else:
            snews_contents = '.'.join(news_sentences)

    news_info['snews_contents'] = snews_contents
    
    # 요약 결과 출력
    print(f"==== {index + 1}번째 뉴스 원문 ====")
    print(news_info['news_contents'])
    print("\n==== 요약문 ====")
    print(news_info['snews_contents'])
    print("\n" + "="*30 + "\n")  # 구분선 추가


==== 1번째 뉴스 원문 ====
희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”

==== 요약문 ====
희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”


==== 2번째 뉴스 원문 ====
안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩

==== 요약문 ====
안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩


==== 3번째 뉴스 원문 ====
(서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024.5.8/뉴스1

==== 요약문 ====
(서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024




## Step3) 카카오 메시지 보내기 위한 사전 준비하기

In [30]:
import requests
import json

url = "https://kauth.kakao.com/oauth/token"

data = {
    "grant_type" : "authorization_code",
    "client_id" : "96e5920417ef9ae5c452947b96b1a4f7",
    "redirect_uri" : "https://localhost.com",
    "code"         : "YEyFn6ei6pmDHBSf4RLSjtcCVny2vuoaq1cuviDJEf23NMtPvBDLJAAAAAQKKiWQAAABks9kGQGYFzyUYZmfhQ"

    
}
response = requests.post(url, data=data)

tokens = response.json()

print(tokens)
with open("kakao_token.json", "w") as fp:
    json.dump(tokens, fp)

{'access_token': '09lBjYG-v6geZx1T6tKA9T6IZspWBHLuAAAAAQo9c04AAAGSz2Ug80PPWzORmYVE', 'token_type': 'bearer', 'refresh_token': '_24sN7zXpVQitQKWXxSINum4N0Fasdu-AAAAAgo9c04AAAGSz2Ug8EPPWzORmYVE', 'id_token': 'eyJraWQiOiI5ZjI1MmRhZGQ1ZjIzM2Y5M2QyZmE1MjhkMTJmZWEiLCJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJhdWQiOiI5NmU1OTIwNDE3ZWY5YWU1YzQ1Mjk0N2I5NmIxYTRmNyIsInN1YiI6IjM3Njc4NzAzNzMiLCJhdXRoX3RpbWUiOjE3MzAwNTYzNjQsImlzcyI6Imh0dHBzOi8va2F1dGgua2FrYW8uY29tIiwibmlja25hbWUiOiLsiojsqKkiLCJleHAiOjE3MzAwNzc5NjQsImlhdCI6MTczMDA1NjM2NCwicGljdHVyZSI6Imh0dHBzOi8vay5rYWthb2Nkbi5uZXQvZG4vY3hCdmVyL2J0ckw4eHcyNTdYLzllTFZ2UFJPbnJIOXF6RlpOTUxpazAvaW1nXzExMHgxMTAuanBnIn0.lgzMAIGX2RGJoidWdQi7WKx_avsHey6-jqJnDN5y2H6BJ89oZjq4znhtbdEliIEDor3YdEXMFsKVbhs9_pOvJxKA1zdN9_jb65gG2DREytdad9OUNnWicV5FRmRhNmp-SOqEnYfjicxV5CfhhrK5d0LkqXE_O4uh7xWTj2uXia7qH6lPerYRKsD8vQNUE5DFVZmAq6IwfzMK5XcJSq2kGwuzrPYefNZ7BpW89myIeZ5pOi9AAqeY20C48LLeAQRxgBY2TI2lVa_60W54TASfP8sz8QiRtZGWsGJM2lM8oX6x60F0l2tBBWKroEbM2B--Vy30mKYcI8RUil5ztl3uqw', 'ex

In [53]:
import json
import kakao_utils

#token이 저장된 파일
KAKAO_TOKEN_FILENAME = "C:/Users/Administrator/Documents/진수포폴/news_summarize/News_Summarize/kakao_token.json"
KAKAO_APP_KEY = "96e5920417ef9ae5c452947b96b1a4f7"
kakao_utils.update_tokens(KAKAO_APP_KEY, KAKAO_TOKEN_FILENAME)

{'access_token': 'elq5GsZyldA9IaSo3UCYB5IpUymacDakAAAAAQo8JJoAAAGSz23t60PPWzORmYVE', 'token_type': 'bearer', 'id_token': 'eyJraWQiOiI5ZjI1MmRhZGQ1ZjIzM2Y5M2QyZmE1MjhkMTJmZWEiLCJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJhdWQiOiI5NmU1OTIwNDE3ZWY5YWU1YzQ1Mjk0N2I5NmIxYTRmNyIsInN1YiI6IjM3Njc4NzAzNzMiLCJhdXRoX3RpbWUiOjE3MzAwNTYzNjQsImlzcyI6Imh0dHBzOi8va2F1dGgua2FrYW8uY29tIiwibmlja25hbWUiOiLsiojsqKkiLCJleHAiOjE3MzAwNzg1NDEsImlhdCI6MTczMDA1Njk0MSwicGljdHVyZSI6Imh0dHBzOi8vay5rYWthb2Nkbi5uZXQvZG4vY3hCdmVyL2J0ckw4eHcyNTdYLzllTFZ2UFJPbnJIOXF6RlpOTUxpazAvaW1nXzExMHgxMTAuanBnIn0.Ue2plR6C3M0hGNrZCtMCYk55W_8qIj-4C44z9MAogMbIuNynsCW-Np6YMBiutIurjFM1Gjrvf50llH941_ew1RLQJhDELAVY3eUwl-860a20M6jDVQ_P_k9mPwEyGFz59gZqqrNt3QeUOiv6_V2iu6KDkVuOFfrSLMz_V8kJafJ_5__orQGQhN6zA416qdD_W1gMybGuCrMBA3F3nd9D8PB5oLc_FSca0d4doc42kDrIF9R7OJLSFO8yuZgPidRL9wUqLpTsjD8Fl7CRZ062ZWhn8yL_gCX8juGKBDuwDkkPOUNKVDnl49gw2kkPQxgQfFC7unhfeDaPhNxRnocRZw', 'expires_in': 21599}


{'access_token': 'elq5GsZyldA9IaSo3UCYB5IpUymacDakAAAAAQo8JJoAAAGSz23t60PPWzORmYVE',
 'token_type': 'bearer',
 'refresh_token': '_24sN7zXpVQitQKWXxSINum4N0Fasdu-AAAAAgo9c04AAAGSz2Ug8EPPWzORmYVE',
 'id_token': 'eyJraWQiOiI5ZjI1MmRhZGQ1ZjIzM2Y5M2QyZmE1MjhkMTJmZWEiLCJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJhdWQiOiI5NmU1OTIwNDE3ZWY5YWU1YzQ1Mjk0N2I5NmIxYTRmNyIsInN1YiI6IjM3Njc4NzAzNzMiLCJhdXRoX3RpbWUiOjE3MzAwNTYzNjQsImlzcyI6Imh0dHBzOi8va2F1dGgua2FrYW8uY29tIiwibmlja25hbWUiOiLsiojsqKkiLCJleHAiOjE3MzAwNzc5NjQsImlhdCI6MTczMDA1NjM2NCwicGljdHVyZSI6Imh0dHBzOi8vay5rYWthb2Nkbi5uZXQvZG4vY3hCdmVyL2J0ckw4eHcyNTdYLzllTFZ2UFJPbnJIOXF6RlpOTUxpazAvaW1nXzExMHgxMTAuanBnIn0.lgzMAIGX2RGJoidWdQi7WKx_avsHey6-jqJnDN5y2H6BJ89oZjq4znhtbdEliIEDor3YdEXMFsKVbhs9_pOvJxKA1zdN9_jb65gG2DREytdad9OUNnWicV5FRmRhNmp-SOqEnYfjicxV5CfhhrK5d0LkqXE_O4uh7xWTj2uXia7qH6lPerYRKsD8vQNUE5DFVZmAq6IwfzMK5XcJSq2kGwuzrPYefNZ7BpW89myIeZ5pOi9AAqeY20C48LLeAQRxgBY2TI2lVa_60W54TASfP8sz8QiRtZGWsGJM2lM8oX6x60F0l2tBBWKroEbM2B--Vy30mKYcI8RUil5ztl3uqw',


## Step4) 리스트 템플릿으로 뉴스 목록 전송하기

In [34]:
# 사용자가 선택한 카테고리를 제목에 넣기 위한 dictionary
sections_ko = {'pol': '정치', 'eco' : '경제', 'soc' : '사회'}

# 네이버 뉴스 URL
navernews_url = "https://news.naver.com/main/home.nhn"

# 추후 각 리스트에 들어갈 내용(content) 만들기
contents = []

# 리스트 템플릿 형식 만들기
template = {
    "object_type" : "list",
    "header_title" : sections_ko[my_section] + " 분야 상위 뉴스 빅3",
    "header_link" : {
        "web_url": navernews_url,
        "mobile_web_url" : navernews_url
    },
    "contents" : contents,
    "button_title" : "네이버 뉴스 바로가기"
}
## 내용 만들기
# 각 리스트에 들어갈 내용(content) 만들기
for news_info in news_list3:
    content = {
        "title" : news_info.get('title'),
        "description" : "작성일 : " + news_info.get('date'),
        "image_url" : news_info.get('image_url'),
        "image_width" : 50, "image_height" : 50,
        "link": {
            "web_url": news_info.get('news_url'),
            "mobile_web_url": news_info.get('news_url')
        }
    }

    contents.append(content)

# 카카오톡 메시지 전송
res = kakao_utils.send_message(KAKAO_TOKEN_FILENAME, template)
if res.json().get('result_code') == 0:
    print('뉴스를 성공적으로 보냈습니다.')
else:
    print('뉴스를 성공적으로 보내지 못했습니다. 오류메시지 : ', res.json())

뉴스를 성공적으로 보냈습니다.


In [35]:
import json
import kakao_utils

# 사용자 선택 카테고리를 위한 dictionary
sections_ko = {'pol': '정치', 'eco': '경제', 'soc': '사회'}
navernews_url = "https://news.naver.com/main/home.nhn"
my_section = 'eco'  # 사용자 선택 섹션

# 뉴스 리스트 데이터를 기반으로 내용을 설정
news_list3 = [
    {"title": "뉴스 제목 1", "date": "2024-10-28", "news_url": "https://news1.url", "image_url": "https://image1.url"},
    {"title": "뉴스 제목 2", "date": "2024-10-28", "news_url": "https://news2.url", "image_url": "https://image2.url"},
    {"title": "뉴스 제목 3", "date": "2024-10-28", "news_url": "https://news3.url", "image_url": "https://image3.url"}
]

# 리스트 템플릿 형식 만들기
contents = []
template = {
    "object_type": "list",
    "header_title": sections_ko.get(my_section, '뉴스') + " 분야 상위 뉴스 빅3",
    "header_link": {
        "web_url": navernews_url,
        "mobile_web_url": navernews_url
    },
    "contents": contents,
    "buttons": [
        {
            "title": "네이버 뉴스 바로가기",
            "link": {
                "web_url": navernews_url,
                "mobile_web_url": navernews_url
            }
        }
    ]
}

# 각 뉴스에 대한 content 생성
for news_info in news_list3:
    content = {
        "title": news_info.get("title", "제목 없음"),
        "description": "작성일: " + news_info.get("date", "날짜 없음"),
        "image_url": news_info.get("image_url", "https://example.com/default.jpg"),
        "image_width": 50,
        "image_height": 50,
        "link": {
            "web_url": news_info.get("news_url", navernews_url),
            "mobile_web_url": news_info.get("news_url", navernews_url)
        }
    }
    contents.append(content)

# 카카오톡 메시지 전송
res = kakao_utils.send_message(KAKAO_TOKEN_FILENAME, template)
if res.json().get("result_code") == 0:
    print("뉴스를 성공적으로 보냈습니다.")
else:
    print("뉴스를 성공적으로 보내지 못했습니다. 오류메시지 : ", res.json())


뉴스를 성공적으로 보냈습니다.


## Step5) 텍스트 템플릿으로 뉴스 요약본 전송하기

In [41]:
from gensim.summarization.summarizer import summarize

# 섹션 지정
my_section = 'eco'
news_list3 = news_dic[my_section]

# 뉴스 요약하기
for news_info in news_list3:
    try:
        # 요약하기
        snews_contents = summarize(news_info['news_contents'], word_count=20)
    except Exception as e:
        print(f"요약 중 오류 발생: {e}")
        snews_contents = None

    # 요약문이 없는 경우 첫 3문장을 사용
    if not snews_contents:
        news_sentences = news_info['news_contents'].split('.')
        snews_contents = '.'.join(news_sentences[:3]) if len(news_sentences) > 3 else '.'.join(news_sentences)

    # 요약 결과 저장
    news_info['snews_contents'] = snews_contents

    # 요약 내용 확인 로그
    print(f"제목: {news_info['title']}")
    print(f"요약 내용: {news_info['snews_contents']}")

# 카카오톡 메시지 전송
for idx, news_info in enumerate(news_list3):
    # 요약문이 없을 경우 기본 메시지로 대체
    snews_contents = news_info.get('snews_contents', '요약 정보를 불러올 수 없습니다.')
    
    # 텍스트 템플릿 형식 만들기
    template = {
        "object_type": "text",
        "text": '# 제목 : ' + news_info.get('title') + \
                '\n\n# 요약 : ' + snews_contents,
        "link": {
            "web_url": news_info.get('news_url'),
            "mobile_web_url": news_info.get('news_url')
        },
        "button_title": "자세히 보기"
    }
    
    # 카카오톡 메시지 전송
    res = kakao_utils.send_message(KAKAO_TOKEN_FILENAME, template)
    if res.json().get('result_code') == 0:
        print(f'{idx + 1}번째 뉴스가 성공적으로 전송되었습니다.')
    else:
        print(f'{idx + 1}번째 뉴스를 전송하지 못했습니다. 오류메시지 : ', res.json())


요약 중 오류 발생: input must have more than one sentence
제목: 20대 비정규직 ‘역대급’?…“일하고 싶을 때만 한다”
요약 내용: 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”
요약 중 오류 발생: input must have more than one sentence
제목: "피싱메일·스미싱 잡는 AI…고객별 맞춤 보안 제공할 것"
요약 내용: 안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩
제목: 산업부, AI 전담부서 만든다…직제개편 추진
요약 내용: (서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024
1번째 뉴스가 성공적으로 전송되었습니다.
2번째 뉴스가 성공적으로 전송되었습니다.
3번째 뉴스가 성공적으로 전송되었습니다.


In [42]:
from gensim.summarization.summarizer import summarize

# 섹션 지정
my_section = 'eco'
news_list3 = news_dic[my_section]

# 뉴스 요약하기
for news_info in news_list3:
    news_contents = news_info.get('news_contents', '')

    if news_contents:
        try:
            # 요약하기
            snews_contents = summarize(news_contents, word_count=20)
        except Exception as e:
            print(f"요약 중 오류 발생: {e}")
            snews_contents = None

        # 요약문이 없을 경우 전체 본문을 사용
        if not snews_contents:
            news_sentences = news_contents.split('.')
            if len(news_sentences) > 1:
                snews_contents = '.'.join(news_sentences[:3])  # 앞 3문장
            else:
                snews_contents = news_contents  # 본문이 하나일 경우 전체 사용
    else:
        snews_contents = "본문을 가져올 수 없습니다."  # 본문이 비어있을 경우

    # 요약 결과 저장
    news_info['snews_contents'] = snews_contents

    # 요약 내용 확인 로그
    print(f"제목: {news_info['title']}")
    print(f"요약 내용: {news_info['snews_contents']}")

# 카카오톡 메시지 전송
for idx, news_info in enumerate(news_list3):
    # 요약문이 없을 경우 기본 메시지로 대체
    snews_contents = news_info.get('snews_contents', '요약 정보를 불러올 수 없습니다.')
    
    # 텍스트 템플릿 형식 만들기
    template = {
        "object_type": "text",
        "text": '# 제목 : ' + news_info.get('title') + \
                '\n\n# 요약 : ' + snews_contents,
        "link": {
            "web_url": news_info.get('news_url'),
            "mobile_web_url": news_info.get('news_url')
        },
        "button_title": "자세히 보기"
    }
    
    # 카카오톡 메시지 전송
    res = kakao_utils.send_message(KAKAO_TOKEN_FILENAME, template)
    if res.json().get('result_code') == 0:
        print(f'{idx + 1}번째 뉴스가 성공적으로 전송되었습니다.')
    else:
        print(f'{idx + 1}번째 뉴스를 전송하지 못했습니다. 오류메시지 : ', res.json())


요약 중 오류 발생: input must have more than one sentence
제목: 20대 비정규직 ‘역대급’?…“일하고 싶을 때만 한다”
요약 내용: 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해” 희망 시기, 원하는 만큼만 일하려는 경향“청년층 눈높이 맞는 양질 일자리 부족해”
요약 중 오류 발생: input must have more than one sentence
제목: "피싱메일·스미싱 잡는 AI…고객별 맞춤 보안 제공할 것"
요약 내용: 안랩 임준혁 차장(왼쪽), 이승경 팀장(오른쪽)/사진제공=안랩
제목: 산업부, AI 전담부서 만든다…직제개편 추진
요약 내용: (서울=뉴스1) = 안덕근 산업통상자원부 장관이 8일 오전 서울 역삼동 한국기술센터에서 열린 'AI 시대의 신(新)산업정책 위원회 출범식'에서 AI 자율제조 전략 1.0을 발표하고 있다. (산업통상자원부제공) 2024
1번째 뉴스가 성공적으로 전송되었습니다.
2번째 뉴스가 성공적으로 전송되었습니다.
3번째 뉴스가 성공적으로 전송되었습니다.


In [56]:
# 카카오톡 메시지 전송
for idx, news_info in enumerate(news_list3):
    # 텍스트 템플릿 형식 만들기
    template = {
        "object_type": "text",
        "text": '# 제목 : ' + news_info.get('title') + \
                '\n\n# 요약 : ' + news_info.get('snews_contents', '요약 정보를 불러올 수 없습니다.'),
        "link": {
            "web_url": news_info.get('news_url', 'https://news.naver.com'),
            "mobile_web_url": news_info.get('news_url', 'https://news.naver.com')
        },
        "button_title": "자세히 보기"
    }
    
    # 링크 확인
    print(f"{idx + 1}번째 뉴스 URL: {news_info.get('news_url')}")
    
    # 카카오톡 메시지 전송
    res = kakao_utils.send_message(KAKAO_TOKEN_FILENAME, template)
    if res.json().get('result_code') == 0:
        print(f'{idx + 1}번째 뉴스가 성공적으로 전송되었습니다.')
    else:
        print(f'{idx + 1}번째 뉴스를 전송하지 못했습니다. 오류메시지 : ', res.json())


1번째 뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734285?sid=101
1번째 뉴스가 성공적으로 전송되었습니다.
2번째 뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734284?sid=101
2번째 뉴스가 성공적으로 전송되었습니다.
3번째 뉴스 URL: https://n.news.naver.com/mnews/article/005/0001734283?sid=101
3번째 뉴스가 성공적으로 전송되었습니다.
