In [1]:
# 편집기에서 만능키 %를 pip에 붙여서 실행할 수 있다. %pip install gensim==3.8.3
# anaconda prompt를 열고 가상환경을 activate시켜준 다음 기존에 설치된 gensim의 ver이 3.8.3인지? 확인한다.
# 버젼을 확인하려면 anaconda prompt에서 pip list 를 입력후 엔터 gensim의 버젼을 확인할 수 있다.
# ver이 3.8.3이상이라면 anaconda prompt에서 pip uninstall gensim 입력 엔터한다.
# 이후 anaconda prompt에서 다시 pip install gensim==3.8.3 실행하여 gensim.summarization 모듈을 사용할 수 있다.
# gensim 4.0.0 이후 버전에서는 gensim.summarization 모듈이 제거되어 
# 아래 코딩을 실행할 수 없으므로 gensim 3.8.3 버전을 다시 설치하여 실행하는 것이다.
# gensim을 다시 install하고 아래 코딩을 실행할 경우 gensim 4.0.0이후 버젼이
# 설치되기 때문에 아래 코딩에서 gensim.summarization 모듈 관련 에러가 발생할 것이다.
# 추후 gensim 라이브러리의 업데이트에 영향을 받을 수 있으며, 이전 버전의 라이브러리를 
# 계속 사용하는 것은 권장되지 않습니다. 가능한 경우 최신 라이브러리를 사용하고 다른 요약 기법을 적용하는 것이 좋습니다.

In [1]:
import pandas as pd
from konlpy.tag import Mecab
from nltk.tokenize import sent_tokenize
from gensim.summarization import summarize
from gensim.summarization.textcleaner import split_sentences

df = pd.read_csv('.\clean_IT_news.csv').head(15)

with open('230406_송세영님_stop_word.txt', 'r', encoding='utf-8') as f:
    korean_stop_words = set(line.strip() for line in f)

def preprocess(text):
    mecab = Mecab(dicpath=r"C:/mecab/mecab-ko-dic")
    tokens = [word for word, pos in mecab.pos(text) if pos[0] in ['N', 'V']]
    tokens = [word for word in tokens if word not in korean_stop_words]
    return ' '.join(tokens)

def remove_sources(text, sources=['출처=IT동아', '사진=트위터 @DylanXitton']):
    for source in sources:
        text = text.replace(source, '')
    return text

def gensim_summarize(text, num_summaries=1):
            # num_summaries를 1로 설정하면 요약은 1개의 문장으로 이뤄진다.
    text = remove_sources(text)
    preprocessed_text = preprocess(text)
    sentences = sent_tokenize(preprocessed_text)
    if len(sentences) > 1:
        summary = summarize(preprocessed_text, word_count=num_summaries * 1)
            # 요약의 길이는 문장당 단어의 수이므로 word_count를 조정하면 
            # 된다. 여기서는 1개의 단어로 설정했다.
        return split_sentences(summary)
    else:
        return sentences
    

for index, row in df.iterrows():
    content = row['content']
    summary = gensim_summarize(content)
    print(f"{index+1}.  기사 제목: {row['title']}")
    for i, sent in enumerate(summary, start=1):
        if i == len(summary):
            print(f"#####문장시작#####\n{i}번문장:  \n{sent}\n#####문장끝#####")
        else:
            print(f"{sent}", end=" ")
    print("\n----------\n")


1.  기사 제목: 벤츠 “미래 비전 담은 12종 신차 내놓을 것”…첫 포문 ‘더 뉴 EQS SUV’ 출시
#####문장시작#####
1번문장:  
한국 진출 주년 메르세데스 벤츠 코리아 럭 셔리 전동 지속 가능 미래 비전 제시 비전 달성 위해 올해 개 신차 개 완전 변경 모델 개 부분 변경 모델 종 신차 내놓 밝혔 벤츠 코리아 올해 신차 출시 행렬 선봉장 벤츠 전기차 전용 플랫 폼 적용 만든 대형 전기 뉴 출시 발표 벤츠 코리아 서울 용산구 한남동 그랜드 하얏트 서울 호텔 전기 뉴 출시 행사 진행 벤츠 전기차 전용 플랫 폼 적용 전기차 뉴 벤츠 코리아 서울 용산구 한남동 그랜드 하얏트 서울 호텔 전기 뉴 출시 행사 진행 이날 공개 뉴 벤츠 개발 전기차 전용 플랫 폼 기반 만든 번 전기 다 차 최대 명 탑승 설계 스탠더드 모델 인 뉴 상위 모델 인 뉴 트림 구분 배터리 용량 트림 회 충전 시 주행 가능 거리 최대 최대 다 벤츠 코리아 뉴 뉴 탑재 배터리 최대 급속 충전 가능 경우 잔여 용량 분 충전 수 있 뉴 모터 최고 출력 최대 토크 뉴 모터 최고 출력 최대 토크 뉴 주요 제원 출처 벤츠 코리아 정지 상태 시속 도달 뉴 경우 초 뉴 뉴 공차 중량 뉴 공차 중량 뉴 가격 억 만 원 뉴 억 만 원 벤츠 코리아 뉴 옆모습 뉴 차체 벤츠 전기 차 중 크 전장 전폭 전고 축거 휠 크기 인치 다 벤츠 코리아 뉴 실내 벤츠 코리아 뉴 실내 뉴 실내 살펴보 센터 패 부위 개 디스플레이 합친 하이퍼 스크린 눈 띈다 벤츠 인공지능 운전자 행동 학습 필요 기능 맞춤 형 디스플레이 화면 제공 밝혔 카메라 레이더 초음파 활용 센서 시스템 주변 환경 분석 속도 조절 차선 변경 조향 보조 드라이빙 어시 스턴트 패키지 위험 감지 탑승자 피해 최소 프리 세이프 측면 충돌 감지 시 앞 좌석 탑승자 보호 프리 세이프 임펄스 사이드 기능 첨단 주행 보조 시스템 기본 적용 밝혔 뉴 뒷좌석 인포 테 인 먼 트 시스템 출처 벤츠 코리아 상위 트림 인 뉴 뒷좌석 개 풀 터치 스크린 구성 뒷좌석 엔터 

8.  기사 제목: 휴롬, 獨 주방가전 어워드 '키친 이노베이션' 최고상 수상
#####문장시작#####
1번문장:  
건강 주방 가전 기업 롬 독일 주방 가전 어워드 인 키친 이노베이션 어워드 최고상 수상 밝혔 키친 이노베이션 어워드 독일 암 비안 테 전시회 진행 글로벌 주방 가전 어워드 다 소비자 친화 혁신 인 제품 선보인 브랜드 선정 전문가 심사 단과 실제 제품 사용 소비자 투표 참여 수상 제품 열리 독일 암 비안 테 전시회 전시 어워드 롬 제품 원액 기능 혁신 제품 우수 디자인 부문 평가 받 수상 롬 키친 이노베이션 어워드 연속 수상 소형 가전 부문 롬 올해 어워드 내 최고상 수상 상 이후 연속 개 제품 브랜드 수상 자격 부여 롬 롬 이지 올해 개 제품 수상 롬 원 액기 내부 숨긴 히든 설계 디자인 적용 드럼 외관 심플 구현 제품 상하부 스킨 소비자 원 투톤 컬러 조합 수 있 점 호평 받 롬 최신 기술 세대 멀티 스크루 적용 롬 설명 따르 저속 착즙 방식 파이 케미컬 효소 비타민 영양 파괴 최소 주스 외 넛 밀크 칵테일 아이스크림 다양 디저트 종류 만들 수 있 활용 도 높였 롬 김재원 대표 올해 키친 이노베이션 어워드 연속 수상 최고상 수상 유럽 시장 롬 기술 혁신 제품력 인정받 되 뜻깊 생각 글로벌 건강 주방 가전 기업 롬 세계 소비자 건강 식습관 형성 수 있 제품 선보이 최선 할 전했 신영 빈 기자
#####문장끝#####

----------

9.  기사 제목: LG전자, 프리미엄 빌트인+업(UP)가전으로 美 시장 공략
#####문장시작#####
1번문장:  
프리미엄 빌트인 시그 니 처 키친 스위트 업 가전 결합 미국 빌트인 시장 공략 미국 라스베이거스 열리 주방 욕실 전시회 참가 밝혔 부스 규모 천 제곱미터 다 주방 욕실 관련 최신 트렌드 확인 수 있 인테리어 전문가 주방 디자이너 건축가 세계 빌트인 가전 고객 찾 전시회 다 美 프리미엄 빌트인 시그 니 처 키친 스위트 전 결합 차별 고객 경험 앞세워 미국 빌트인 시장 공략 강화 빌트인 가전 