루키즈 개발 5기 박미정

## 2. 웹스크래핑 연습문제

### 2-1. Nate 뉴스기사 제목 스크래핑하기 (필수)
- https://news.nate.com/recent?mid=n0100
- 최신뉴스, 정치 , 경제, 사회, 세계, IT/과학 
- 6개의 섹션의 뉴스를 출력하는 함수를 생성하여 스크래핑 하기

In [None]:
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from IPython.display import Image, display

# 섹션별 mid 코드 정의
NATE_SECTIONS = {
    '최신뉴스': 'n0100',
    '정치': 'n0200',
    '경제': 'n0300',
    '사회': 'n0400',
    '세계': 'n0500',
    'IT/과학': 'n0600'
}

In [None]:
def get_nate_news_by_section(section_name):
    """
    특정 섹션명을 입력받아 해당 섹션의 뉴스를 스크래핑하는 함수
    """
    if section_name not in NATE_SECTIONS:
        print(f"존재하지 않는 섹션입니다. 선택 가능 섹션: {', '.join(NATE_SECTIONS.keys())}")
        return

    mid_code = NATE_SECTIONS[section_name]
    url = f'https://news.nate.com/recent?mid={mid_code}'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
    }
    
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status() # 연결 오류 확인
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # 최근 뉴스 목록은 보통 mlt01 클래스를 가진 div 내부에 위치합니다.
        news_items = soup.select('.mlt01')
        
        print(f"\n{'='*60}")
        print(f" [{section_name}] 섹션 뉴스 결과 ")
        print(f"{'='*60}\n")

        if not news_items:
            print("뉴스를 찾을 수 없습니다. HTML 구조를 확인해 주세요.")
            return

        for item in news_items:
            # 1. 제목 및 링크 추출 (a.lt1 클래스 내부)
            link_tag = item.select_one('a.lt1')
            if not link_tag: continue
            
            title = link_tag.select_one('.tit').text.strip()
            link = urljoin(url, link_tag['href'])
            
            # 2. 이미지 추출 및 존재 여부 체크
            img_tag = item.select_one('img')
            img_url = None
            
            # 3. 데이터 출력
            print(f"제목: {title}")
            print(f"링크: {link}")
            
            if img_tag and img_tag.get('src'):
                # urljoin을 사용하여 //로 시작하는 경로에 https: 자동 결합
                img_url = urljoin(url, img_tag['src'])
                display(Image(url=img_url, width=150))
            else:
                print("(이미지 없음)")
                
            print("-" * 60)
            
    except Exception as e:
        print(f"스크래핑 중 오류 발생: {e}")

In [None]:
get_nate_news_by_section('최신뉴스')
get_nate_news_by_section('정치')
get_nate_news_by_section('경제')
get_nate_news_by_section('사회')
get_nate_news_by_section('세계')
get_nate_news_by_section('IT/과학')



 [최신뉴스] 섹션 뉴스 결과 

제목: 불법사금융 강력 단속…범죄이익 309억 환수
링크: https://news.nate.com/view/20260206n29364?mid=n0100
(이미지 없음)
------------------------------------------------------------
제목: 경상수지 1230억弗 흑자…반도체 힘입어 역대 최대
링크: https://news.nate.com/view/20260206n29363?mid=n0100
(이미지 없음)
------------------------------------------------------------
제목: 우리금융 '3조클럽' 안착…동양·ABL생명 인수 효과
링크: https://news.nate.com/view/20260206n29362?mid=n0100


------------------------------------------------------------
제목: 덱스, 사격 영상 공개에 누리꾼 "본업 섹시"
링크: https://news.nate.com/view/20260206n29361?mid=n0100


------------------------------------------------------------
제목: '현빈♥' 손예진, 아찔한 각선미에 강렬 레드…3세子 놀라겠네
링크: https://news.nate.com/view/20260206n29360?mid=n0100


------------------------------------------------------------
제목: SD건담 지 제네레이션 이터널, '기동전사 건담 섬광의 하사웨이 키르케의 마녀' 공개 기념 패널 미션 개최
링크: https://news.nate.com/view/20260206n29359?mid=n0100


------------------------------------------------------------
제목: 코웨이 "경영 배제는 해법 아냐"…얼라인 측 방준혁 의장 불연임 요구 '거부'
링크: https://news.nate.com/view/20260206n29358?mid=n0100


------------------------------------------------------------
제목: 진주서 공장 LNG 폭발 화재···중상 1명·경상 9명
링크: https://news.nate.com/view/20260206n29357?mid=n0100


------------------------------------------------------------
제목: 강훈식, '잠수함 수주전' 캐나다 장관 면담…"최종제안서 조언 들어"
링크: https://news.nate.com/view/20260206n29356?mid=n0100


------------------------------------------------------------
제목: 리투아니아, 대중 관계 개선 모색…中 "실제 행동 보여라" 압박
링크: https://news.nate.com/view/20260206n29355?mid=n0100


------------------------------------------------------------
제목: 개막 이틀 전 날벼락…헬기 실려간 우승 후보 '충격' [지금 올림픽]
링크: https://news.nate.com/view/20260206n28964?mid=n0100


------------------------------------------------------------
제목: 오하영, 미모로 '시선집중' [TF사진관]
링크: https://news.nate.com/view/20260206n29353?mid=n0100


------------------------------------------------------------
제목: 정청래 만난 3선들 "이러다 가래로도 못 막아…'결자해지'하라"
링크: https://news.nate.com/view/20260206n27653?mid=n0100


------------------------------------------------------------
제목: 신한·KB라이프, 지난해 순익 감소…영업익 개선에도 비용 부담 영향
링크: https://news.nate.com/view/20260206n29351?mid=n0100


------------------------------------------------------------
제목: '케데헌' 이재, 약혼남과 11월 결혼설…'그래미' 수상 후 겹경사
링크: https://news.nate.com/view/20260206n29350?mid=n0100


------------------------------------------------------------
제목: 전 키움 김동엽, 울산 웨일즈 합류…"몸 상태 좋아 자신 있다"
링크: https://news.nate.com/view/20260206n29349?mid=n0100


------------------------------------------------------------
제목: 불에 놀라 계단 대피 주민에 칼부림 5명 사망 비극…안인득 사건 유족에 6억 국가가 배상하라 [세상&]
링크: https://news.nate.com/view/20260206n29348?mid=n0100


------------------------------------------------------------
제목: 이 대통령 "아파트 한 평에 3억 말 되나"…수도권 집값 과열 직격
링크: https://news.nate.com/view/20260206n29347?mid=n0100


------------------------------------------------------------
제목: 기금형 퇴직연금제 21년만에 전면도입
링크: https://news.nate.com/view/20260206n29346?mid=n0100


------------------------------------------------------------
제목: 진주시 진성면 가스 폭발 화재 사고…10명 부상(종합)
링크: https://news.nate.com/view/20260206n28952?mid=n0100


------------------------------------------------------------

 [정치] 섹션 뉴스 결과 

제목: 강훈식, '잠수함 수주전' 캐나다 장관 면담…"최종제안서 조언 들어"
링크: https://news.nate.com/view/20260206n29356?mid=n0200


------------------------------------------------------------
제목: 이 대통령 "아파트 한 평에 3억 말 되나"…수도권 집값 과열 직격
링크: https://news.nate.com/view/20260206n29347?mid=n0200


------------------------------------------------------------
제목: [자막뉴스] "폭동 '좋아요'? 미안 손가락 운동"…"감히 어딜" 광주 격노 부른 이진숙
링크: https://news.nate.com/view/20260206n23117?mid=n0200


------------------------------------------------------------
제목: 행안부·대전·충남, 행정통합 논의 위한 면담
링크: https://news.nate.com/view/20260206n29330?mid=n0200


------------------------------------------------------------
제목: 행안부·대전·충남도, 행정통합 논의 위한 면담
링크: https://news.nate.com/view/20260206n29328?mid=n0200


------------------------------------------------------------
제목: 美, 대북 인도적 지원 승인
링크: https://news.nate.com/view/20260206n29316?mid=n0200
(이미지 없음)
------------------------------------------------------------
제목: 검찰청 폐지 앞둔 상황…6·3 지방선거 선거범죄 '수사 공백' 우려도
링크: https://news.nate.com/view/20260206n29308?mid=n0200


------------------------------------------------------------
제목: 청년 앞세워 여야 협치 나선 김민석 총리…"미래 위해서도 청년 정책 중요"
링크: https://news.nate.com/view/20260206n29302?mid=n0200


------------------------------------------------------------
제목: 외교부, REAIM 고위급회의 참석…'군사 분야 AI 책임 있는 이용' 논의
링크: https://news.nate.com/view/20260206n29296?mid=n0200


------------------------------------------------------------
제목: 화성시, 화성~오산 고속화도로 민투사업 우선협상대상자 선정
링크: https://news.nate.com/view/20260206n29295?mid=n0200


------------------------------------------------------------
제목: 나도 걸테니 너도 걸어라?…"장동혁, 당을 포커판 만들어" 내홍
링크: https://news.nate.com/view/20260206n27942?mid=n0200


------------------------------------------------------------
제목: "쉽지 않지만 끝까지"…강훈식, 60조 잠수함 '수주전' 캐나다 장관 면담
링크: https://news.nate.com/view/20260206n29095?mid=n0200


------------------------------------------------------------
제목: 3선의원 만난 정청래 "당 주인은 당원…합당 결정권 내게 없다"(종합)
링크: https://news.nate.com/view/20260206n29265?mid=n0200


------------------------------------------------------------
제목: 이한주 "보유세 높이고 거래세 낮추는 방향에 공감…강남 집값 위험자산"
링크: https://news.nate.com/view/20260206n29236?mid=n0200


------------------------------------------------------------
제목: 정청래, 3선 모임 만나 '합당 의총' 소집 요청…중진들 "결자해지"
링크: https://news.nate.com/view/20260206n29217?mid=n0200


------------------------------------------------------------
제목: [사진]재일학도의용군 충혼비 찾은 권오을 국가보훈부 장관
링크: https://news.nate.com/view/20260206n29210?mid=n0200


------------------------------------------------------------
제목: [사진]이봉창 의사 순국지 방문해 헌화하는 권오을 장관
링크: https://news.nate.com/view/20260206n29205?mid=n0200


------------------------------------------------------------
제목: 최교진 교육장관, 9일 충북대 의대 찾아 교육여건 점검…현장 간담회
링크: https://news.nate.com/view/20260206n29201?mid=n0200


------------------------------------------------------------
제목: 순방 때마다 '한복 외교'…김혜경 여사, 한복 명예홍보대사 추대
링크: https://news.nate.com/view/20260206n28179?mid=n0200


------------------------------------------------------------
제목: "부동산 팔고 주식 투자한 다주택자 세제 혜택" 與 의원 제안…野 "황당한 발상"
링크: https://news.nate.com/view/20260206n28981?mid=n0200


------------------------------------------------------------

 [경제] 섹션 뉴스 결과 

제목: 불법사금융 강력 단속…범죄이익 309억 환수
링크: https://news.nate.com/view/20260206n29364?mid=n0300
(이미지 없음)
------------------------------------------------------------
제목: 경상수지 1230억弗 흑자…반도체 힘입어 역대 최대
링크: https://news.nate.com/view/20260206n29363?mid=n0300
(이미지 없음)
------------------------------------------------------------
제목: 우리금융 '3조클럽' 안착…동양·ABL생명 인수 효과
링크: https://news.nate.com/view/20260206n29362?mid=n0300


------------------------------------------------------------
제목: 신한·KB라이프, 지난해 순익 감소…영업익 개선에도 비용 부담 영향
링크: https://news.nate.com/view/20260206n29351?mid=n0300


------------------------------------------------------------
제목: 흥국생명, 개인정보 조회·이용 위반…과태료 1억2400만원
링크: https://news.nate.com/view/20260206n29343?mid=n0300


------------------------------------------------------------
제목: 금융지주 실적잔치…보험·카드 부진은 숙제
링크: https://news.nate.com/view/20260206n29341?mid=n0300


------------------------------------------------------------
제목: [컨콜] 우리금융 'CET1 13%' 조기달성 가능…증권 증자는 '단계적 시행'
링크: https://news.nate.com/view/20260206n29337?mid=n0300


------------------------------------------------------------
제목: 자산시장 덮친 'AI 과잉투자' 공포
링크: https://news.nate.com/view/20260206n29334?mid=n0300
(이미지 없음)
------------------------------------------------------------
제목: 해양재단, 해양수산 봉사단체 후원사업 지원 접수
링크: https://news.nate.com/view/20260206n29324?mid=n0300


------------------------------------------------------------
제목: 9일부터 스마트폰으로 '로또' 산다
링크: https://news.nate.com/view/20260206n29314?mid=n0300


------------------------------------------------------------
제목: 이재용, 동계올림픽서 JD 밴스 미 부통령 만나…IOC 만찬 참석
링크: https://news.nate.com/view/20260206n29198?mid=n0300


------------------------------------------------------------
제목: 한수원, 제17기 아인슈타인 클래스 성료
링크: https://news.nate.com/view/20260206n29301?mid=n0300


------------------------------------------------------------
제목: 이상지질혈증 치료제 유한양행 '로수바미브', 원외처방액 연 1000억 넘었다
링크: https://news.nate.com/view/20260206n29299?mid=n0300


------------------------------------------------------------
제목: 백화점 날개 단 롯데쇼핑, 작년 영업익 15% 뛰었다
링크: https://news.nate.com/view/20260206n29285?mid=n0300


------------------------------------------------------------
제목: 피자헛 지고, 맘스터치 이겼다…프랜차이즈업계 '예의주시'
링크: https://news.nate.com/view/20260206n29284?mid=n0300


------------------------------------------------------------
제목: 신흥국 증시로 '머니무브'…韓 ETF, 자금 순유입 1위
링크: https://news.nate.com/view/20260206n29245?mid=n0300


------------------------------------------------------------
제목: 4대 금융지주 순이익 18조…또 사상 최대
링크: https://news.nate.com/view/20260206n29253?mid=n0300


------------------------------------------------------------
제목: '최고 실적' 쓴 우리금융, 주주환원 판 키웠다···현금배당성향 첫 30% 넘겨
링크: https://news.nate.com/view/20260206n29237?mid=n0300


------------------------------------------------------------
제목: 한미반도체, 지난해 연간 영업익 2514억…전년比 1.6% ↓
링크: https://news.nate.com/view/20260206n29234?mid=n0300


------------------------------------------------------------
제목: 논산시 인니서 농식품박람회 개최…'딸기엑스포' 홍보 박차
링크: https://news.nate.com/view/20260206n29233?mid=n0300


------------------------------------------------------------

 [사회] 섹션 뉴스 결과 

제목: 진주서 공장 LNG 폭발 화재···중상 1명·경상 9명
링크: https://news.nate.com/view/20260206n29357?mid=n0400


------------------------------------------------------------
제목: 불에 놀라 계단 대피 주민에 칼부림 5명 사망 비극…안인득 사건 유족에 6억 국가가 배상하라 [세상&]
링크: https://news.nate.com/view/20260206n29348?mid=n0400


------------------------------------------------------------
제목: 기금형 퇴직연금제 21년만에 전면도입
링크: https://news.nate.com/view/20260206n29346?mid=n0400


------------------------------------------------------------
제목: 진주시 진성면 가스 폭발 화재 사고…10명 부상(종합)
링크: https://news.nate.com/view/20260206n28952?mid=n0400


------------------------------------------------------------
제목: 검찰, '사법농단' 양승태 2심에 불복해 상고…"형사상고심의위 의견 고려"
링크: https://news.nate.com/view/20260206n29235?mid=n0400


------------------------------------------------------------
제목: [영상] "주인님, 80만원입니다"…중고생 노린 '비밀 메뉴판'
링크: https://news.nate.com/view/20260206n29340?mid=n0400


------------------------------------------------------------
제목: 미성년자 동원 선거 운동…전남교육감 후보 '팬클럽' 수사
링크: https://news.nate.com/view/20260206n28437?mid=n0400


------------------------------------------------------------
제목: 권창영 특검 "내란·계엄 가담 철저 규명"
링크: https://news.nate.com/view/20260206n29307?mid=n0400


------------------------------------------------------------
제목: 경북 상주 대나무밭에 불…헬기 3대 투입 진화(종합)
링크: https://news.nate.com/view/20260206n29300?mid=n0400


------------------------------------------------------------
제목: 광주시의회, 국회 행안위원장에 "의원 정수 조정 필요"
링크: https://news.nate.com/view/20260206n29293?mid=n0400


------------------------------------------------------------
제목: [단독]경찰, '쿠팡 故장덕준 사망 은폐 의혹'휴대전화 포렌식 마쳐
링크: https://news.nate.com/view/20260206n29291?mid=n0400


------------------------------------------------------------
제목: 따릉이 앱 개인정보 유출…서울시설공단 2년간 묵인
링크: https://news.nate.com/view/20260206n29290?mid=n0400
(이미지 없음)
------------------------------------------------------------
제목: 권창영특검 "내란 사건, 제로베이스서 볼 것"
링크: https://news.nate.com/view/20260206n29289?mid=n0400


------------------------------------------------------------
제목: CCTV 사각지대 노리고 '쾅' 보험사기단 덜미
링크: https://news.nate.com/view/20260206n29287?mid=n0400
(이미지 없음)
------------------------------------------------------------
제목: 정성호 '가격담합' 강력 경고 "회사·인생 망한다고 생각을"
링크: https://news.nate.com/view/20260206n29286?mid=n0400


------------------------------------------------------------
제목: 메가스터디 '사교육 1번지' 대치동 진출
링크: https://news.nate.com/view/20260206n29279?mid=n0400


------------------------------------------------------------
제목: iM증권, 지난해 영업익 874억…흑자 전환
링크: https://news.nate.com/view/20260206n29272?mid=n0400


------------------------------------------------------------
제목: 연세대 '노화방지 연구'에 1천억 투입
링크: https://news.nate.com/view/20260206n29271?mid=n0400


------------------------------------------------------------
제목: "나를 무시해서"…잠자던 친모에 흉기 휘두른 아들 체포
링크: https://news.nate.com/view/20260206n29268?mid=n0400


------------------------------------------------------------
제목: '조수석 날벼락 사고' 낸 화물차 운전자, 나흘 만에 교통사고로 숨져
링크: https://news.nate.com/view/20260206n29267?mid=n0400


------------------------------------------------------------

 [세계] 섹션 뉴스 결과 

제목: 트럼프, 오바마 부부 원숭이 합성 사진 게시…민주당 "역겹다"
링크: https://news.nate.com/view/20260206n29405?mid=n0500


------------------------------------------------------------
제목: 쿠팡 사태, 美하원 법사위로…韓고위 "로비 먹힌 결과"
링크: https://news.nate.com/view/20260206n29008?mid=n0500


------------------------------------------------------------
제목: "1㎝ 커지면 비거리 바뀐다"…스키점프 '페니스게이트' 의혹 파문
링크: https://news.nate.com/view/20260206n29339?mid=n0500


------------------------------------------------------------
제목: "한국에 핵 역량 제공하면 핵확산 위험"…미 상원의원들, 트럼프에 서한
링크: https://news.nate.com/view/20260206n29327?mid=n0500


------------------------------------------------------------
제목: 이란 시위 다시 불붙나…"17~18일 다시 거리로"
링크: https://news.nate.com/view/20260206n29325?mid=n0500


------------------------------------------------------------
제목: 트럼프 "다카이치 전면 지지" 시사…총선 승리 확실시?
링크: https://news.nate.com/view/20260206n29278?mid=n0500


------------------------------------------------------------
제목: 1년간 337억 벌었다…밀라노 '최고 몸값' 中미녀 선수의 반전
링크: https://news.nate.com/view/20260206n28636?mid=n0500


------------------------------------------------------------
제목: 美·이란, 고위급 핵 협상 시작…'12일 전쟁' 이후 8개월만
링크: https://news.nate.com/view/20260206n29183?mid=n0500


------------------------------------------------------------
제목: 엡스타인 문건에 전 세계 정·재계 '줄사임'…"성 얽힌 복잡한 관계망"
링크: https://news.nate.com/view/20260206n28808?mid=n0500


------------------------------------------------------------
제목: 엎어질 뻔했던 美-이란 협상, 오만에서 시작
링크: https://news.nate.com/view/20260206n27358?mid=n0500


------------------------------------------------------------
제목: '무비자' 시행하더니 뜨는 여행지 된 중국…외국인 출입국 26% 증가
링크: https://news.nate.com/view/20260206n29111?mid=n0500


------------------------------------------------------------
제목: "술취한 女 성폭행 책임있다" 125억 평결에 난리난 美우버, 뭔일
링크: https://news.nate.com/view/20260206n27084?mid=n0500


------------------------------------------------------------
제목: "내가 겨우 청소부라고?"…주 5일 근무 '200만원 수입' 공개한 英 22세 여성
링크: https://news.nate.com/view/20260206n26206?mid=n0500


------------------------------------------------------------
제목: 미국서 우버기사 성폭행에 회사 책임 평결…"125억 원 배상"
링크: https://news.nate.com/view/20260206n29043?mid=n0500
(이미지 없음)
------------------------------------------------------------
제목: "中, 이중용도 물자 통제후에도 日에 희토류 수출 허가"
링크: https://news.nate.com/view/20260206n29029?mid=n0500


------------------------------------------------------------
제목: 스타링크, 우크라 요청에 러시아군 접속 차단
링크: https://news.nate.com/view/20260206n28983?mid=n0500


------------------------------------------------------------
제목: 마차도 대선 출마 길 열리나…베네수엘라 사면법 초안 가결
링크: https://news.nate.com/view/20260206n28977?mid=n0500


------------------------------------------------------------
제목: 美상원의원들, 트럼프에 "'韓에 잠재적 핵역량' 핵확산 위험" 서한
링크: https://news.nate.com/view/20260206n28887?mid=n0500


------------------------------------------------------------
제목: "위고비 89% 싸게" 트럼프, 처방약 '폭탄세일' 물가민심 잡을까
링크: https://news.nate.com/view/20260206n28867?mid=n0500


------------------------------------------------------------
제목: "얘들 안 깨워?"…美한파에 기절한 이구아나 5000마리 안락사
링크: https://news.nate.com/view/20260206n27935?mid=n0500


------------------------------------------------------------

 [IT/과학] 섹션 뉴스 결과 

제목: 정부 'AI 안전 마스터플랜' 속도…"피해 구제 절차부터 설계해야"
링크: https://news.nate.com/view/20260206n29269?mid=n0600


------------------------------------------------------------
제목: 카카오잔혹사④ 픽코마, 성과는 충분한데 IPO는 왜 멈춰 섰나
링크: https://news.nate.com/view/20260206n29122?mid=n0600


------------------------------------------------------------
제목: 아마존 "AI에 2000억弗 투자" 발표에…곧바로 주가 추락
링크: https://news.nate.com/view/20260206n28655?mid=n0600
(이미지 없음)
------------------------------------------------------------
제목: 우주개발을 '시민의 언어'로…책·다큐·토크로 만난 K-우주
링크: https://news.nate.com/view/20260206n28753?mid=n0600


------------------------------------------------------------
제목: 넥슨 '데이브 더 다이버', 중국 모바일·PC 버전 정식 출시…사전 예약 150만 돌파
링크: https://news.nate.com/view/20260206n28745?mid=n0600


------------------------------------------------------------
제목: 카카오톡 '이용 기록·패턴 강제수집' 논란 시끌
링크: https://news.nate.com/view/20260206n28564?mid=n0600


------------------------------------------------------------
제목: 청주에 KAIST 바이오 스퀘어 개소…노화 대응 연구 앞장
링크: https://news.nate.com/view/20260206n23670?mid=n0600


------------------------------------------------------------
제목: 플레이링스, 신작과 신사업으로 글로벌 시장 확대 잰걸음
링크: https://news.nate.com/view/20260206n27978?mid=n0600


------------------------------------------------------------
제목: 밸브 스팀 하드웨어 확장, 메모리 가격 급등에 발목 잡히나
링크: https://news.nate.com/view/20260206n27977?mid=n0600


------------------------------------------------------------
제목: 신원근 카카오페이 대표 "스테이블 코인 활용에 따라 기업 수익성 좌우될 것"
링크: https://news.nate.com/view/20260206n27966?mid=n0600


------------------------------------------------------------
제목: [스타트업-ing] 라젠카AI "데이터 인공지능으로 헬스케어 금융 불편 해소"
링크: https://news.nate.com/view/20260206n27932?mid=n0600


------------------------------------------------------------
제목: 과학계 이어 오픈AI까지 사로잡은 美 세레브라스, AI 반도체 업계 신화 쓸까
링크: https://news.nate.com/view/20260206n27460?mid=n0600


------------------------------------------------------------
제목: [콘텐츠 핫&뉴] '카트라이더 러쉬플러스', 뽀롱뽀롱 뽀로로 컬래버
링크: https://news.nate.com/view/20260206n27858?mid=n0600


------------------------------------------------------------
제목: 과기부, AI 안전 위한 전문가 의견 청취…"국가 안보 문제로 확장 가능"
링크: https://news.nate.com/view/20260206n27841?mid=n0600


------------------------------------------------------------
제목: 정해진 답은 없다, '붉은사막' 전투 시스템의 지향점은?
링크: https://news.nate.com/view/20260206n27806?mid=n0600


------------------------------------------------------------
제목: "플레이 감각의 대비"…'바이오하자드 레퀴엠' 개발진이 공개한 제작 전략
링크: https://news.nate.com/view/20260206n27662?mid=n0600


------------------------------------------------------------
제목: 4배 쭉쭉 '늘어나는 전원' 개발 外 [과학게시판]
링크: https://news.nate.com/view/20260206n27657?mid=n0600


------------------------------------------------------------
제목: 스마일게이트, 에픽세븐 신규 월광 영웅 보검의 군주 이세리아 업데이트
링크: https://news.nate.com/view/20260206n27619?mid=n0600


------------------------------------------------------------
제목: 라이트코어 게임즈, 신작 '미송자의 노래: 도트 방치형 RPG' 정식 출시
링크: https://news.nate.com/view/20260206n27590?mid=n0600


------------------------------------------------------------
제목: 라온시큐어, 지난해 영업익 27억…전년比 36% 껑충
링크: https://news.nate.com/view/20260206n27552?mid=n0600


------------------------------------------------------------


### 2-2. 하나의 네이버 웹툰과 1개의 회차에 대한 Image 다운로드 하기 (필수)
- 하나의 웹툰의 **제목(title)**, **회차 번호(no)**, **회차 URL(url)**를 입력으로 받는 함수를 선언.
- 함수 호출 후, `img/일렉시드/341` 디렉토리가 생성되며, 해당 디렉토리 아래에 웹툰 이미지들이 다운로드되도록 구현한다.

In [None]:
import os
import re
import requests

In [None]:
def download_one_episode(title, no, url):
    # 1. 디렉토리 생성
    path = os.path.join("img", title, str(no))
    os.makedirs(path, exist_ok=True)
    print(f"[{path}] 디렉토리 준비 완료.")

    # 2. 헤더 설정 (중요: Referer와 User-Agent가 정확해야 차단 안 됨)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
        'Referer': url
    }

    try:
        # 3. 페이지 소스 가져오기
        response = requests.get(url, headers=headers)
        html_text = response.text

        # 4. 정규표현식으로 이미지 URL 패턴 추출
        # 네이버 웹툰 이미지 서버 주소인 'image-comic.pstatic.net'이 포함된 모든 주소를 찾습니다.
        pattern = r'(https://image-comic\.pstatic\.net/webtoon/[^\s"\']+)'
        img_list = re.findall(pattern, html_text)

        # 중복 제거 및 유효성 검사
        img_list = sorted(list(set(img_list)))
        
        # 실제 본문 이미지만 필터링 (불필요한 썸네일 등 제외)
        final_list = [img for img in img_list if '/IMAG' in img or 'title_img' not in img.lower()]

        if not final_list:
            print("이미지 URL 추출에 실패했습니다. 패턴을 다시 확인하세요.")
            return

        print(f"추출 완료: 총 {len(final_list)}개의 이미지를 다운로드합니다.")

        # 5. 이미지 다운로드 진행
        download_count = 0
        for idx, img_url in enumerate(final_list):
            # 파일명 설정 (001.jpg, 002.jpg...)
            filename = f"{idx + 1:03d}.jpg"
            save_path = os.path.join(path, filename)

            # 이미지 요청
            img_res = requests.get(img_url, headers=headers)
            
            if img_res.status_code == 200:
                with open(save_path, 'wb') as f:
                    f.write(img_res.content)
                print(f"다운로드 완료: {filename}")
                download_count += 1
            else:
                print(f"다운로드 실패: {filename} (HTTP {img_res.status_code})")

        print(f"\n최종 완료: 총 {download_count}개의 이미지가 저장되었습니다.")

    except Exception as e:
        print(f"오류 발생: {e}")

In [None]:
download_one_episode('일렉시드', 341, 'https://comic.naver.com/webtoon/detail?titleId=717481&no=341&week=wed')

[img\일렉시드\341] 디렉토리 준비 완료.
추출 완료: 총 473개의 이미지를 다운로드합니다.
다운로드 완료: 001.jpg
다운로드 완료: 002.jpg
다운로드 완료: 003.jpg
다운로드 완료: 004.jpg
다운로드 완료: 005.jpg
다운로드 완료: 006.jpg
다운로드 완료: 007.jpg
다운로드 완료: 008.jpg
다운로드 완료: 009.jpg
다운로드 완료: 010.jpg
다운로드 완료: 011.jpg
다운로드 완료: 012.jpg
다운로드 완료: 013.jpg
다운로드 완료: 014.jpg
다운로드 완료: 015.jpg
다운로드 완료: 016.jpg
다운로드 완료: 017.jpg
다운로드 완료: 018.jpg
다운로드 완료: 019.jpg
다운로드 완료: 020.jpg
다운로드 완료: 021.jpg
다운로드 완료: 022.jpg
다운로드 완료: 023.jpg
다운로드 완료: 024.jpg
다운로드 완료: 025.jpg
다운로드 완료: 026.jpg
다운로드 완료: 027.jpg
다운로드 완료: 028.jpg
다운로드 완료: 029.jpg
다운로드 완료: 030.jpg
다운로드 완료: 031.jpg
다운로드 완료: 032.jpg
다운로드 완료: 033.jpg
다운로드 완료: 034.jpg
다운로드 완료: 035.jpg
다운로드 완료: 036.jpg
다운로드 완료: 037.jpg
다운로드 완료: 038.jpg
다운로드 완료: 039.jpg
다운로드 완료: 040.jpg
다운로드 완료: 041.jpg
다운로드 완료: 042.jpg
다운로드 완료: 043.jpg
다운로드 완료: 044.jpg
다운로드 완료: 045.jpg
다운로드 완료: 046.jpg
다운로드 완료: 047.jpg
다운로드 완료: 048.jpg
다운로드 완료: 049.jpg
다운로드 완료: 050.jpg
다운로드 완료: 051.jpg
다운로드 완료: 052.jpg
다운로드 완료: 053.jpg
다운로드 완료: 054.jpg
다운로드 완료: 055.jpg
다운로드 완료: 

### 2-3. 하나의 네이버 웹툰과 여러개의 회차에 대한 Image 다운로드 하기 (선택)
- 하나의 웹툰의 제목(title)과 회차를 알 수 있는 url을 입력으로 받는 함수를 선언
   `def download_all_episode(title, episode_url):`
- 하나의 웹툰에 대한 1Page의 20 회차의 image를 다운로드 받음

In [19]:
!pip install webdriver-manager

Collecting webdriver-manager
  Downloading webdriver_manager-4.0.2-py2.py3-none-any.whl.metadata (12 kB)
Downloading webdriver_manager-4.0.2-py2.py3-none-any.whl (27 kB)
Installing collected packages: webdriver-manager
Successfully installed webdriver-manager-4.0.2


In [37]:
import os
import re
import requests
import time
from concurrent.futures import ThreadPoolExecutor # 비동기 처리를 위한 모듈

In [38]:
# 1. 이미지 한 장을 저장하는 함수
def save_image(args):
    img_url, save_path, headers = args
    try:
        res = requests.get(img_url, headers=headers, timeout=10)
        if res.status_code == 200:
            with open(save_path, 'wb') as f:
                f.write(res.content)
            return True
    except:
        return False
    return False

In [39]:
# 2. 한 회차 전체를 처리하는 함수
def download_one_episode(title, no, url):
    path = os.path.join("img", title, str(no))
    os.makedirs(path, exist_ok=True)

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
        'Referer': url
    }

    try:
        response = requests.get(url, headers=headers)
        pattern = r'https://image-comic\.pstatic\.net/webtoon/[^"\'\s>]+'
        img_list = re.findall(pattern, response.text)
        final_list = sorted(list(set([img for img in img_list if '/IMAG' in img])))

        if not final_list:
            return f"{no}화 이미지 없음"

        # 각 이미지 다운로드 작업을 생성
        task_args = []
        for idx, img_url in enumerate(final_list):
            save_path = os.path.join(path, f"{idx + 1:03d}.jpg")
            task_args.append((img_url, save_path, headers))

        # 내부적으로 이미지를 병렬 다운로드 (필요에 따라 조절)
        with ThreadPoolExecutor(max_workers=5) as img_executor:
            img_executor.map(save_image, task_args)

        print(f"   ㄴ [성공] {no}화 다운로드 완료")
        return f"{no}화 완료"
    except Exception as e:
        return f"{no}화 에러: {e}"


In [40]:
# 3. 모든 회차를 비동기로 관리하는 메인 함수
def download_all_episode(title, list_url):
    match = re.search(r'titleId=(\d+)', list_url)
    if not match: return
    title_id = match.group(1)

    api_url = f"https://comic.naver.com/api/article/list?titleId={title_id}&page=1"
    headers = {'User-Agent': 'Mozilla/5.0'}
    
    res = requests.get(api_url, headers=headers)
    articles = res.json().get('articleList', [])

    print(f"[{title}] 총 {len(articles)}개 회차를 동시에 비동기로 다운로드합니다.")

    # 전체 회차에 대한 작업을 리스트로 만듭니다.
    episode_tasks = []
    for article in articles:
        no = article['no']
        detail_url = f"https://comic.naver.com/webtoon/detail?titleId={title_id}&no={no}"
        episode_tasks.append((title, no, detail_url))

    # [핵심] 여러 회차를 동시에 실행 (max_workers=4 정도로 설정하여 서버 차단 방지)
    # 4개의 회차가 동시에 다운로드됩니다.
    with ThreadPoolExecutor(max_workers=4) as ep_executor:
        ep_executor.map(lambda p: download_one_episode(*p), episode_tasks)

    print("\n[모든 작업 완료]")

In [None]:
download_all_episode('배달왕', 'https://comic.naver.com/webtoon/list?titleId=823933')


[배달왕] 총 20개 회차를 동시에 비동기로 다운로드합니다.
