In [6]:
import requests
from bs4 import BeautifulSoup

# 다음 경제 뉴스 URL
url = 'https://news.daum.net/economy'

# 요청 및 응답 확인
res = requests.get(url)
res.encoding = 'utf-8'  # 인코딩 지정

print(url)
print(type(res))           # <class 'requests.models.Response'>
print(res.status_code)     # 200이면 성공

# HTML 파싱
soup = BeautifulSoup(res.text, 'html.parser')

# 뉴스 리스트 추출
li_tags = soup.select('ul.list_newsheadline2 li')
print(type(li_tags), len(li_tags))  # <class 'bs4.element.ResultSet'>, 뉴스 개수

# 링크와 제목 출력
for li in li_tags:
    a_tag = li.find('a')
    link = a_tag['href']
    
    strong_tag = li.select_one('div.cont_thumb strong.tit_txt')
    title = strong_tag.text.strip() if strong_tag else '(제목 없음)'
    
    print(link)
    print(title)




https://news.daum.net/economy
<class 'requests.models.Response'>
200
<class 'bs4.element.ResultSet'> 9
https://v.daum.net/v/20250722210317765
韓 반도체는 깨어날 줄 모르고 [AI 칩 전쟁…한국은 없다?]
https://v.daum.net/v/20250722204242273
소비쿠폰 쓰려다가 '화들짝'…"여기서는 못써요" 응답에 '당황'한 소비자
https://v.daum.net/v/20250722202007801
‘해수부 부산 시대’ 조선·해양플랜트까지 업무 넓혀야
https://v.daum.net/v/20250722200357366
[이슈대담] “2040년 석탄화력발전소 폐쇄…신재생 에너지 전환”
https://v.daum.net/v/20250722190900992
경제통상 외교수장들, 대거 미국행... 관세 타결·한미정상회담 열릴까
https://v.daum.net/v/20250722185103483
퇴근하면 시작된다...유통업계 다시 불붙은 '6시 쇼핑' 전쟁
https://v.daum.net/v/20250722183143976
“자율주행, 이동약자 지원하는 ‘공공성’에 초점 맞춰야”
https://v.daum.net/v/20250722181057244
꾸준히 강세 흐름 보이는 메이저 알트코인들 : 코리안 크립토 위클리 [INFCL 리서치]
https://v.daum.net/v/20250722175548581
세계시장 제패한 K뷰티·푸드…'첨단' 아니라며 R&D지원은 쥐꼬리


In [17]:
import requests
from bs4 import BeautifulSoup

# 섹션명과 URL 끝 경로 매핑
section_dict = {
    '기후/환경': 'climate',
    '사회': 'society',
    '경제': 'economy',
    '정치': 'politics',
    '국제': 'world',
    '문화': 'culture',
    '생활': 'life',
    'IT/과학': 'tech',
    '인물': 'people'
}

# 뉴스 출력 함수
def print_news(section_name):
    # 1. 섹션 영문 경로 추출
    if section_name not in section_dict:
        print(f"[오류] '{section_name}' 섹션은 존재하지 않습니다.")
        return
    
    section_path = section_dict[section_name]
    url = f'https://news.daum.net/{section_path}'
    
    print(f"\n======> {url} {section_name} 뉴스 <======")

    # 2. 웹 요청 및 파싱
    res = requests.get(url)
    res.encoding = 'utf-8'
    if res.status_code != 200:
        print(f"[에러] 요청 실패: {res.status_code}")
        return
    
    soup = BeautifulSoup(res.text, 'html.parser')

    # 3. 뉴스 리스트 선택자
    li_tags = soup.select('ul.list_newsheadline2 li')

    # 4. 결과 출력
    for li in li_tags:
        a_tag = li.find('a')
        link = a_tag['href'] if a_tag else '(링크 없음)'
        
        strong_tag = li.select_one('div.cont_thumb strong.tit_txt')
        title = strong_tag.text.strip() if strong_tag else '(제목 없음)'
        
        print(link)
        print(title)



In [18]:
print_news('경제')
print_news('인물')



https://v.daum.net/v/20250722210317765
韓 반도체는 깨어날 줄 모르고 [AI 칩 전쟁…한국은 없다?]
https://v.daum.net/v/20250722204242273
소비쿠폰 쓰려다가 '화들짝'…"여기서는 못써요" 응답에 '당황'한 소비자
https://v.daum.net/v/20250722202007801
‘해수부 부산 시대’ 조선·해양플랜트까지 업무 넓혀야
https://v.daum.net/v/20250722200357366
[이슈대담] “2040년 석탄화력발전소 폐쇄…신재생 에너지 전환”
https://v.daum.net/v/20250722190900992
경제통상 외교수장들, 대거 미국행... 관세 타결·한미정상회담 열릴까
https://v.daum.net/v/20250722185103483
퇴근하면 시작된다...유통업계 다시 불붙은 '6시 쇼핑' 전쟁
https://v.daum.net/v/20250722183143976
“자율주행, 이동약자 지원하는 ‘공공성’에 초점 맞춰야”
https://v.daum.net/v/20250722181057244
꾸준히 강세 흐름 보이는 메이저 알트코인들 : 코리안 크립토 위클리 [INFCL 리서치]
https://v.daum.net/v/20250722175548581
세계시장 제패한 K뷰티·푸드…'첨단' 아니라며 R&D지원은 쥐꼬리

https://v.daum.net/v/20250722214300560
[농촌 살리는 귀농스토리] ‘아버지 농법’ 걷어내고 ‘선진기술’로 일군 ‘대농의 꿈’
https://v.daum.net/v/20250722192238426
황규철 옥천군수 “옥천의 미래 위한 초심 잃지 않겠다”
https://v.daum.net/v/20250722192212410
“그 시절 떠오르니 즐겁구먼유”
https://v.daum.net/v/20250722184640374
[인터뷰…공감] “러브버그와 공존 방법 찾겠다” 박선재 국립생물자원관 연구관
https://v.daum.

In [None]:
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from IPython.display import Image, display

# Nate 섹션 URL 매핑
section_dict = {
    '최신뉴스': 'n0100',
    '정치': 'n0200',
    '경제': 'n0300',
    '사회': 'n0400',
    '세계': 'n0500',
    'IT/과학': 'n0600'
}

# 기본 도메인
base_url = 'https://news.nate.com/recent?mid='
image_base = 'https:'

# 뉴스 출력 함수
def print_nate_news(section_name):
    # 1. 섹션 코드 확인
    mid = section_dict.get(section_name)
    if not mid:
        print(f"[오류] '{section_name}' 섹션은 존재하지 않습니다.")
        return
    
    # 2. URL 생성 및 요청
    url = base_url + mid
    print(f'\n======> {url} {section_name} 뉴스 <======')

    headers = {
        "user-agent": (
            "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
            "AppleWebKit/537.36 (KHTML, like Gecko) "
            "Chrome/138.0.0.0 Safari/537.36"
        )
    }
    res = requests.get(url, headers=headers)
    
    if res.ok:
        soup = BeautifulSoup(res.text, 'html.parser')
        news_items = soup.select('div.post')  # 뉴스 영역

        print(f"[총 {len(news_items)}개 뉴스]")

        for idx, item in enumerate(news_items, 1):
            # 제목과 링크
            a_tag = item.select_one('a.lt1')
            if not a_tag:
                continue
            title = a_tag.text.strip()
            link = a_tag['href']
            full_link = urljoin(base_url, link)

            # 이미지 처리
            img_tag = item.select_one('span.thumb img')
            if img_tag and img_tag.has_attr('src'):
                img_src = img_tag['src'].strip()
                img_url = urljoin(image_base, img_src)
            else:
                img_url = None

            # 결과 출력
            print(f'{idx}. {title}')
            print(f'링크: {full_link}')
            if img_url:
                print(f'이미지: {img_url}')
                display(Image(img_url))
            else:
                print('이미지 없음')
    else:
        print(f"[Error] 응답 실패. 상태코드 = {res.status_code}")


In [None]:
import requests
from bs4 import BeautifulSoup
import os

def download_one_episode(title, no, url):
    # 요청 헤더
    req_header = {
        'referer': url,
        "user-agent": (
            "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
            "AppleWebKit/537.36 (KHTML, like Gecko) "
            "Chrome/104.0.0.0 Safari/537.36"
        )
    }

    res = requests.get(url, headers=req_header)
    if res.ok:
        soup = BeautifulSoup(res.text, 'html.parser')
        img_tags = soup.select("img[src*='IMAG01']")

        # 디렉토리 생성: img/제목/회차번호
        base_dir = os.path.join("img", title, str(no))
        os.makedirs(base_dir, exist_ok=True)

        for idx, img_tag in enumerate(img_tags, 1):
            img_url = img_tag['src']
            img_data = requests.get(img_url, headers=req_header).content

            ext = os.path.splitext(img_url)[-1]
            filename = f"{idx:03d}{ext}"
            file_path = os.path.join(base_dir, filename)

            with open(file_path, 'wb') as file:
                file.write(img_data)
                print(f"✓ 저장됨: {file_path} ({len(img_data):,} bytes)")
    else:
        print(f"[Error] 요청 실패: {res.status_code}")
