### 1. Daum 뉴스 기사 제목 스크래핑하기

질문1. 아래의 url에서 뉴스 기사의 링크와 제목을 출력하시오
*  경제 뉴스 url = 'https://news.daum.net/economy'

In [28]:
import requests
from bs4 import BeautifulSoup

# dict 타입으로 요청 파라미터 설정
# 요청 파라미터 설정: 고정된 주소 뒤에 내가 원하는 조건(카테고리 등)을 유동적으로 조립하기 위해 미리 값을 준비해두는 과정
req_param = {
    'category': 'economy' 
}

url = 'https://news.daum.net/{category}'.format(**req_param)
print(url) 

# 요청 헤더 설정 why? 프로그램이 아닌 사람처럼 보이게 하기 위함
# 개발자 도구 네트워크 Doc의 헤더에서 가져올 수 있음
req_header = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/144.0.0.0 Safari/537.36'
}

# requests의 get() 함수 호출하기
# requests.get(): 이 주소(URL)에 있는 정보를 나에게 보내달라고 요청 하는 역할
# url: "어디로" 갈 것인가? e.g. 다음 경제 뉴스 페이지
# headers=req_header: "어떤 모습으로" 갈 것인가? 앞서 설명한 것처럼 user-agent를 담아 사람인 척 위장하는 가면을 쓰는 부분
res = requests.get(url, headers=req_header)

print(type(res)) 
print(res.status_code) 

# 서버에서 제공한 실제 인코딩 방식으로 강제 설정 (한글 깨짐 방지)
res.encoding = res.apparent_encoding

# if res.ok: 서버로부터 응답을 제대로 받았는지
if res.ok:
    # res.text는 긴 글자 뭉친인데 BeautifulSoup을 거치면 '태그를 찾아줘' 등과 같은 명령어를 쓸 수 있는 soup 객체가 됨
    # html.parser: BeautifulSoup에게 html.parser 도구로 분석하라고 알려줌
    soup = BeautifulSoup(res.text, 'html.parser')
    
    # type: 데이터 형식
    # len: 그 안에 든 뉴스 기사가 몇 개인지
    print(type(ul_tags), len(ul_tags)) 

    # 긴 html에서 내가 원하는 부분만 가져오기
    # ul.list_newsheadline2: 클래스가 list_newsheadline2인 ul 태그 찾기
    # a.item_newsheadline2: 클래스가 item_newsheadline2인 a 태그들만 찾기
    ul_tags = soup.select("ul.list_newsheadline2 a.item_newsheadline2")

    # 찾아온 뉴스 꾸러미(ul_tags)에서 기사를 하나씩 꺼내서(ul_tag) 아래 작업을 반복
    for ul_tag in ul_tags:

        # <ul>...</ul> 태그 사이에 적힌 글자(뉴스 제목)만 가져오기
        # .text: 태그 안의 텍스트만 가져오기
        # .strip(): 공백, 줄바꿈 제거
        title = ul_tag.text.strip() 

        # 해당하는 링크 가져오기
        link = ul_tag['href']

        print(link, title)

else:
    # 응답(response)이 Error이면 status code 출력
    print(f'Error Code = {res.status_code}')

https://news.daum.net/economy
<class 'requests.models.Response'>
200
<class 'bs4.element.ResultSet'> 9
https://v.daum.net/v/20260206210724599 '美 정부 안전망 없다' 충격…비트코인 6만달러선까지 후퇴·이더리움도 동반 흔들 [이수현의 코인레이더] <이수현의 코인레이더>는 한 주간 가상자산(암호화폐) 시장의 흐름을 짚고, 그 배경을 해설하는 코너입니다. 단순한 시세 나열을 넘어 글로벌 경제 이슈와 투자자 움직임을 입체적으로 분석하며, 시장의 방향성을 가늠할 수 있는 인사이트를 제공합니다. 주요 코인 1. 비트코인(BTC) 이번 주 비트코인은 브레이크 없는 하락세를 보이면서 결국 6만달러선까지 하락 한국경제 7분 전
https://v.daum.net/v/20260206202727940 정책자금 브로커 구조 손본다…중기부, 서류 간소화도 추진 KBS 47분 전
https://v.daum.net/v/20260206185614120 휴머노이드 상용화 ‘초읽기’…“안전성·신뢰성이 최우선” 한겨레 2시간 전
https://v.daum.net/v/20260206184326845 EV 부진에 배터리서 발 빼는 美 완성차… LG에너지솔루션, 스텔란티스 합작법인 인수 동아일보 3시간 전
https://v.daum.net/v/20260206172807685 키키도 소환한 그 감성⋯Y2K, 왜 아직도 먹히냐면요 [솔드아웃] 이투데이 4시간 전
https://v.daum.net/v/20260206162540251 2026 지금은 크립토 윈터인가? 규제 이후 시장의 변화 [타이거리서치 리포트] 한국경제 5시간 전
https://v.daum.net/v/20260206160226448 1년새 2900% '폭풍 성장'…"주식 토큰화, '코스닥 3000' 만들 성장동력" 한국경제 5시간 전
https://v.daum.net/v/20260206153503273 새벽은 풀고, 일요일 묶어

질문2. 여러개의 section 중 하나를 선택해서 url에서 뉴스기사의 링크와 제목을 출력하는 코드를 함수로 작성하기
*   경제 뉴스 url = 'https://news.daum.net/economy'
*   사회 뉴스 url = 'https://news.daum.net/society'

In [25]:
import requests
from bs4 import BeautifulSoup

section_dict = {'기후/환경':'climate','사회':'society','경제':'economy','정치':'politics', '국제':'world','문화':'culture',
                '생활':'life','IT/과학':'tech','인물':'people','지식/칼럼':'understanding','연재':'series'}

def print_news(section_name):
    # 정치: section_dict에 없을 때를 대비한 기본값  
    sid = section_dict.get(section_name, '정치')
    url = f'https://news.daum.net/{sid}'
    # f-string: 문자열 안에서 중괄호 { }를 사용해 변수나 계산식을 직접 넣을 수 있음
    # print("======>" + url + section_name + "뉴스" + "<======")
    print(f'======> {url} {section_name} 뉴스 <======')

    # 요청 헤더 설정
    req_header = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/144.0.0.0 Safari/537.36'
    }

    # requests의 get() 함수 호출하기
    # requests.get(): 이 주소(URL)에 있는 정보를 나에게 보내달라고 요청 하는 역할
    # url: "어디로" 갈 것인가? e.g. 다음 경제 뉴스 페이지
    # headers=req_header: "어떤 모습으로" 갈 것인가? 앞서 설명한 것처럼 user-agent를 담아 사람인 척 위장하는 가면을 쓰는 부분
    res = requests.get(url, headers=req_header)

    # 서버에서 제공한 실제 인코딩 방식으로 강제 설정 (한글 깨짐 방지)
    res.encoding = res.apparent_encoding
    
    # if res.ok: 서버로부터 응답을 제대로 받았는지
    if res.ok:
        # res.text는 긴 글자 뭉친인데 BeautifulSoup을 거치면 '태그를 찾아줘' 등과 같은 명령어를 쓸 수 있는 soup 객체가 됨
        # html.parser: BeautifulSoup에게 html.parser 도구로 분석하라고 알려줌
        soup = BeautifulSoup(res.text, 'html.parser')

        # 긴 html에서 내가 원하는 부분만 가져오기
        # ul.list_newsheadline2: 클래스가 list_newsheadline2인 ul 태그 찾기
        # a.item_newsheadline2: 클래스가 item_newsheadline2인 a 태그들만 찾기
        ul_tags = soup.select("ul.list_newsheadline2 a.item_newsheadline2")

        # 찾아온 뉴스 꾸러미(ul_tags)에서 기사를 하나씩 꺼내서(ul_tag) 아래 작업을 반복
        for ul_tag in ul_tags:

            # <ul>...</ul> 태그 사이에 적힌 글자(뉴스 제목)만 가져오기
            # .text: 태그 안의 텍스트만 가져오기
            # .strip(): 공백, 줄바꿈 제거
            title = ul_tag.text.strip() 

            # 해당하는 링크 가져오기
            link = ul_tag['href']

            print(link, title)

    else:
            # 응답(response)이 Error이면 status code 출력
            print(f'Error Code = {res.status_code}')

In [24]:
print_news('경제')
print_news('사회')

https://v.daum.net/v/20260206202727940 정책자금 브로커 구조 손본다…중기부, 서류 간소화도 추진 정부가 중소기업·소상공인 정책자금 신청 과정에서 브로커의 개입을 막기 위해 정책자금 신청 때 제출 서류를 간소화하는 등 제도 개편에 나서기로 했습니다. 중소벤처기업부는 오늘(6일) 영등포구 중소기업중앙회에서 노용석 제1차관 주재로 중소벤처기업진흥공단, 소상공인시장진흥공단, 기술보증기금, 신용보증재단중앙회, 중소기업기술정보진흥원, 창업진흥원 등이 참여한 KBS 23분 전
https://v.daum.net/v/20260206185614120 휴머노이드 상용화 ‘초읽기’…“안전성·신뢰성이 최우선” 한겨레 2시간 전
https://v.daum.net/v/20260206184326845 EV 부진에 배터리서 발 빼는 美 완성차… LG에너지솔루션, 스텔란티스 합작법인 인수 동아일보 2시간 전
https://v.daum.net/v/20260206172807685 키키도 소환한 그 감성⋯Y2K, 왜 아직도 먹히냐면요 [솔드아웃] 이투데이 3시간 전
https://v.daum.net/v/20260206162540251 2026 지금은 크립토 윈터인가? 규제 이후 시장의 변화 [타이거리서치 리포트] 한국경제 4시간 전
https://v.daum.net/v/20260206160226448 1년새 2900% '폭풍 성장'…"주식 토큰화, '코스닥 3000' 만들 성장동력" 한국경제 5시간 전
https://v.daum.net/v/20260206153503273 새벽은 풀고, 일요일 묶어버리면… 대형마트 새벽배송 논의, 지표가 먼저 보여준 결과 JIBS 5시간 전
https://v.daum.net/v/20260206152943998 [단독] '17만' 군인 노후자금 녹는다…3700억 지원 '논란 폭발' 한국경제 5시간 전
https://v.daum.net/v/20260206143213520 [연합뉴스 이 시각 헤드라인] - 14:30 연합뉴스 6시간 전
ht

### 2-1. Nate 뉴스 기사 제목 스크래핑하기

### 2-2. 하나의 네이버 웹툰과 1개의 회차에 대한 Image 다운로드 하기

### 2-3. 하나의 네이버 웹툰과 여러개의 회차에 대한 Image 다운로드 하기