### 1-1. Daum 뉴스기사 제목 스크래핑하기


In [9]:
import requests
from bs4 import BeautifulSoup

# 사회 뉴스 
req_param = {
    'section': 'society'
}
url = 'https://news.daum.net/{section}'.format(**req_param)
print(url)

# 요청 헤더 설정 : 브라우저 정보
req_header = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
}

# requests 의 get() 함수 호출하기 
res = requests.get(url, headers=req_header)
res.encoding = 'utf-8'
print(res.status_code, res.ok)
print(type(res))
print(res)

# 응답(response)이 OK 이면
# 응답 (response)에서 text 추출
if res.ok:
    html = res.text
    # BeautifulSoup 객체 생성
    soup = BeautifulSoup(html, "html.parser")   

    # CSS 선택자
    # print(soup.select("a.item_newsheadline2"))
    '''
       <a class='item_newsheadline2' href='https://v.daum.net/v/...'>
         <div class='cont_thumb'>
           <strong class='tit_txt'>기사 제목</strong>
    '''
    a_tags = soup.select("a.item_newsheadline2")
    print(len(a_tags))
    print(type(a_tags)) #[Tag,Tag,Tag]

    # <a> 태그 리스트 순회하기
    for idx, a_tag in enumerate(a_tags, 1):        
        link = a_tag['href']
        strong_tag = a_tag.select_one('strong.tit_txt')
        title = strong_tag.text.strip() if strong_tag else '제목 없음'
        print(f'{idx} {title} {link}')
else:
    print(f'Error Code={res.status_code}')

# <a> 태그 리스트 순회하기    

# 응답(response)이 Error 이면 status code 출력

https://news.daum.net/society
200 True
<class 'requests.models.Response'>
<Response [200]>
9
<class 'bs4.element.ResultSet'>
1 [단독] '의정갈등'에 '장거리 이송'도 급증‥비수도권 직격탄 https://v.daum.net/v/20250722203113026
2 문에 ‘안전고리’ 다니…쪽방촌 여성 주민 방도 시원해졌다 https://v.daum.net/v/20250722203005994
3 [단독] 전세금 760억 등친 '수원 왕회장'…감옥서도 지인 앞세워 '돈벌이' https://v.daum.net/v/20250722202940985
4 [단독] 응급실 뺑뺑이 악화‥'2시간 초과' 2배 이상 늘어 https://v.daum.net/v/20250722202815955
5 중3, 대도시·읍면 ‘학업 격차’ 더 벌어지고 협동력 더 떨어졌다 https://v.daum.net/v/20250722202527894
6 박완수 경남지사 ‘경제수도 도약’·‘도민행복 시대 정착’ 이룬다 https://v.daum.net/v/20250722202517891
7 극한호우 잦고 강한데‥지정에 5년 걸리는 '산사태 취약지역' https://v.daum.net/v/20250722202513888
8 폭염 시작하자 그만둔 '실적왕' 택배기사... 다른 이유가 있었다 https://v.daum.net/v/20250722202408880
9 산불 지역은 피해 없다?‥엉터리 보고에 주민 '분통' https://v.daum.net/v/20250722202213848


### 1-2. 여러개의 section 중 하나를 선택해서 url에서 뉴스기사의 링크와 제목을 출력하는 코드(함수)



In [16]:
import requests
from bs4 import BeautifulSoup

section_dict = {'기후환경': 'climate', '사회': 'society', '경제': 'economy', '정치': 'politics',
                 '국제': 'world', '문화': 'culture', '생활': 'life', 'IT/과학': 'tech', '인물': 'people'}

def print_news(section):
    sid = section_dict[section]
    url = f'https://news.daum.net/{sid}'
    print(f'{url} {section} 뉴스')

    # 요청 헤더 설정 : 브라우저 정보
    req_header = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
    }

    # requests 의 get() 함수 호출하기 
    res = requests.get(url, headers=req_header)
    res.encoding = 'utf-8'
    print(res.status_code, res.ok)

    if res.ok:
        html = res.text
        soup = BeautifulSoup(html, "html.parser")

        # 뉴스 리스트 추출
        a_tags = soup.select("ul.list_newsheadline2 > li > a")
        print(len(a_tags))

        for idx, a_tag in enumerate(a_tags, 1):
            title_tag = a_tag.select_one("strong.tit_txt")
            title = title_tag.text.strip() if title_tag else "제목 없음"
            link = a_tag['href']
            print(f'{idx} {title} {link}')
    else:
        print(f'Error Code={res.status_code}')

In [18]:
print_news('사회')

https://news.daum.net/society 사회 뉴스
200 True
9
1 김계환 前해병사령관 구속영장 기각…"도망·증거인멸 우려 없어"(종합) https://v.daum.net/v/20250722211442045
2 760억 등친 '수원 왕회장' 숨은 재산 추적…감옥서도 돈벌이, 피해자 두 번 울린 전세사기단 https://v.daum.net/v/20250722210541832
3 “×× 시청인데요, 물품 대리납품 좀…” 전국 공무원 사칭 사기 주의!! https://v.daum.net/v/20250722210344774
4 의대생 복귀 방안 협의 막바지…반대 국민청원은 5만 돌파 https://v.daum.net/v/20250722205947653
5 [밀착카메라] 장마엔 젖어서, 폭염엔 더워서…안전 위험한 '폐지 어르신' https://v.daum.net/v/20250722205117470
6 [호국의 성지 남해 관음포]삼별초는 왜 남해로 향했나 https://v.daum.net/v/20250722204626341
7 “800억 어디서 구하나” 부산오페라하우스 발등의 불 https://v.daum.net/v/20250722204505326
8 [고립·은둔 청년 방문을 열다] '일상'이 낯설던 청년들, 다시 일상을 배우다 https://v.daum.net/v/20250722203829159
9 [단독] 110억 혈세에 자산 31배 급증… 대구치맥축제 주최단체 도마위 https://v.daum.net/v/20250722203442092
