In [16]:
import requests
from bs4 import BeautifulSoup

url = 'https://news.daum.net/economy'
print(f"접속할 URL: {url}")

# 요청 헤더 설정: 브라우저 정보 (일반적인 크롬 User-Agent)
req_header = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
}

# requests의 get() 함수 호출
try:
    res = requests.get(url, headers=req_header)
    print(f"응답 상태 코드: {res.status_code}, 성공 여부: {res.ok}")

    # 응답(response)이 OK 이면
    if res.ok:
        html = res.content.decode('utf-8')
        soup = BeautifulSoup(html, "html.parser")
        li_tags = soup.select('ul.list_newsheadline2 li')
        if not li_tags:
            li_tags = soup.select('ul.list_news li')
            print("\n(참고: 'ul.list_newsheadline2'에서 기사를 찾지 못해 'ul.list_news'에서 다시 탐색합니다.)")
        print(f"\n찾은 뉴스 기사 개수: {len(li_tags)}")
        print("--- 뉴스 기사 제목과 링크 ---")
        if len(li_tags) > 0:
            for idx, li_tag in enumerate(li_tags, 1):
                # <a> 태그 찾기
                a_tag = li_tag.find('a')
                link = "링크 없음"
                if a_tag and 'href' in a_tag.attrs:
                    link = a_tag['href']

                # <strong class="tit_txt"> 태그 찾기
                strong_tag = li_tag.select_one('div.cont_thumb strong.tit_txt')
                title = "제목 없음"
                if strong_tag:
                    title = strong_tag.text.strip()
                else:
                    # 만약 strong_tag가 없으면, a_tag 자체의 텍스트를 제목으로 시도
                    if a_tag:
                        title = a_tag.text.strip()

                if title and title != "제목 없음" and link and link != "링크 없음" and (link.startswith('http://') or link.startswith('https://')):
                    print(f'{idx}. 제목: {title}\n   링크: {link}\n')
        else:
            print("지정된 CSS 선택자로 기사를 찾을 수 없습니다. HTML 구조를 다시 확인해주세요.")

    # 응답(response)이 Error 이면 status code 출력
    else:
        print(f'오류 발생! 응답 코드 = {res.status_code}')

except requests.exceptions.RequestException as e:
    print(f"요청 중 오류 발생: {e}")

접속할 URL: https://news.daum.net/economy
응답 상태 코드: 200, 성공 여부: True

찾은 뉴스 기사 개수: 9
--- 뉴스 기사 제목과 링크 ---
1. 제목: 경제통상 외교수장들, 대거 미국행... 관세 타결·한미정상회담 열릴까
   링크: https://v.daum.net/v/20250722190900992

2. 제목: 퇴근하면 시작된다...유통업계 다시 불붙은 '6시 쇼핑' 전쟁
   링크: https://v.daum.net/v/20250722185103483

3. 제목: “자율주행, 이동약자 지원하는 ‘공공성’에 초점 맞춰야”
   링크: https://v.daum.net/v/20250722183143976

4. 제목: 꾸준히 강세 흐름 보이는 메이저 알트코인들 : 코리안 크립토 위클리 [INFCL 리서치]
   링크: https://v.daum.net/v/20250722181057244

5. 제목: 세계시장 제패한 K뷰티·푸드…'첨단' 아니라며 R&D지원은 쥐꼬리
   링크: https://v.daum.net/v/20250722175548581

6. 제목: 예금자보호 1억 시대…내 돈 어디에 맡길까?
   링크: https://v.daum.net/v/20250722174746199

7. 제목: 전재수 해수 후보자 조선업 '신경전'에 김정관 산업장관 '신중론'
   링크: https://v.daum.net/v/20250722174241984

8. 제목: 재료비·배달에 무릎꿇은 '한국인의 밥상'…백반집이 사라진다
   링크: https://v.daum.net/v/20250722171546881

9. 제목: “흑자 전환 노린다” 국내외 의료 AI, 실적 경쟁 치열
   링크: https://v.daum.net/v/20250722171502827



In [None]:
import requests
from bs4 import BeautifulSoup

# 다음 뉴스는 섹션 이름이 URL에 직접 들어가는 경우가 많습니다.
# 예: news.daum.net/economy, news.daum.net/society
section_url_map = {
    '정치': 'politics', '경제': 'economy', '사회': 'society', '문화': 'culture', '생활': 'life', 'IT/과학': 'tech'
}

def print_daum_news(section_name_korean):
    # section_url_map에서 해당 섹션의 영문 URL 부분을 가져옵니다.
    section_string = section_url_map.get(section_name_korean)

    if not section_string:
        print(f"'{section_name_korean}'에 해당하는 다음 뉴스 섹션 URL을 찾을 수 없습니다.")
        print(f"유효한 섹션: {list(section_url_map.keys())}")
        return

    # 다음 뉴스 URL 구성: https://news.daum.net/{section_string}
    url = f'https://news.daum.net/{section_string}'
    print(f'\n--- {url} {section_name_korean} 뉴스 ---')

    req_header = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36"
    }

    try:
        res = requests.get(url, headers=req_header)
        print(f"응답 상태 코드: {res.status_code}, 성공 여부: {res.ok}")

        if res.ok:
            # 한글 깨짐 방지를 위해 res.content를 명시적으로 UTF-8로 디코딩
            html = res.content.decode('utf-8')
            soup = BeautifulSoup(html, "html.parser")

           
            news_items = soup.select('ul.list_news li')

            # 만약 위 선택자로 기사가 없으면, 'ul.list_newsheadline2 li'도 시도 (주로 메인 헤드라인)
            if not news_items:
                news_items = soup.select('ul.list_newsheadline2 li')
                print("(참고: 'ul.list_news'에서 기사를 찾지 못해 'ul.list_newsheadline2'에서 다시 탐색합니다.)")
            
            # 다른 종류의 리스트나 아이템 컨테이너도 있을 수 있습니다. (예: div.item_news)
            # 상황에 따라 추가적인 선택자 탐색 로직이 필요할 수 있습니다.
            if not news_items:
                 news_items = soup.select('div.item_news')
                 print("(참고: 다른 목록에서도 기사를 찾지 못해 'div.item_news'에서 다시 탐색합니다.)")


            print(f"찾은 뉴스 기사 개수: {len(news_items)}")

            if len(news_items) > 0:
                for idx, item_tag in enumerate(news_items, 1):
                    # 가장 일반적인 뉴스 제목/링크 태그인 'a.link_txt'를 먼저 시도
                    a_tag = item_tag.select_one('a.link_txt')

                    title = "제목 없음"
                    link = "링크 없음"

                    if a_tag:
                        title = a_tag.text.strip()
                        if 'href' in a_tag.attrs:
                            link = a_tag['href']
                    
                    if not title or title == "제목 없음":
                        nested_a_tag = item_tag.select_one('strong.tit_txt a')
                        if nested_a_tag:
                            title = nested_a_tag.text.strip()
                            if not link or link == "링크 없음":
                                if 'href' in nested_a_tag.attrs:
                                    link = nested_a_tag['href']
                        else: 
                            strong_text_tag = item_tag.select_one('strong.tit_txt')
                            if strong_text_tag:
                                title = strong_text_tag.text.strip()
                                if not link or link == "링크 없음":
                                    first_a_in_item = item_tag.find('a')
                                    if first_a_in_item and 'href' in first_a_in_item.attrs:
                                        link = first_a_in_item['href']


                    if title and title != "제목 없음" and link and link != "링크 없음" and (link.startswith('http://') or link.startswith('https://')):
                        print(f'{idx}. 제목: {title}\n   링크: {link}\n')

            else:
                print("지정된 CSS 선택자로 기사를 찾을 수 없습니다. 다음 뉴스 HTML 구조를 다시 확인해주세요.")
        else:
            print(f'오류 발생! 응답 코드 = {res.status_code}')

    except requests.exceptions.RequestException as e:
        print(f"요청 중 오류 발생: {e}")

print_daum_news('경제') 
print_daum_news('문화') 


--- https://news.daum.net/economy 경제 뉴스 ---
응답 상태 코드: 200, 성공 여부: True
(참고: 'ul.list_news'에서 기사를 찾지 못해 'ul.list_newsheadline2'에서 다시 탐색합니다.)
찾은 뉴스 기사 개수: 9
1. 제목: 경제통상 외교수장들, 대거 미국행... 관세 타결·한미정상회담 열릴까
   링크: https://v.daum.net/v/20250722190900992

2. 제목: 퇴근하면 시작된다...유통업계 다시 불붙은 '6시 쇼핑' 전쟁
   링크: https://v.daum.net/v/20250722185103483

3. 제목: “자율주행, 이동약자 지원하는 ‘공공성’에 초점 맞춰야”
   링크: https://v.daum.net/v/20250722183143976

4. 제목: 꾸준히 강세 흐름 보이는 메이저 알트코인들 : 코리안 크립토 위클리 [INFCL 리서치]
   링크: https://v.daum.net/v/20250722181057244

5. 제목: 세계시장 제패한 K뷰티·푸드…'첨단' 아니라며 R&D지원은 쥐꼬리
   링크: https://v.daum.net/v/20250722175548581

6. 제목: 예금자보호 1억 시대…내 돈 어디에 맡길까?
   링크: https://v.daum.net/v/20250722174746199

7. 제목: 전재수 해수 후보자 조선업 '신경전'에 김정관 산업장관 '신중론'
   링크: https://v.daum.net/v/20250722174241984

8. 제목: 식재료비 뛰고 사장님은 늙고…동네 백반집이 사라진다
   링크: https://v.daum.net/v/20250722171546881

9. 제목: “흑자 전환 노린다” 국내외 의료 AI, 실적 경쟁 치열
   링크: https://v.daum.net/v/20250722171502827


--- https://news.daum.net/culture 문화 뉴스 -