### 연습문제 2-1 

In [None]:
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from IPython.display import Image, display


BASE_URL = 'https://news.nate.com'
SECTIONS = {
    '정치': 'n0101',
    '경제': 'n0102',
    '사회': 'n0103',
    '세계': 'n0104',
    'IT/과학': 'n0105',
    '생활/문화': 'n0106'
}


def fetch_section_news(section_code):
    url = f"{BASE_URL}/recent"
    params = {'mid': section_code}
    headers = {'User-Agent': 'Mozilla/5.0'}
    resp = requests.get(url, params=params, headers=headers)
    resp.raise_for_status()
    soup = BeautifulSoup(resp.text, 'html.parser')

    news_cards = soup.select('div.mlt01')  
    items = []

    for card in news_cards:
        a_tag = card.find('a')
        if not a_tag or not a_tag.get('href'):
            continue

        link = urljoin(BASE_URL, a_tag['href'])  
        title_tag = card.select_one('h2.tit')
        title = title_tag.get_text(strip=True) if title_tag else '제목 없음'

        img_tag = card.find('img')
        img_src = urljoin(BASE_URL, img_tag['src']) if img_tag and img_tag.get('src') else None

        items.append({'title': title, 'link': link, 'img_src': img_src})

    return items


def display_section(section_name):
    code = SECTIONS.get(section_name)
    if not code:
        print(f"섹션 이름 '{section_name}'은(는) 유효하지 않습니다")
        return

    print(f"\n## [{section_name}] 섹션")
    try:
        news_items = fetch_section_news(code)
    except Exception as e:
        print(f"  오류 발생: {e}")
        return

    if not news_items:
        print("  뉴스 없음")
        return

    for item in news_items:
        print(f"- {item['title']}")
        print(f"  링크: {item['link']}")
        if item['img_src']:
            try:
                display(Image(url=item['img_src']))
            except Exception as e:
                print("  이미지 표시 실패:", e)


In [15]:
display_section('정치')


## [정치] 섹션
- 특검, 김선교 의원실 전격 압수수색…양평고속도로 의혹 수사
  링크: https://news.nate.com/view/20250725n05438?mid=n0101


- 김정관·여한구, 미 상무장관 만나 관세 협상…제조업 협력 방안 제시
  링크: https://news.nate.com/view/20250725n05406?mid=n0101


- [속보] 특검, '양평공흥지구' 관련 김선교·최은순·김진우 압수수색
  링크: https://news.nate.com/view/20250725n05398?mid=n0101


- [속보]김건희 특검, 김건희 모친과 오빠·김선교 의원 압수수색···양평공흥지구 관련
  링크: https://news.nate.com/view/20250725n05371?mid=n0101


- [속보] 김건희 특검, 김 여사 가족·김선교 의원 압수수색…"양평고속도로 특혜 의혹"
  링크: https://news.nate.com/view/20250725n05363?mid=n0101


- 서울시장…오세훈 대항마는 누구?[지방선거 출마자]①
  링크: https://news.nate.com/view/20250725n02812?mid=n0101


- 박찬대 "尹 관저 앞 인간방패 45인, 의원직 제명해야"
  링크: https://news.nate.com/view/20250725n05266?mid=n0101


- 김태흠 충남지사 "민주당의 유럽 출장 비난은 악의적 정치 공세"
  링크: https://news.nate.com/view/20250725n05213?mid=n0101


- [뉴스UP] '강선우 사퇴' 후폭풍…민주당, 전대 앞두고 '명심' 논란
  링크: https://news.nate.com/view/20250725n05200?mid=n0101


- 발길 돌린 구윤철, 빈손 귀국 위성락
  링크: https://news.nate.com/view/20250725n00468?mid=n0101


- 부승찬 "합참의장, 김용대 지시에 반대? 모든 작전에 기획부터 개입해놓고 내로남불"
  링크: https://news.nate.com/view/20250725n05159?mid=n0101


- 김재원 "김문수, 전한길 말할 권리 보장하자는 입장이지만 전한길 주장에 동의는 안 해"
  링크: https://news.nate.com/view/20250725n05147?mid=n0101


- 화성 향남 플라스틱 공장서 큰 불…10명 대피·인명피해 없어
  링크: https://news.nate.com/view/20250725n05133?mid=n0101


- [자막뉴스] 박찬대 글 17분 만에 강선우 사퇴…정청래는 '일침'
  링크: https://news.nate.com/view/20250725n05120?mid=n0101


- 윤석열 前대통령 재산 79.9억…임기중 3.5억 증가
  링크: https://news.nate.com/view/20250725n05108?mid=n0101


- 대통령실 기자단에 '김어준 뉴스공장' 등 정식 출입
  링크: https://news.nate.com/view/20250725n05104?mid=n0101


- 대통령실 "출입기자단에 '김어준의 뉴스공장' 등록했다"
  링크: https://news.nate.com/view/20250725n04801?mid=n0101


- 김용태 "국힘, 개혁 늦었다…혁신 점수 0점 아닌 마이너스" [만났습니다]①
  링크: https://news.nate.com/view/20250725n01611?mid=n0101


- 영치금 호소한 尹…재산 80억 신고, 김건희 50억 신고
  링크: https://news.nate.com/view/20250725n03769?mid=n0101


- 李 "감사-수사에 복지부동 넘어 낙지부동" 보복 논란 감사원 겨냥
  링크: https://news.nate.com/view/20250725n00857?mid=n0101


### 연습문제 2-2 

In [9]:
import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

def download_one_episode(title, no, url):
    headers = {
        'User-Agent': 'Mozilla/5.0'
    }

    # 웹툰 페이지 요청
    response = requests.get(url, headers=headers)
    response.raise_for_status()

    # 파싱
    soup = BeautifulSoup(response.text, 'html.parser')

    # 웹툰 이미지 태그 선택
    img_tags = soup.select('div.wt_viewer img')

    if not img_tags:
        print("이미지를 찾을 수 없습니다.")
        return

    # 저장 경로 생성
    folder_path = os.path.join('img', title, str(no))
    os.makedirs(folder_path, exist_ok=True)

    print(f"{len(img_tags)}장의 이미지를 저장합니다")

    for idx, img in enumerate(img_tags, 1):
        img_url = img.get('src')
        if not img_url:
            continue

        full_img_url = urljoin(url, img_url)

        try:
            img_data = requests.get(full_img_url, headers=headers).content
        except Exception as e:
            print(f"{idx}번째 이미지 다운로드 실패: {e}")
            continue

        # 확장자 추출
        file_ext = os.path.splitext(full_img_url)[-1].split('?')[0]
        filename = f"{idx:03d}{file_ext}"
        file_path = os.path.join(folder_path, filename)

        with open(file_path, 'wb') as f:
            f.write(img_data)


    print("모든 이미지 다운로드 완료")



In [10]:
download_one_episode('일렉시드', 341, 'https://comic.naver.com/webtoon/detail?titleId=717481&no=341&week=wed')

88장의 이미지를 저장합니다
모든 이미지 다운로드 완료
