In [2]:
%pip install requests
%pip install pandas
%pip install beautifulsoup4
%pip install boto3
%pip install logging


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.
Collecting pandas
  Using cached pandas-2.2.3-cp311-cp311-macosx_11_0_arm64.whl.metadata (89 kB)
Collecting pytz>=2020.1 (from pandas)
  Using cached pytz-2024.2-py2.py3-none-any.whl.metadata (22 kB)
Collecting tzdata>=2022.7 (from pandas)
  Using cached tzdata-2024.2-py2.py3-none-any.whl.metadata (1.4 kB)
Using cached pandas-2.2.3-cp311-cp311-macosx_11_0_arm64.whl (11.3 MB)
Using cached pytz-2024.2-py2.py3-none-any.whl (508 kB)
Using cached tzdata-2024.2-py2.py3-none-any.whl (346 kB)
Installing collected packages: pytz, tzdata, pandas
Successfully installed pandas-2.2.3 pytz-2024.2 tzdata-2024.2

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is avail

## 동아일보

In [5]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
import logging
import os
import re
from datetime import datetime
from urllib.parse import urlparse

logging.basicConfig(level='DEBUG')

header = {'User-Agent': ('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                         '(KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'),}

output_dir = './donga'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

categories = {
    '정치': 'https://www.donga.com/news/Politics',
    '경제': 'https://www.donga.com/news/Economy',
    '국제': 'https://www.donga.com/news/Inter',
    '사회_사건': 'https://www.donga.com/news/Society/Event', # 앞 분기 기준
    '경제_과학': 'https://www.donga.com/news/It/List', # 앞 분기 기준
    '사회': 'https://www.donga.com/news/Society',
    '스포츠': 'https://www.donga.com/news/Sports',
}

result_categories = {
    '정치': 'politics',
    '경제': 'economy',
    '국제': 'world',
    '사회_사건': 'accident',
    '경제_과학': 'science',
    '사회': 'society',
    '스포츠': 'sports',
}

# 현재 날짜의 오전 8시 (시간대는 +09:00 기준)
today = datetime.now().replace(hour=8, minute=0, second=0, microsecond=0, tzinfo=datetime.now().astimezone().tzinfo)

def scrap_article(article_url, category):
    response = requests.get(article_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    try:
        page_category = soup.find('ol', class_='breadcrumb').find('li', class_='breadcrumb_item').find('a').get_text(strip=True)
        logging.info(f"page_category: {page_category}")
        
        logging.info(f"category: {category}")

        category_parts = category.split('_')
        
        # 카테고리가 아닌 글은 패스
        if page_category not in category_parts:
            logging.info(f"{article_url} 는 해당 카테고리가 아니어서 생략합니다. ")
            return None
    except AttributeError:
        logging.error(f"{article_url} 는 찾을 수 없습니다.")
        return None

    # 헤드라인 스크랩
    try:
        title = soup.find('section', {'class': 'head_group'}).find('h1').get_text(strip=True)
    except AttributeError:
        title = 'N/A'
        
    try:
        date_button = soup.find('button', {'aria-controls': 'dateInfo'})
        time_span = date_button.find('span', {'aria-hidden': 'true'})
        time = time_span.get_text(strip=True)  # "2024-09-30 21:44" 형태
        time = time.replace(" ", "T") + ":00+09:00"  # ISO 8601 형식으로 변환 (예: 2024-09-30T21:44:00+09:00)
    except AttributeError:
        time = 'N/A'

    # 본문 스크랩
    try:
        # 광고, 이미지 등 제외하고 텍스트만 추출
        content_section = soup.find('section', class_='news_view')
        for tag in content_section(['figure', 'script', 'div', 'ul']):  # 불필요한 태그 제거
            tag.decompose()
        content = content_section.get_text(separator="\n", strip=True)
    except AttributeError:
        content = 'N/A'

    result_category = result_categories.get(category, 'unknown')

    return {'title': title, 'source_url': article_url, 'content': content, 'category': result_category, 'source_created_at': time, 'press_id': 2, 'press_name' : '동아일보'}

# 파일 생성
def save_article_as_json(article_data, date, file_idx):
    category = article_data.get('category')
    file_name = date + "-" + str(file_idx) + '.json'
    result_dir = output_dir + "/" + category + "/" + date + "-" + str(file_idx)
    if not os.path.exists(result_dir):
        os.makedirs(result_dir)

    file_path = os.path.join(result_dir, 'source-' + file_name)
    
    # 단일 dataframe 생성
    single_article_df = pd.DataFrame([article_data])
    
    # json으로 변환
    single_article_df.to_json(file_path, orient='records', lines=True, force_ascii=False)
    logging.info(f"Article saved to {file_path}")

def check_for_new_articles(base_url, category):
    response = requests.get(base_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    article_count = 0
    cards = soup.find_all('article', class_='news_card')
    if category not in ['사회_사건', '경제_과학']:
        cards.reverse()
    for card in cards:
        if article_count >= 4:
            break

        link_tag = card.find('a', href=True)
        if link_tag and 'href' in link_tag.attrs:
            article_link = link_tag['href']
        else:
            logging.warning("article_link is None or missing 'href'.")
            continue
    
        logging.debug(f"Scraping article: {article_link}")

        result = scrap_article(article_link, category)

        if result is None:
            logging.error("result is None");
            continue

        # if result.get('category') not in ['accident', 'science']:
        # 'source_created_at'를 datetime 객체로 변환
        article_time = datetime.strptime(result.get('source_created_at'), '%Y-%m-%dT%H:%M:%S%z')
        # 오늘 오전 8시 이후가 아니면 continue
        if article_time < today:
            logging.info(f"{article_link} 은 오늘 오전 8시 이전 기사이므로 생략합니다.")
            continue
        
        print(result)
        article_count += 1
        date = re.match(r'^[^T]+', result.get('source_created_at')).group()
        save_article_as_json(result, date, article_count)

def scrap_all_categories():
    
    for category, base_url in categories.items():
        logging.info(f"category (base_url): {category} ({base_url})")
        check_for_new_articles(base_url, category)
        time.sleep(2)

scrap_all_categories()

INFO:root:category (base_url): 정치 (https://www.donga.com/news/Politics)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.donga.com/news/Politics/article/all/20241013/130203240/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics/article/all/20241013/130203240/1 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:Article saved to ./donga/politics/2024-10-13-1/source-2024-10-13-1.json
DEBUG:root:Scraping article: https://www.donga.com/news/Politics/article/all/20241013/130203317/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics/article/all/20241013/130203317/1 HTTP/11" 200 None
INFO:roo

{'title': '조국 “이재명 전화 받았다…내일 부산 금정 선거 지원”', 'source_url': 'https://www.donga.com/news/Politics/article/all/20241013/130203240/1', 'content': '“윤석열 정권 심판 대의에 복무하기 위해 가기로”\n조국 조국혁신당 대표는 13일 “어제 이재명 더불어민주당 대표의 전화를 받고 14일 부산 금정구청장 선거를 지원하기 위해 금정구를 방문하기로 했다”고 말했다.\n조 대표는 이날 자신의 페이스북에 이같이 밝혔다.\n그는 “저와 조국혁신당은 이번 재보궐선거 후보를 낼 때부터 부산 금정구청장 후보가 민주당 김경지 후보로 단일화되더라도 지원유세를 할 것이라고 수차례 공언해왔다”며 “혁신당은 후보단일화 이후 민주당의 부산 선거 전략에 맞춰 지원을 하려고 준비를 갖추고, 민주당의 요청을 기다리고 있었다”고 전했다.\n또 “투표가 며칠 안 남은 지금 영광과 곡성의 선거캠프에서는 큰 아쉬움을 표했지만, 윤석열 정권 심판이라는 대의에 복무하기 위해 흔쾌히 부산에 간다”고 강조했다.\n이어 “대신 당원 동지 여러분과 영광 곡성의 지지자께서는 제 몫까지 뛰어달라”며 “투표함을 다 열 때까지는 결과를 알 수 없는 치열한 경쟁이지만, 혁신당표 지방행정을 펼치고 평가받는 기회를 갖고 싶은 열망은 더 뜨거워진다”고 언급했다.\n(서울=뉴스1)', 'category': 'politics', 'source_created_at': '2024-10-13T09:23:00+09:00', 'press_id': 2, 'press_name': '동아일보'}
{'title': '北, 쓰레기풍선에 GPS 달았다…낙하지점 데이터 쌓은 듯', 'source_url': 'https://www.donga.com/news/Politics/article/all/20241013/130203317/1', 'content': '5월 이후 총 28차례 오물·쓰레기풍선 부양\n풍선 살포량 6000개 넘어…6억원 이상 소요\n

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics/article/all/20241013/130203496/1 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:Article saved to ./donga/politics/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.donga.com/news/Politics/article/all/20241013/130203698/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics/article/all/20241013/130203698/1 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:Article saved to ./donga/politics/2024-10-13-4/source-2024-10-13-4.json


{'title': '신원식 “북 ‘평양 무인기’ 대남 협박은 내부 통제용…무시가 정답”', 'source_url': 'https://www.donga.com/news/Politics/article/all/20241013/130203496/1', 'content': '“북 체제, 위협 있어야 생존…MZ는 안믿어”\n야권에 “북 비난 안하면서 우리 군에 가혹”\n“북 자살 결심 않으면 전쟁 일으키지 못해”\n“김정은 정밀 고위력 ‘현무’에 공포 느낄것”\n신원식 국가안보실장은 13일 북한이 평양 상공 무인기를 놓고 군사적 협박 등 대남 위협을 이어가는 데 대해 “(북한)체제 위협을 확대시키고 강조해서 내부 통제를 하는데 더 이점이 있다고 판단한 것으로, 그만큼 북한 내부가 흔들린다는 방증”이라며 “북한의 저런 말에 대해서는 무시하는 것이 최고의 정답”이라고 밝혔다.\n신 안보실장은 이날 KBS ‘일요진단’에서 “그 말대로 대한민국에서 무인기를 보내서 삐라까지 뿌렸는데 몰랐다면 얼마나 수치겠나. 그런데 북한은 방공망이 뚫렸다고 해서 느끼는 손해보다 ‘대한민국이 북한을 위협하고 있기 때문에 정신을 차리고 강력하게 대비해야 된다’(고 판단한 것)”이라며 이같이 말했다.\n그는 김여정 북한 노동당 부부장의 “다시 발견되는 순간 끔찍한 참변” 발언 등 고강도 대응이 군사적 도발을 위한 ‘명분 쌓기’라는 분석에 대해 “명분 쌓기 겸, 그보다 중요한 게 북한이 흔들리고 있는 내부 통제로 다시 긴장을 고조시키는 것이라고 본다”고 답했다.\n이어 “북한은 체제 위협을 국민들이 인식해야 체제가 생존하는 묘한 역설적 관계”라며 “북한의 MZ세대는 더 이상 체제 위협이 있다는 걸 잘 안 믿는데 이번에 (무인기를) 체제 위협으로 가장시킨 것”이라고 했다.\n신 실장은 무인기 관련 군의 ‘확인 불가’ 입장이 적절하다고 본다며 “야당에 좀 아쉬운 게, 북한의 도발과 억지와 핵무장에 대해서는 제대로 된 비난이나 문제제기를 안 하면서 우리 국민을 보호하기 위한 군과 정부의 노력에 대해서는 너무

INFO:root:category (base_url): 경제 (https://www.donga.com/news/Economy)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Economy HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.donga.com/news/People/article/all/20241012/130202730/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/People/article/all/20241012/130202730/1 HTTP/11" 200 None
INFO:root:page_category: 사람속으로
INFO:root:category: 경제
INFO:root:https://www.donga.com/news/People/article/all/20241012/130202730/1 는 해당 카테고리가 아니어서 생략합니다. 
ERROR:root:result is None
DEBUG:root:Scraping article: https://www.donga.com/news/Economy/article/all/20241012/130202760/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Economy/article/all/2024101

{'title': '폭락한 주식에 물려 못 빠져나오는 이유… 매몰비용의 심리적 오류', 'source_url': 'https://www.donga.com/news/Economy/article/all/20241013/130203251/1', 'content': '[돈의 심리] 자기 돈이 투자된 경우 그 돈이 아까워 합리적 판단 못 내려\n친구가 가지고 있는 주식이 엄청나게 떨어졌다. 굉장히 좋은 회사라고 누구나 인정하는 주식인데도 떨어졌다. 손해가 막심하지만 지금은 팔려고 하지 않는다. 그 대신 이게 다시 오르기를, 수익을 바라기보다 매수한 가격대가 돼 손해를 메울 수 있기만을 바라고 있다.\n\u200c\n“이 종목 언제쯤 회복될까.”\n\u200c\n친구가 물었다.\n\u200c\n“이 회사 매출이나 이익이 오르고 있어?”\n\u200c\n“아니.”\n\u200c\n“그럼 이 회사가 앞으로 크게 성장할 가능성이 있나.”\n\u200c\n“그럴 거라고 생각하고 샀는데, 지금 보니 잘 모르겠어.”\n\u200c\n“경기 순환적이라서 떨어졌다 올라갔다 떨어졌다 올라갔다 하는 주식인가.”\n\u200c\n“그런 주기가 있지만, 지금은 그런 주기적 변화보다 더 떨어졌어. 지금 폭락은 그런 주기적인 게 아닌 것 같아.”\n\u200c\n“그럼 왜 이 주식이 앞으로 오를 거라고, 최소한 산 가격대로 회복될 거라고 생각하는 거야?”\n\u200c\n“이만큼 내렸으니 오르지 않을까.”\n오하이오대 학생들 대상 실험\n투자한 주식에 대해서는 이 주식이 왜 오를 거라고 생각하는지 근거가 있어야 한다. 그런데 암만 들어도 이 주식이 앞으로 오를 거라는 데 대한 합리적 근거가 없었다. “떨어졌으니 오를 수 있다” “올라야 한다” “손해는 메워야 한다”는 의미인데, 이건 주가가 오르는 근거가 아니라 단지 희망이고 바람일 뿐이다. 친구는 그 주식을 투자 개념보다 그냥 지금까지 투자한 금액이 아까워서 그냥 들고 있는 것이다. 투자의 매몰비용 오류다.\n\u200c\n투자와 관련해 조심해

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Economy/article/all/20241013/130203820/1 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제
INFO:root:Article saved to ./donga/economy/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.donga.com/news/Economy/article/all/20241013/130204265/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Economy/article/all/20241013/130204265/1 HTTP/11" 200 None


{'title': '소득 상위 1% 유튜버, 한 해 5억원 벌어…웹툰작가는 11억', 'source_url': 'https://www.donga.com/news/Economy/article/all/20241013/130203820/1', 'content': '전체 유튜버 등 연평균 수익은 3300만원\n소득 상위 1% 중 가수 110억, 배우 36억\n연 소득 상위 1%에 해당하는 유튜버나 개인 방송 진행자(BJ) 들이 한 해 약 5억원 이상의 소득을 올린 것으로 조사됐다. 소득 상위 1% 중 웹툰 작가들의 연소득은 1인 콘텐츠 제작자들의 2배 이상인 11억원 가량이었다.\n이날 국회 기획재정위원회(기재위) 소속 박성훈 국민의힘 의원이 국세청으로부터 제출받은 ‘귀속 종합소득세 신고 현황’에 따르면 지난 2022년 1인 미디어 콘텐츠 창작자(유튜버·BJ 등) 중 귀속 종합소득세를 신고한 인원은 총 1만5448명이다.\n이들의 총 수익은 약 5162억4600만원이며 1인당 평균 수익은 연 3300만원 수준이다. 이 중 수입이 상위 1%에 해당하는 1인 미디어 콘텐츠 창작자들은 한 해 평균 약 5억3800만원의 수익을 올린 것으로 나타났다.\n또 웹툰 작가의 경우 총 1만4426명이 귀속 종합소득세 신고를 한 가운데 총 수익은 6964억9300만원가량으로 집계됐다. 1인당 연 평균수익은 4800만원 정도로 유튜버 등 1인 콘텐츠 제작자 연평균 수익을 약 1500만원가량 웃돌고 있다.\n상위 1%간 연평균 수익 역시 웹툰작가는 평균수익 11억1400만원을 기록하면서 1인 콘텐츠 제작자의 2배 이상을 기록했다.\n이 외에도 직종별 소득 상위 1%의 연평균 수익은 ▲가수 110억4100만원 ▲배우 36억1500만원 ▲운동선수 13억5000만원 ▲모델 13억700만원 순이다.\n[서울=뉴시스]', 'category': 'economy', 'source_created_at': '2024-10-13T12:01:00+09:00', 'press_id': 2, 'press_name

INFO:root:page_category: 경제
INFO:root:category: 경제
INFO:root:Article saved to ./donga/economy/2024-10-13-4/source-2024-10-13-4.json


{'title': '“개미 한마리 못들어간다”…최태원 딸 결혼식, 엄중 경호 ‘눈길’', 'source_url': 'https://www.donga.com/news/Economy/article/all/20241013/130204265/1', 'content': '13일 워커힐호텔서 최민정씨 결혼\n경호원들 차량 한대 한대 초청장 확인\n이재용·구광모·조현준 등 재계 총수 한자리\n“어떻게 오셨습니까?”\n“이쪽으론 못 들어가십니다.”\n최태원 SK그룹 회장의 차녀 최민정씨 결혼식이 13일 오후 1시 서울 광진구 워커힐호텔에서 엄중한 경호 속에 열려 눈길은 끈다.\n이혼 소송 중인 부친 최 회장과 모친 노소영 아트센터 나비 관장은 본 예식보다 2시간 일찍 식장에 도착해 하객을 맞이한 것으로 전해졌다.\n두 사람은 지난 3월과 4월 서울고법 항소심 변론기일에 법정에서 대면한 적은 있지만 지난 5월 항소심 이후 직접 만나는 것은 처음인 것으로 알려졌다.\n결혼식장인 워커힐호텔 비스타홀은 본식 2~3시간 전부터 삼엄한 경비를 통해 출입을 제한했다. 지하 2층인 비스타홀로 연결되는 지하 3층~지상 1층으로 연결되는 도로와 인도를 모두 막았다.\nVIP들은 비스타홀로 연결된 전용 통로를 통해 속속 입장했다. 경호원들은 명부를 들고 차량 한 대 한 대 확인하며 비스타홀로 들여보냈다. 경호원들은 초청장이 없거나 사전에 초대 명단에 이름이 오르지 않은 사람은 입장을 철저히 막았다.\n최 회장 사촌인 최신원 전 SK네트웍스 회장은 낮 12시25분쯤 입장하며 “오늘은 행복한 날”이라며 가족 구성원의 결혼을 축복했다. 이석희 SK온 대표이사 사장도 “좋은 날”이라며 새 신랑신부의 앞날을 응원했다. 최 회장의 친동생인 최재원 SK 수석부회장과 사촌 최창원 수펙스추구협의회 의장 등도 자리했다.\n아울러 노 관장 동생이자 민정씨의 외삼촌인 노재헌씨를 비롯해 장동현 SK에코플랜트 부회장, 박상규 SK이노베이션 대표, 나경수 SK지오센트릭 대표, 곽노정 SK하이닉스 대표, 추형욱 SK E&

INFO:root:category (base_url): 국제 (https://www.donga.com/news/Inter)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.donga.com/news/Inter/article/all/20241012/130202481/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter/article/all/20241012/130202481/1 HTTP/11" 200 None
INFO:root:page_category: 국제
INFO:root:category: 국제
INFO:root:https://www.donga.com/news/Inter/article/all/20241012/130202481/1 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Inter/article/all/20241012/130202517/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter/article/all/20241012/130202517/1 HTTP/11" 200 None
INFO:

{'title': '이란, 이스라엘 공습에 핵무장 카드 만지작', 'source_url': 'https://www.donga.com/news/Inter/article/all/20241013/130203248/1', 'content': '‘체면치레용’ 보복 공격에 한계 느껴… 농축우라늄 대량생산 이미 돌입\n이란 도시 콤은 시아파의 가장 중요한 성지다. 시아파는 이슬람교 창시자 무함마드의 후계를 둘러싸고 수니파와 대립하면서 갈라져 나온 분파다. 소수 세력인 시아파가 다수 세력인 수니파의 박해를 피해 정착한 곳이 콤이었다. 수도 테헤란에서 남서쪽으로 156㎞ 떨어진 콤은 1979년 아야툴라 루홀라 호메이니가 주도한 이슬람 혁명의 진원지다. 호메이니는 혁명에 성공한 후에도 콤에 머물면서 이란을 통치했다.\n핵합의 폐기 이후 바뀐 이란\n콤에서 북쪽으로 30㎞ 떨어진 산악지대 포르도라는 곳에는 이란의 제2 우라늄 농축시설이 있다. 이란은 혁명수비대의 미사일 기지였던 이곳 지하에 수백m 터널을 뚫고 비밀리에 원심분리기를 가동할 수 있는 핵시설을 만들었다. 이란은 2009년 미국이 이 시설의 존재를 알아채자 하는 수 없이 국제원자력기구(IAEA)에 이를 신고한 바 있다. 이란의 주요 핵시설은 나탄즈와 포르도의 2개 우라늄 농축시설을 비롯해 아라크 중수로 등으로 17개 지역에 분포돼 있다.\n\u200c\n이란은 2015년 미국 등 서방과의 핵합의인 포괄적공동행동계획(JCPOA)에 따라 핵개발 프로그램을 포기하면서 IAEA의 핵사찰을 받되 농도 3.67%의 저농축 우라늄만 생산하고, 서방은 이란에 대한 경제제재를 해제하기로 약속했다. 이에 원심분리기 9000개를 가동했던 이란은 나탄즈에 10년간 상업용(핵 연료봉 제조용) 생산을 위한 원심분리기(IR-1) 5060개와 포르도에 연구용 원심분리기 1044개를 보유하고, 나머지 원심분리기는 모두 폐기했다. 하지만 2018년 도널드 트럼프 당시 미국 대통령이 핵합의를 파기한 뒤 이란 경제제재를 복원하자, 이란은 우라늄 농축 농도

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter/article/all/20241010/130188646/1 HTTP/11" 200 None
INFO:root:page_category: 국제
INFO:root:category: 국제
INFO:root:https://www.donga.com/news/Inter/article/all/20241010/130188646/1 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Inter/article/all/20241012/130202481/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter/article/all/20241012/130202481/1 HTTP/11" 200 None
INFO:root:page_category: 국제
INFO:root:category: 국제
INFO:root:https://www.donga.com/news/Inter/article/all/20241012/130202481/1 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Inter/article/all/20241013/130203248/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Inter/article/all/20241013

{'title': '이란, 이스라엘 공습에 핵무장 카드 만지작', 'source_url': 'https://www.donga.com/news/Inter/article/all/20241013/130203248/1', 'content': '‘체면치레용’ 보복 공격에 한계 느껴… 농축우라늄 대량생산 이미 돌입\n이란 도시 콤은 시아파의 가장 중요한 성지다. 시아파는 이슬람교 창시자 무함마드의 후계를 둘러싸고 수니파와 대립하면서 갈라져 나온 분파다. 소수 세력인 시아파가 다수 세력인 수니파의 박해를 피해 정착한 곳이 콤이었다. 수도 테헤란에서 남서쪽으로 156㎞ 떨어진 콤은 1979년 아야툴라 루홀라 호메이니가 주도한 이슬람 혁명의 진원지다. 호메이니는 혁명에 성공한 후에도 콤에 머물면서 이란을 통치했다.\n핵합의 폐기 이후 바뀐 이란\n콤에서 북쪽으로 30㎞ 떨어진 산악지대 포르도라는 곳에는 이란의 제2 우라늄 농축시설이 있다. 이란은 혁명수비대의 미사일 기지였던 이곳 지하에 수백m 터널을 뚫고 비밀리에 원심분리기를 가동할 수 있는 핵시설을 만들었다. 이란은 2009년 미국이 이 시설의 존재를 알아채자 하는 수 없이 국제원자력기구(IAEA)에 이를 신고한 바 있다. 이란의 주요 핵시설은 나탄즈와 포르도의 2개 우라늄 농축시설을 비롯해 아라크 중수로 등으로 17개 지역에 분포돼 있다.\n\u200c\n이란은 2015년 미국 등 서방과의 핵합의인 포괄적공동행동계획(JCPOA)에 따라 핵개발 프로그램을 포기하면서 IAEA의 핵사찰을 받되 농도 3.67%의 저농축 우라늄만 생산하고, 서방은 이란에 대한 경제제재를 해제하기로 약속했다. 이에 원심분리기 9000개를 가동했던 이란은 나탄즈에 10년간 상업용(핵 연료봉 제조용) 생산을 위한 원심분리기(IR-1) 5060개와 포르도에 연구용 원심분리기 1044개를 보유하고, 나머지 원심분리기는 모두 폐기했다. 하지만 2018년 도널드 트럼프 당시 미국 대통령이 핵합의를 파기한 뒤 이란 경제제재를 복원하자, 이란은 우라늄 농축 농도

INFO:root:category (base_url): 사회_사건 (https://www.donga.com/news/Society/Event)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/Event HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.donga.com/news/Politics/article/all/20241013/130204112/2
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Politics/article/all/20241013/130204112/2 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 사회_사건
INFO:root:https://www.donga.com/news/Politics/article/all/20241013/130204112/2 는 해당 카테고리가 아니어서 생략합니다. 
ERROR:root:result is None
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241013/130203780/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Societ

{'title': '2030대 도박중독 환자 5년 새 2.3배 증가…남성, 여성의 28배↑', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203780/1', 'content': '박희승 민주당의원실 심평원 자료 분석\n20대와 30대 도박 중독 환자가 5년 새 2배 넘게 증가한 것으로 나타났다. 10대 도박 중독도 증가세를 보였다.\n13일 국회 보건복지위원회 소속 박희승 더불어민주당 의원실이 건강보험심사평가원으로부터 제출받은 자료에 따르면 2030세대 도박 중독 환자 수는 2018년 836명에서 지난해 1957명으로 5년 새 2.3배 늘었다.\n10대 도박 중독 환자도 2018년 64명에서 지난해 165명으로 2.6배 증가했다.\n성별로 보면 여성보다 남성이 많았다. 올해 2030세대 도박 중독 환자 수를 성별로 보면 여성은 68명이었지만, 남성은 이보다 27.8배 많은 1889명으로 집계됐다.\n젊은 층의 도박 중독 환자 증가는 스마트폰 보급이 활성화되고 스포츠 콘텐츠의 다양화로 불법 스포츠토토와 사다리, 달팽이, 홀짝 등 실시간 배팅 게임 이용자가 확산하고 있기 때문으로 분석된다. 또 오프라인 홀더펌과 카지노 관광도 청년들의 도박 중독을 부추기고 있는 것으로 보인다.\n지난해 2030세대 사이버도박 피의자 수는 전체의 54.2%를 차지했다. 이는 2018년 70.5%보다 16.3%포인트(p) 감소했다. 반면 10대는 2.2%에서 3.1%로, 50대는 7.7%에서 15.6%로, 60대 이상은 1.5%에서 7.9%로 증가폭이 컸다.\n박희승 의원은 “청년층의 도박 중독 문제는 더 이상 개인의 의지력 문제가 아닌 사회가 함께 나서서 치료해야 할 질병”이라며 “청소년들의 온라인 도박을 차단하기 위한 적극적인 조치가 필요하다”고 말했다.\n[세종=뉴시스]', 'category': 'accident', 'source_created_at': '2024-10-13T11:50:00+

INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:Article saved to ./donga/accident/2024-10-13-2/source-2024-10-13-2.json
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241013/130203187/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241013/130203187/1 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:Article saved to ./donga/accident/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241012/130202752/2
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443


{'title': '‘칭얼댄다고’ 2개월 영아에 ‘성인 감기약’ 먹여 사망케 한 친모', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203389/1', 'content': '금고 1년\n생후 2개월 영아가 잠을 자지 않고 칭얼댄다는 이유로 성인이 먹는 감기약과 수면유도제를 분유에 타 먹여 사망에 이르게 한 20대 친모가 금고형을 선고받았다.\n창원지법 형사5단독 이재원 부장판사는 과실치사 혐의로 재판에 넘겨진 친모 A 씨(29)와 친모의 지인 B 씨(35)에게 금고 1년을 각각 선고했다고 13일 밝혔다.\nA·B 씨는 지난 2022년 8월 경남 창원시 한 모텔에서 A 씨의 2개월된 영아 C 군에게 성인용 감기약과 수면유도제를 탄 분유를 먹인 후 엎드려 잠을 자게 해 사망에 이르게 한 혐의로 기소됐다.\nC 군은 부검 결과 1차적으로 약 성분을 원인으로, 2차적으로 진정작용이 있는 약 성분이 체내에 있는 상태에서 비구폐쇄성질식 때문에 사망에 이른 것으로 조사됐다.\nA·B 씨는 C 군이 잠을 자지않고 칭얼댄다는 이유로 분유에 약을 타 먹이고 엎드려 자게 한 것으로 나타났다.\nB 씨는 A 씨, A 씨의 친구이자 자신의 동거녀, C 군, 자신의 자녀와 모텔에서 투숙하던 중 C 군이 칭얼대며 잠을 자지 않자 A 씨에게 동의를 받고 약을 탄 분유를 먹였다.\nC 군이 약이 든 분유를 먹고도 칭얼대자 A 씨로부터 “엎드려 재워라”라는 말은 들은 B 씨가 C 군을 엎드려 잠을 자게 한 것으로 조사됐다.\nA·B 씨는 수사 초기 C 군에게 성인용 감기약을 먹인 사실을 숨기다 부검을 통해 약 성분이 검출되자 범행을 시인했다.\n이 부장판사는 “피고인들이 조금만 주의를 기울였다면 영아가 사망하는 결과를 초래하지 않았을 것으로 보여 죄책이 매무 무겁고, 뒤늦게 범행을 인정하는 등 범행 후의 정상도 좋지 않기에 실형의 선고가 불가피하다”고 양형 이유를 밝혔다.\n(창원=뉴스1)', 'cate

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241012/130202752/2 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:https://www.donga.com/news/Society/article/all/20241012/130202752/2 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241012/130202740/2
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241012/130202740/2 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:https://www.donga.com/news/Society/article/all/20241012/130202740/2 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241012/130202733/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/

{'title': '“학교 끝나면 마약 고?”…‘마약’ 상호명서 떼라는데 상인들은 고심', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203154/1', 'content': '식품표시광고법에서 금지해도 곳곳서 여전히 사용\n“취지는 알지만 이미 익숙해진 상호명 바꾸기 부담”\n“학교 끝나면 같이 마약 고?”\n“마약보다 좋은 단어가 많은데 학부모 입장에선 걱정되죠.”\n지난 11일 광주 북구의 한 주택가 인근. 이곳은 인근에 초등학교 학생들이 자주 지나다니는 곳이지만 상호명에 ‘마약’이 들어간 음식점이 자리하고 있었다.\n일부 학생들은 “이따 마약하러 갈까?”라고 웃으며 장난을 쳤다. 주위의 친구들도 저마다 한마디씩 동조했다.\n등교를 위해 어린이 손을 잡고 이곳을 지나던 한 학부모는 “호기심이 왕성한 학생들이기에 자칫 궁금해할까 걱정된다”고 했다.\n그러면서 자녀에게 “마약은 쳐다도 봐서는 안된다”며 주의를 줬다.\n지난 7월부터 간판·메뉴 등에 마약·헤로인·코카인 등 마약 관련 용어 사용을 금지하는 식품표시광고법이 시행됐지만 마약이 들어간 상호명은 여전히 사용되고 있다.\n국회 보건복지위원회 소속 더불어민주당 남인순 의원이 식약처로부터 제출받은 ‘마약 상호 업소명 현황’ 따르면 마약 용어가 상호명으로 사용된 전국 음식점은 215곳인 것으로 나타났다.\n광주 지역에서 마약 관련 상호·제품·메뉴명을 사용하고 있는 업체는 7곳으로 알려졌다.\n광주시의 파악과 달리 한 포털에서 광주 마약을 검색하면 식당을 중심으로 최소 10곳 이상이 뜬다.\n배달 앱을 확인해보면 마약 찜닭, 마약 핫도그 등 마약이란 단어가 붙은 메뉴도 심심치 않게 찾아볼 수 있었다.\n남인순 의원은 “상호명은 많이 줄었지만 식약처에서는 메뉴명에 대한 현황조차 파악 못하는 실정이다”고 지적했다.\n업주들은 개정 취지에는 동의하지만 소비자들 입에 익숙해진 상호명을 바꾸기 부담스럽다는 입장이다.\n광주에서 마약 

INFO:root:category: 사회
INFO:root:Article saved to ./donga/society/2024-10-13-2/source-2024-10-13-2.json
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241013/130203235/2
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241013/130203235/2 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:Article saved to ./donga/society/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.donga.com/news/Society/article/all/20241013/130203389/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443


{'title': '스쿨존서 과속 6살 어린이 다치게 한 배달기사 집행유예', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203187/1', 'content': '어린이 보호구역(스쿨존)에서 과속해 어린이를 치어 다치게 한 40대 배달기사에게 징역형의 집행유예가 선고됐다.\n울산지법 형사11부(재판장 이대로 부장판사)는 특정범죄 가중처벌 등에 관한 법률 위반(어린이보호구역치상) 혐의로 기소된 A씨에게 징역 6개월에 집행유예 1년을 선고했다고 13일 밝혔다.\nA씨는 지난해 6월 울산 북구의 한 초등학교 인근 어린이 보호구역에서 오토바이를 몰다가 길을 건너던 B군(6)을 치었다.\n이 사고로 B군은 몸통 골절 등 전치 12주의 부상을 입어 치료를 받았다.\n당시 A씨는 어린이 보호구역 제한 속도인 시속 30㎞를 초과해 시속 37㎞로 과속한 것으로 조사됐다.\n재판부는 “피고인은 배달 업무 중 과속 운전을 하고 전방과 좌우를 제대로 살피지 않아 어린이를 다치게 해 죄책이 가볍지 않다”며 “다만 범행을 인정하고 잘못을 뉘우치는 점, 합의금과 치료비를 지급해 피해자 측이 처벌을 원하지 않는 점 등을 참작했다”고 밝혔다.\n(울산=뉴스1)', 'category': 'society', 'source_created_at': '2024-10-13T08:50:00+09:00', 'press_id': 2, 'press_name': '동아일보'}
{'title': '‘노벨문학상’ 한강, 가요계에도 영향력…과거 직접 작곡·작사도', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203235/2', 'content': '“노래를 듣다 보면 일어날 힘이 생기고 온몸이 터져 나갈 듯한 만원 지하철 속으로 다시 뛰어들 용기가 생겼다. 어떤 종교도, 위로해 줄 애인도 없을 때, 때로는 그렇게 노래 하나가 거짓말처럼 일

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241013/130203389/1 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:Article saved to ./donga/society/2024-10-13-4/source-2024-10-13-4.json


{'title': '‘칭얼댄다고’ 2개월 영아에 ‘성인 감기약’ 먹여 사망케 한 친모', 'source_url': 'https://www.donga.com/news/Society/article/all/20241013/130203389/1', 'content': '금고 1년\n생후 2개월 영아가 잠을 자지 않고 칭얼댄다는 이유로 성인이 먹는 감기약과 수면유도제를 분유에 타 먹여 사망에 이르게 한 20대 친모가 금고형을 선고받았다.\n창원지법 형사5단독 이재원 부장판사는 과실치사 혐의로 재판에 넘겨진 친모 A 씨(29)와 친모의 지인 B 씨(35)에게 금고 1년을 각각 선고했다고 13일 밝혔다.\nA·B 씨는 지난 2022년 8월 경남 창원시 한 모텔에서 A 씨의 2개월된 영아 C 군에게 성인용 감기약과 수면유도제를 탄 분유를 먹인 후 엎드려 잠을 자게 해 사망에 이르게 한 혐의로 기소됐다.\nC 군은 부검 결과 1차적으로 약 성분을 원인으로, 2차적으로 진정작용이 있는 약 성분이 체내에 있는 상태에서 비구폐쇄성질식 때문에 사망에 이른 것으로 조사됐다.\nA·B 씨는 C 군이 잠을 자지않고 칭얼댄다는 이유로 분유에 약을 타 먹이고 엎드려 자게 한 것으로 나타났다.\nB 씨는 A 씨, A 씨의 친구이자 자신의 동거녀, C 군, 자신의 자녀와 모텔에서 투숙하던 중 C 군이 칭얼대며 잠을 자지 않자 A 씨에게 동의를 받고 약을 탄 분유를 먹였다.\nC 군이 약이 든 분유를 먹고도 칭얼대자 A 씨로부터 “엎드려 재워라”라는 말은 들은 B 씨가 C 군을 엎드려 잠을 자게 한 것으로 조사됐다.\nA·B 씨는 수사 초기 C 군에게 성인용 감기약을 먹인 사실을 숨기다 부검을 통해 약 성분이 검출되자 범행을 시인했다.\n이 부장판사는 “피고인들이 조금만 주의를 기울였다면 영아가 사망하는 결과를 초래하지 않았을 것으로 보여 죄책이 매무 무겁고, 뒤늦게 범행을 인정하는 등 범행 후의 정상도 좋지 않기에 실형의 선고가 불가피하다”고 양형 이유를 밝혔다.\n(창원=뉴스1)', 'cate

INFO:root:category (base_url): 스포츠 (https://www.donga.com/news/Sports)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Sports HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.donga.com/news/Sports/article/all/20241013/130203118/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Sports/article/all/20241013/130203118/1 HTTP/11" 200 None
INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:https://www.donga.com/news/Sports/article/all/20241013/130203118/1 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.donga.com/news/Sports/article/all/20241013/130203122/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Sports/article/all/20241013/130203122/1 HTTP/11" 200 

{'title': '삼성-LG, 22년 만에 가을야구 격돌…75.8% 확률 누가 잡을까', 'source_url': 'https://www.donga.com/news/Sports/article/all/20241013/130203141/1', 'content': '2002년 KS 이후 첫 만남…오늘 대구서 1차전\n삼성 레예스-LG 최원태, 선발 투수 맞대결\n프로야구 삼성 라이온즈와 LG 트윈스가 22년 만에 포스트시즌에서 맞대결을 벌인다.\n삼성과 LG는 13일 대구 삼성라이온즈파크에서 2024 신한 쏠뱅크 KBO 포스트시즌 플레이오프(PO·5전3선승제) 1차전을 치른다.\n올 시즌 2위 자리를 놓고 치열한 경쟁을 벌였던 삼성과 LG는 한국시리즈(KS·7전4선승제)로 가는 길목에서 마주하게 됐다. 두 팀이 가을야구에서 맞붙는 것은 2002년 KS 이후 무려 22년 만이다. 당시 삼성이 LG를 시리즈 전적 4승 2패로 제압하며 KS 정상에 올랐다.\n이번 시즌 상대 전적에서는 8승 1무 7패로 삼성이 근소하게 우위를 점했다.\nLG를 따돌리고 2위 자리를 꿰차며 PO 직행에 성공한 삼성은 정규시즌이 끝난 뒤 충분한 휴식을 가졌고, 최근 연습경기와 자체 평가전을 통해 실전 감각을 끌어올렸다.\n삼성은 1차전 선발 투수로 데니 레예스를 내세운다. 올 시즌 26경기에서 144이닝을 투구하며 11승 4패 평균자책점 3.81을 작성했다. 올해 LG와 2경기에서는 1승 평균자책점 3.60을 기록했다.\n삼성은 외국인 에이스 코너 시볼드, 베테랑 좌완 백정현 등이 부상으로 이탈하며 마운드가 헐거워졌지만, 화끈한 타선의 공격력은 여전하다. 구자욱을 필두로 김영웅, 르윈 디아즈, 강민호, 박병호 등이 1차전부터 LG 투수진 공략에 나선다.\n준플레이오프(준PO·5전3선승제)에서 KT 위즈를 3승 2패로 꺾고 PO에 오른 LG는 하루 휴식을 취한 뒤 삼성과 1차전에 임한다. 삼성에 비해 체력이 떨어져 있으나 좋은 흐름 속에서 대구로 향한다.\nLG는 나흘 휴식 후 마운드는 오르

DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Sports/article/all/20241013/130203382/1 HTTP/11" 200 None
INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:Article saved to ./donga/sports/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.donga.com/news/Sports/article/all/20241013/130203504/1
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Sports/article/all/20241013/130203504/1 HTTP/11" 200 None
INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:Article saved to ./donga/sports/2024-10-13-4/source-2024-10-13-4.json


{'title': '‘논란 후 첫 국대’ 안세영, 감독·동료와 시간 차 출국…“할 말 없다”', 'source_url': 'https://www.donga.com/news/Sports/article/all/20241013/130203382/1', 'content': '‘작심발언’ 이후 첫 태극마크, 덴마크 오픈 출전\n전날 전국체전 결승 불참 “무릎 상태는 괜찮아”\n2024 파리 올림픽 이후 처음으로 태극마크를 달고 국제대회에 참가하는 ‘셔틀콕 여제’ 안세영(삼성생명)이 다소 어두운 표정으로 비행기에 몸을 실었다.\n감독을 비롯해 다른 동료들과는 다른 동선으로 출국장으로 들어가는 등 따로 움직이는 모습이었다. 출국 전날 제105회 전국체육대회 배드민턴 여자 일반부 단체전 결승에 불참한 것에 대해서는 “무릎 상태는 괜찮다”고 했다.\n안세영은 13일 인천국제공항을 통해 덴마크로 출국, 15일부터 덴마크 오덴세에서 열리는 ‘덴마크 오픈선수권’에 참가한다.\n파리 올림픽 배드민턴 여자 단식 금메달을 따낸 뒤 배드민턴계의 부조리에 대해 작심발언한 안세영은 이후 재활과 휴식에 집중하다가 전국체전을 통해 복귀했다. 그리고 곧바로 배드민턴 대표팀에 발탁돼 덴마크 오픈에 나서게 됐다.\n안세영은 두 달 만에 돌아온 전국체전에서 월등한 기량을 뽐냈다. 예선과 8강, 4강에서 한 게임도 내주지 않고 완승했다.\n하지만 12일 경남 밀양 배드민턴경기장에서 열린 김천시청과의 대회 결승전에서는 무릎 부상을 이유로 불참, 궁금증을 자아냈다.\n논란 후 말을 아껴온 안세영은 이날도 조심스러운 태도를 보였다.\n공항에서 만난 안세영은 무릎 상태를 묻는 질문에 “괜찮다”고 짧게 답했다. 이어 전국체전 결승을 뛰지 못한 이유에 대해서는 “드릴 말씀이 없다. 지금은 말을 할 수 있는 상황이 아니다”라고 모호하게 설명했다.\n안세영은 이날 대표팀 동료들과 별도의 동선으로 이동했다. 김학균 감독과 대표팀 선수단이 출국장을 통과한 뒤에도 관계자들과 남아있다가 약 1시간이 지나자 홀로 비행기를 탑승

## 중앙일보

In [6]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
import logging
import os
import re
from datetime import datetime
from urllib.parse import urlparse

logging.basicConfig(level='DEBUG')

header = {'User-Agent': ('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                         '(KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'),}

output_dir = './joongang'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

categories = {
    '정치': 'https://www.joongang.co.kr/politics',
    '경제': 'https://www.joongang.co.kr/money',
    '국제': 'https://www.joongang.co.kr/world',
    '사회_사건': 'https://www.joongang.co.kr/society/accident', # 앞 분기 기준
    '경제_과학': 'https://www.joongang.co.kr/money/science', # 앞 분기 기준
    '사회': 'https://www.joongang.co.kr/society',
    '스포츠': 'https://www.joongang.co.kr/sports',
}


result_categories = {
    '정치': 'politics',
    '경제': 'economy',
    '국제': 'world',
    '사회_사건': 'accident',
    '경제_과학': 'science',
    '사회': 'society',
    '스포츠': 'sports',
}

# 현재 날짜의 오전 8시 (시간대는 +09:00 기준)
today = datetime.now().replace(hour=8, minute=0, second=0, microsecond=0, tzinfo=datetime.now().astimezone().tzinfo)

def scrap_article(article_url, category):
    response = requests.get(article_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    try:

        page_category = soup.find('a', {'class': 'title'}).get_text(strip=True)
        logging.info(f"page_category: {page_category}")
        
        logging.info(f"category: {category}")

        category_parts = category.split('_')
        
        # 카테고리가 아닌 글은 패스
        if page_category not in category_parts:
            logging.info(f"{article_url} 는 해당 카테고리가 아니어서 생략합니다. ")
            return None
    except AttributeError:
        logging.error(f"{article_url} 는 찾을 수 없습니다.")
        return None

    # 헤드라인 스크랩
    try:
        title = soup.find('h1', {'class': 'headline'}).get_text(strip=True)
    except AttributeError:
        title = 'N/A'

    # 생성일 스크랩
    try:
        date = soup.find('p', {'class': 'date'})
        time = date.find('time').get('datetime')
    except AttributeError:
        time = 'N/A'

    # 본문 스크랩
    try:
        content = soup.find('div', {'class': 'article_body'}).get_text(strip=True)
    except AttributeError:
        content = 'N/A'

    result_category = result_categories.get(category, 'unknown')

    return {'title': title, 'source_url': article_url, 'content': content, 'category': result_category, 'source_created_at': time, 'press_id': 1, 'press_name': '중앙일보'}

# 파일 생성
def save_article_as_json(article_data, date, file_idx):
    category = article_data.get('category')
    file_name = date + "-" + str(file_idx) + '.json'
    result_dir = output_dir + "/" + category + "/" + date + "-" + str(file_idx)
    if not os.path.exists(result_dir):
        os.makedirs(result_dir)

    file_path = os.path.join(result_dir, 'source-' + file_name)
    
    # 단일 dataframe 생성
    single_article_df = pd.DataFrame([article_data])
    
    # json으로 변환
    single_article_df.to_json(file_path, orient='records', lines=True, force_ascii=False)
    logging.info(f"Article saved to {file_path}")

def check_for_new_articles(base_url, category):
    response = requests.get(base_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    article_count = 0
    cards = soup.find_all('li', class_='card')
    if category not in ['사회_사건', '경제_과학']:
        cards.reverse()
    for card in cards:
        if article_count >= 4:
            break

        link_tag = card.find('a', href=True)
        if link_tag and 'href' in link_tag.attrs:
            article_link = link_tag['href']
        else:
            logging.warning("article_link is None or missing 'href'.")
            continue
    
        logging.debug(f"Scraping article: {article_link}")

        result = scrap_article(article_link, category)

        if result is None:
            continue

        if result.get('category') not in ['accident', 'science']:
            # 'source_created_at'를 datetime 객체로 변환
            article_time = datetime.strptime(result.get('source_created_at'), '%Y-%m-%dT%H:%M:%S%z')
            # 오늘 오전 8시 이후가 아니면 continue
            if article_time < today:
                logging.info(f"{article_link} 은 오늘 오전 8시 이전 기사이므로 생략합니다.")
                continue

        print(result)
        article_count += 1
        date = re.match(r'^[^T]+', result.get('source_created_at')).group()
        save_article_as_json(result, date, article_count)

def scrap_all_categories():
    
    for category, base_url in categories.items():
        logging.info(f"category (base_url): {category} ({base_url})")
        check_for_new_articles(base_url, category)
        time.sleep(2)

scrap_all_categories()

INFO:root:category (base_url): 정치 (https://www.joongang.co.kr/politics)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /politics HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283672
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283672 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:https://www.joongang.co.kr/article/25283672 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283673
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283673 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:https://www.joongang.co.kr/articl

{'title': '신원식 "야당, 북한 도발엔 비난않으면서 군과 정부엔 너무 가혹”', 'source_url': 'https://www.joongang.co.kr/article/25283844', 'content': "신원식 국가안보실장이 지난달 1일 용산 대통령실청사 브리핑룸에서 국가 사이버안보 기본계획 관련 브리핑을 하고 있다. 뉴스1신원식 국가안보실장은 13일 “북한이 자살을 결심하지 않을 것 같으면 전쟁을 일으키지 못할 것”이라고 밝혔다.신 실장은 이날 오전 KBS1 일요진단에 출연해 미국 외교 전문지 ‘포린 폴리시’가 “한반도에서 전쟁이 일어날 가능성이 1950년 한국전쟁 이후에 가장 높다”고 분석한 데 대해 “북한이 전쟁을 일으킬 가능성은 6·25 전쟁 이후에 늘 존재해 왔다”며 이같이 말했다.이어 “북한이 전쟁을 일으키지 못한 것은 북한의 마음에 달린 것이 아니라 우리의 의지와 태세에 달려 있다”며 “북한이 승산이 없도록 만들어주는 우리 국민의 단합된 노력이 중요하다”고 했다. 그러면서 \xa0“현재 한미동맹은 건전하고 대한민국은 선진국으로서 튼튼하다”고 말했다.신 실장은 북한의 한국 무인기 평양 침투주장과 관련해 ‘어떻게 보면 북한의 방공망이 뚫린 거 아니냐?’는 질문에 “평양 방공망이 뚫렸다고 해서 느끼는 손해보다 대한민국이 무인기를 보내서 북한을 위협하고 있기 때문에 다시 정신을 차리고 강력하게 대비해야 된다. 즉, 체제 위협을 확대시켜서, 강제로 해서 내부 통제를 하는데 더 이점이 있다고 판단한 것”이라고 말했다. 그러면서 “그만큼 북한 내부가 흔들린다는 방증을 오히려 보여준 것”이라고 했다.신 실장은 또 국방부의 '확인불가' 입장에 대해\xa0“확인해 줄 수 없다, 모든 책임은 북한에 있다, 우리 국민의 안전에 위해가 되면 강력하게 응징하겠다는 우리 군의 입장은 적절했다”고 했다.이러한 대응을 두고 야당에서 “정부 해명이 시시각각 변한다, 확인해 줄 수 없다 이 자체가 잘못된 거 아니냐”며 제기하는 비판에는 “북한의 행위에 대해 정부에게

DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283844 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:Article saved to ./joongang/politics/2024-10-13-2/source-2024-10-13-2.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283825
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283825 HTTP/11" 200 None


{'title': '신원식 "야당, 북한 도발엔 비난않으면서 군과 정부엔 너무 가혹”', 'source_url': 'https://www.joongang.co.kr/article/25283844', 'content': "신원식 국가안보실장이 지난달 1일 용산 대통령실청사 브리핑룸에서 국가 사이버안보 기본계획 관련 브리핑을 하고 있다. 뉴스1신원식 국가안보실장은 13일 “북한이 자살을 결심하지 않을 것 같으면 전쟁을 일으키지 못할 것”이라고 밝혔다.신 실장은 이날 오전 KBS1 일요진단에 출연해 미국 외교 전문지 ‘포린 폴리시’가 “한반도에서 전쟁이 일어날 가능성이 1950년 한국전쟁 이후에 가장 높다”고 분석한 데 대해 “북한이 전쟁을 일으킬 가능성은 6·25 전쟁 이후에 늘 존재해 왔다”며 이같이 말했다.이어 “북한이 전쟁을 일으키지 못한 것은 북한의 마음에 달린 것이 아니라 우리의 의지와 태세에 달려 있다”며 “북한이 승산이 없도록 만들어주는 우리 국민의 단합된 노력이 중요하다”고 했다. 그러면서 \xa0“현재 한미동맹은 건전하고 대한민국은 선진국으로서 튼튼하다”고 말했다.신 실장은 북한의 한국 무인기 평양 침투주장과 관련해 ‘어떻게 보면 북한의 방공망이 뚫린 거 아니냐?’는 질문에 “평양 방공망이 뚫렸다고 해서 느끼는 손해보다 대한민국이 무인기를 보내서 북한을 위협하고 있기 때문에 다시 정신을 차리고 강력하게 대비해야 된다. 즉, 체제 위협을 확대시켜서, 강제로 해서 내부 통제를 하는데 더 이점이 있다고 판단한 것”이라고 말했다. 그러면서 “그만큼 북한 내부가 흔들린다는 방증을 오히려 보여준 것”이라고 했다.신 실장은 또 국방부의 '확인불가' 입장에 대해\xa0“확인해 줄 수 없다, 모든 책임은 북한에 있다, 우리 국민의 안전에 위해가 되면 강력하게 응징하겠다는 우리 군의 입장은 적절했다”고 했다.이러한 대응을 두고 야당에서 “정부 해명이 시시각각 변한다, 확인해 줄 수 없다 이 자체가 잘못된 거 아니냐”며 제기하는 비판에는 “북한의 행위에 대해 정부에게

INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:https://www.joongang.co.kr/article/25283825 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283828
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283828 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:https://www.joongang.co.kr/article/25283828 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283827
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283827 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 정치
INFO:root:https://www.joongang.co.kr/article/25283827 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283827
DEBUG:url

{'title': '"1년에 11억 번다"…5억 버는 유튜버 가볍게 제친 \'이 직종\'', 'source_url': 'https://www.joongang.co.kr/article/25283837', 'content': '신재민 기자웹툰 작가들의 연평균 소득이 약 5000만원으로 집계됐다. 웹툰 작가와 대표적인 콘텐츠 크리에이터로 꼽히는 유튜버·BJ(개인방송 진행자) 등 ‘1인 미디어 콘텐츠 창작자’들은 연간 평균 3000만원을 벌었다.13일 국세청이 국회 기획재정위 국민의힘 박성훈 의원실에 제출한 자료에 따르면 2022년 귀속 종합소득세를 신고한 웹툰 작가 등은 모두 1만4426명으로, 총 6965억원을 신고했다. 1인당 평균 수입금액은 4830만원이다.1인 미디어 창작자는 1만5448명으로, 총 5162억원을 신고했다. 1인당 평균 3342만원꼴이다.업종 전체의 종사 인원은 비슷하지만, 1인당 평균소득에서는 웹툰 작가 약 1.5배 많았다.상위 1% 기준으로는, 웹툰 작가가 평균 11억1400만원의 소득을 신고했다. 1인 미디어 창작자 소득(5억3800만원)의 두 배를 웃도는 금액이다.상위 10% 기준으로도 웹툰 작가 소득신고분이 평균 2억6800만원으로, 1인 미디어 창작자(1억8800만원) 소득을 크게 넘어섰다.상위 10%와 하위 10%의 소득격차는 1인 미디어 창작자가 63배로, 웹툰작가(30배)의 두배에 달했다.정시내 기자 jung.sinae@joongang.co.kr', 'category': 'economy', 'source_created_at': '2024-10-13T09:18:56+09:00', 'press_id': 1, 'press_name': '중앙일보'}
{'title': '삼성폰 \'설정\' 메뉴 사라진다…"원하는 환경 알아서 최적화"', 'source_url': 'https://www.joongang.co.kr/article/25283838', 'content': '갤럭시 휴대전화 메인 화면. 설정 기능은 톱니바퀴 모양(사진 속 네모)

DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283838 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제
INFO:root:Article saved to ./joongang/economy/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283830
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283830 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제
INFO:root:https://www.joongang.co.kr/article/25283830 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283837
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443


{'title': '삼성폰 \'설정\' 메뉴 사라진다…"원하는 환경 알아서 최적화"', 'source_url': 'https://www.joongang.co.kr/article/25283838', 'content': '갤럭시 휴대전화 메인 화면. 설정 기능은 톱니바퀴 모양(사진 속 네모)으로 된 버튼을 누르면 이용 가능하다. 사진 네이버 블로그 캡처삼성전자 갤럭시 스마트폰에서 \'설정\' 메뉴가 사라질 전망이다.삼성전자는 13일 "갤럭시 스마트폰 사용자가 설정 메뉴에 들어가 수동으로 세팅을 바꿀 필요 없이 개개인에게 최적화된 경험을 제공하는 것을 목표로 스마트폰을 개발하고 있다"고 설명했다.삼성전자 측은 "키보드 및 카메라와 같은 사용자 접근 지점의 성능을 개선해 소비자가 원하는 것을 사전에 예측, 실행시키는 기능을 개발 중"이라며 "AI를 활용해서 소비자가 별도의 조작 없이 편리하게 사용할 수 있는 환경"이라고 부연했다.즉, 톱니바퀴 모양으로 된 설정 메뉴를 열지 않아도 사용자가 음성으로 명령을 내리거나 기기가 AI로 판단해 최적화된 사용 환경을 제공하도록 한다는 것이다.삼성전자가 지난 9월 27일 준프리미엄급 스마트폰 \'갤럭시 S24 FE\'를 공개했다.  기사 내용의 이해를 돕기 위한 자료 사진. 뉴스1갤럭시의 자동 제어 모드는 사물인터넷(IoT) 플랫폼 \'스마트싱스\'와 결합해 휴대전화 이외의 모바일 기기나 가전 등 제3의 기기까지 자동으로 관리하는 것을 목표로 하고 있다.기기 설정을 사용자 습관이나 시간대, 날씨, 장소 등 상황에 맞는 최적의 상태로 변경, 세분화해 작동하는 방식이다.가령 지금은 카메라 앱에서 인물·음식 사진 등의 모드를 사용자가 직접 스크린을 터치해 실행하지만, 앞으로는 AI가 피사체나 사용자의 촬영 패턴을 분석해 인물·음식·동물·풍경 등으로 분류하고 최적의 카메라 모드를 알아서 작동시키는 방식이 될 것으로 보인다.조도·싱글 테이크·슬로우 모션 등 각종 촬영 설정도 촬영 환경에 기반해 AI가 판단하거나 사용자가 음성으로 제어할 수

DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283837 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제
INFO:root:Article saved to ./joongang/economy/2024-10-13-4/source-2024-10-13-4.json


{'title': '"1년에 11억 번다"…5억 버는 유튜버 가볍게 제친 \'이 직종\'', 'source_url': 'https://www.joongang.co.kr/article/25283837', 'content': '신재민 기자웹툰 작가들의 연평균 소득이 약 5000만원으로 집계됐다. 웹툰 작가와 대표적인 콘텐츠 크리에이터로 꼽히는 유튜버·BJ(개인방송 진행자) 등 ‘1인 미디어 콘텐츠 창작자’들은 연간 평균 3000만원을 벌었다.13일 국세청이 국회 기획재정위 국민의힘 박성훈 의원실에 제출한 자료에 따르면 2022년 귀속 종합소득세를 신고한 웹툰 작가 등은 모두 1만4426명으로, 총 6965억원을 신고했다. 1인당 평균 수입금액은 4830만원이다.1인 미디어 창작자는 1만5448명으로, 총 5162억원을 신고했다. 1인당 평균 3342만원꼴이다.업종 전체의 종사 인원은 비슷하지만, 1인당 평균소득에서는 웹툰 작가 약 1.5배 많았다.상위 1% 기준으로는, 웹툰 작가가 평균 11억1400만원의 소득을 신고했다. 1인 미디어 창작자 소득(5억3800만원)의 두 배를 웃도는 금액이다.상위 10% 기준으로도 웹툰 작가 소득신고분이 평균 2억6800만원으로, 1인 미디어 창작자(1억8800만원) 소득을 크게 넘어섰다.상위 10%와 하위 10%의 소득격차는 1인 미디어 창작자가 63배로, 웹툰작가(30배)의 두배에 달했다.정시내 기자 jung.sinae@joongang.co.kr', 'category': 'economy', 'source_created_at': '2024-10-13T09:18:56+09:00', 'press_id': 1, 'press_name': '중앙일보'}


INFO:root:category (base_url): 국제 (https://www.joongang.co.kr/world)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /world HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283634
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283634 HTTP/11" 200 None
INFO:root:page_category: 국제
INFO:root:category: 국제
INFO:root:https://www.joongang.co.kr/article/25283634 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283636
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283636 HTTP/11" 200 None
INFO:root:page_category: 더 차이나
INFO:root:category: 국제
INFO:root:https://www.joongang.co.kr/article/2

{'title': '"당신과의 관계는 재미없다"…불륜에 빠진 그들의 공통점', 'source_url': 'https://www.joongang.co.kr/article/25283833', 'content': '오늘의 더중앙플러스 - 더,마음중앙일보 프리미엄 구독 서비스 ‘더, 마음(https://www.joongang.co.kr/plus/series/236)’에서 부부의 세계를 들여다봤습니다. 부부 관계 전문가 최성애 HD 행복연구소장이 제공한 결혼적응검사 테스트를 통해 내 부부 생활은 어떤지 알아보세요.내 결혼생활 얼마나 행복할까?픽사베이사례1.평생을 건실하게 살아온 30대 남성 A씨, 전형적인 모범생 스타일인 그를 아내는 ‘지루한 사람’이라고 비난했습니다. “당신과의 섹스는 재미없다”며 관계를 거부하기도 했죠. 그 무렵 아내는 회사 동료와 외도를 시작했고, 성적으로도 깊은 관계를 이어갔습니다. 이 사실을 알게 된 A씨는 혼란스럽습니다.부부 상담 주제의 70% 이상은 ‘외도’라고 하는데요. 불륜의 모습은 천차만별이지만 공통점이 있습니다. 부부 사이에 ‘원수가 되는 대화법’이 발단이 됐다는 건데요.부부싸움의 진짜 원인부터 중년의 권태기, 섹스리스, 불륜에 이르기까지 부부 생활의 내밀한 이야기. 이혼의 위기를 겪고 있다면 이 테스트가 도움이 될 겁니다.결혼생활 만족도 테스트다음은 ‘로크-월러스의 결혼적응검사 테스트(Locke-Wallace Martial Adjustment Test)’입니다. 자가 진단을 통해 현재 결혼 생활 만족도를 알아볼 수 있습니다. 검사 항목은 HD가족클리닉에서 제공했습니다.※HD가족클리닉 최성애 소장의‘권태기부터 섹스리스, 각방부부, 불륜, 이혼까지 요즘 부부의 세계’ 인터뷰를 보시려면 이 문장을 클릭하세요.1~8번 문항마다 가장 적합한 선택지를 고른 후, 점수를 모두 더해 주세요.✏️1. 다음 사항에 대해 당신과 배우자 사이에 얼마나 의견이 일치 또는 어긋나는지 각 문항마다 체크하십시오. (총\xa0 \xa0점)다음 문항의 a~d번 중

DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283816 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 사회_사건
INFO:root:https://www.joongang.co.kr/article/25283816 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283841
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283841 HTTP/11" 200 None
INFO:root:page_category: 문화
INFO:root:category: 사회_사건
INFO:root:https://www.joongang.co.kr/article/25283841 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283827
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283827 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 사회_사건
INFO:root:https://www.joongang.co.kr/article/25283827 는 해당 

{'title': '"재혼 두달만에 숨진 치매父, 통장서 56억 인출돼" 아들의 고소', 'source_url': 'https://www.joongang.co.kr/article/25283798', 'content': '뉴스180대 자산가와 결혼한 60대 여성이 50여억원을 가로챘다는 고소장이 접수돼 경찰이 수사에 착수했다.인천경찰청 반부패경제범죄수사대는 특정경제범죄가중처벌법상 사기 혐의로 60대 여성 A씨를 수사하고 있다고 12일 밝혔다.A씨는 지난해부터 올해 6월까지 남편 B(89·사망)씨의 은행 계좌에서 모두 56억원을 인출해 가로챈 의혹을 받고 있다.B씨는 아내와 헤어진 뒤 오랜 기간 혼자 살다가 지난 4월 말 A씨와 재혼했다. B씨는 그로부터 약 2개월 뒤인 지난 7월 초 지병으로 숨졌다.그는 "자식이 아닌 아내 A씨에게 재산을 물려주겠다"는 내용의 유언 영상을 남긴 것으로 알려졌다.그러나 B씨 아들은 "A씨가 치매에 걸린 아버지를 현혹해 재산을 가로챘다"며 지난 6월 경찰에 고소했다.경찰 관계자는 "A씨를 피의자 신분으로 불러 조사했다"며 "여러 자료를 살펴보며 혐의 입증이 가능한지를 검토하고 있다"고 말했다.이해준 기자 lee.hayjune@joongang.co.kr', 'category': 'accident', 'source_created_at': '2024-10-12T13:37:23+09:00', 'press_id': 1, 'press_name': '중앙일보'}


INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:Article saved to ./joongang/accident/2024-10-12-3/source-2024-10-12-3.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283560
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283560 HTTP/11" 200 None


{'title': '"여친이 길 잃었어요"…설악산서 발목 삐끗한 스웨덴인 극적 구조', 'source_url': 'https://www.joongang.co.kr/article/25283793', 'content': '구조 장면. 사진 설악산국립공원. 연합뉴스설악산을 등산하던 스웨덴 여성이 사회관계망서비스(SNS) 덕분에 극적으로 구조됐다. 119는 스웨덴에서 온 신고를 받고 구조에 나설 수 있었다.12일 설악산국립공원과 환동해특수대응단에 따르면 전날 오후 6시 56분께 스웨덴에 거주하는 A씨로부터 \'여자친구 B씨가 설악산 등산 중 길을 잃었다"는 신고가 접수됐다.B씨는 한국에 놀러 와 혼자 산을 오른 뒤 하산하던 중 날이 어두워져 길을 잃은 것으로 알려졌다. B씨는 119 연락처 등을 몰랐고 대신 사회SNS 메신저를 통해 A씨에게 구조 요청을 했다. A씨는 이후 B씨의 현재 위치 등을 한국 119에 알렸다.소방 당국과 민간 구조대원, 국립공원 관계자 등은 이날 오후 8시 20분께 B씨를 발견, 응급조치한 뒤 오후 11시 47분께 안전하게 하산시켰다.길을 잃고 헤매는 과정에서 발목 등을 다친 B씨는 병원에서 치료를 받았다.이해준 기자 lee.hayjune@joongang.co.kr', 'category': 'accident', 'source_created_at': '2024-10-12T12:16:08+09:00', 'press_id': 1, 'press_name': '중앙일보'}


INFO:root:page_category: 사회
INFO:root:category: 사회_사건
INFO:root:Article saved to ./joongang/accident/2024-10-11-4/source-2024-10-11-4.json


{'title': '여고생 살해 후 "헤헤 거짓말이야"…박대성 신고 녹취록 소름', 'source_url': 'https://www.joongang.co.kr/article/25283560', 'content': '여고생을 살해한 후 1시간 뒤 길거리에서 난동을 부리다 시민에게 제압당하는 박대성. 사진 JTBC 캡처전남 순천 여고생 살인범 박대성이 범행 1시간 뒤 웃는 목소리가 담긴 통화 녹취록이 공개됐다.10일 JTBC는 길거리에서 난동을 부린 박대성을 제압하고 경찰에 신고한 시민 A씨의 전화 녹취를 입수해 공개했다. 당시 박대성은 처음 보는 10대 여학생을 흉기로 살해한 뒤\xa0길거리를 배회하다 차를 파손하고 난동을 피웠다.공개된 통화 녹취록에는 박대성이 히죽거리듯 웃고 장난치는 듯한 말투가 그대로 담겼다.A씨는 "가게에 행패 부리는 사람이 있다. 차 깨버리고 난리다. 빨리 와달라"며 경찰에 도움을 요청했다. 이에 박대성은 옆에서 장난스러운 목소리로 "거짓말이야", "거짓말이에요"라고 반복해 말했고, 이 과정에서 "헤헤" 하고 웃는 목소리도 담겼다.신고 당시 박대성이 살인범이라는 사실을 몰랐다는 A씨는 "놀랐다. 이틀 동안 울었다. 얘(박대성)가 왜소해도 몸이 무서운 게 아니라 그 눈빛이 무서웠다. 그냥 악마를 본다고 할까"라며 당시를 회상했다.그러면서도 "저한테 나타난 게 그나마 천만다행인 것 같다. 힘없는 학생이나 어르신(을 만났다면) 이 상태로 봤을 때는 사고 칠 수도 있겠다 (싶었다)"고 덧붙였다.박대성은 지난달 26일 0시 44분쯤 순천시 조례동의 한 거리에서 10대 여학생을 흉기로 여러 차례 찌르고 달아난 혐의를 받는다. 그는 만취 상태로 거리를 배회하다가 행인과 시비가 붙었고, 사건 약 2시간 20분 만인 오전 3시쯤 신고받고 출동한 경찰에 체포됐다.현예슬 기자 hyeon.yeseul@joongang.co.kr', 'category': 'accident', 'source_created_at': '2024-10-11T09:03:00+09:00'

INFO:root:category (base_url): 경제_과학 (https://www.joongang.co.kr/money/science)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /money/science HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283833
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283833 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 경제_과학
INFO:root:https://www.joongang.co.kr/article/25283833 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283768
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283768 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제_과학
INFO:root:Article saved to 

{'title': '직원 절반이 급여 3억 이상 받았다…이 회사 구내식당 가보니', 'source_url': 'https://www.joongang.co.kr/article/25283768', 'content': '지난달 26일(현지시간) 미국 캘리포니아주 산타클라라에 위치한 엔비디아 본사 카페테리아(구내식당) 커리 코너에 인도식 카레 음식이 진열되어 있다. 실리콘밸리=이희권 기자사람에게 먹는다는 것은 생각보다 중요한 일이다. 최근 넷플릭스 요리 대결 프로그램 ‘흑백요리사’가 엄청난 인기를 끈 이유도 이왕 먹는 거 좀 더 즐겁게 맛있는 요리를 먹고 싶다는 본능을 자극했기 때문이다.그래서 ‘공짜 밥(Free Meal)’은 미국 실리콘밸리의 대표적인 기업복지로 꼽힌다. 전 세계 인재의 요람으로 떠오른 빅테크 기업들은 2000년대 초반 최고의 인재를 확보하고 지키기 위해 구내식당으로 눈을 돌렸다. 직원들이 회사 식당에서 즐겁게 시간을 보낸다면 업무 효율이 올라가고, 이직 시도도 줄일 수 있을 거라 봤기 때문이다.지난달 26일(현지시간) 미국 캘리포니아주 산타클라라에 위치한 엔비디아 본사 건물 ‘보이저’. 우주선을 닮은 거대한 건물 내부에는 엘리베이터가 보이지 않는다. “직원들이 돌아다니며 서로 소통해야 한다”는 젠슨 황 최고경영자(CEO)의 철학에 따른 것. 실리콘밸리=이희권 기자가장 먼저 페이스북(현재 메타)과 구글이 24시간 무료 음식·간식을 제공하기 시작했다. 트위터(현재 X)는 모든 사무실에 스낵바를 설치했다. 아예 미슐랭 스타 셰프를 고용해 최고급 요리를 직원들에게 제공하거나 생맥주 기계를 설치해 즐길 수 있도록 하는 곳도 생겨났다. 이에 자극받아 삼성전자·SK하이닉스 등 국내 반도체 업계도 지금은 실리콘밸리 기업 못지않은 수준의 구내식당을 운영한다.물론 이 같은 복지가 영원할 수는 없다. 회사가 어려워지면 가장 먼저 밥부터 끊기 때문이다. 최근 창사 이래 최대 위기를 맞은 인텔이 가장 먼저 취했던 조치 역시 무료 식사·간식 제공 중단이었다.엔비디아 구내식

DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283841 HTTP/11" 200 None
INFO:root:page_category: 문화
INFO:root:category: 경제_과학
INFO:root:https://www.joongang.co.kr/article/25283841 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283827
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283827 HTTP/11" 200 None
INFO:root:page_category: 정치
INFO:root:category: 경제_과학
INFO:root:https://www.joongang.co.kr/article/25283827 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283838
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283838 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제_과학
INFO:root:Article saved to ./joongang/science/2024-10-13-3/

{'title': '삼성폰 \'설정\' 메뉴 사라진다…"원하는 환경 알아서 최적화"', 'source_url': 'https://www.joongang.co.kr/article/25283838', 'content': '갤럭시 휴대전화 메인 화면. 설정 기능은 톱니바퀴 모양(사진 속 네모)으로 된 버튼을 누르면 이용 가능하다. 사진 네이버 블로그 캡처삼성전자 갤럭시 스마트폰에서 \'설정\' 메뉴가 사라질 전망이다.삼성전자는 13일 "갤럭시 스마트폰 사용자가 설정 메뉴에 들어가 수동으로 세팅을 바꿀 필요 없이 개개인에게 최적화된 경험을 제공하는 것을 목표로 스마트폰을 개발하고 있다"고 설명했다.삼성전자 측은 "키보드 및 카메라와 같은 사용자 접근 지점의 성능을 개선해 소비자가 원하는 것을 사전에 예측, 실행시키는 기능을 개발 중"이라며 "AI를 활용해서 소비자가 별도의 조작 없이 편리하게 사용할 수 있는 환경"이라고 부연했다.즉, 톱니바퀴 모양으로 된 설정 메뉴를 열지 않아도 사용자가 음성으로 명령을 내리거나 기기가 AI로 판단해 최적화된 사용 환경을 제공하도록 한다는 것이다.삼성전자가 지난 9월 27일 준프리미엄급 스마트폰 \'갤럭시 S24 FE\'를 공개했다.  기사 내용의 이해를 돕기 위한 자료 사진. 뉴스1갤럭시의 자동 제어 모드는 사물인터넷(IoT) 플랫폼 \'스마트싱스\'와 결합해 휴대전화 이외의 모바일 기기나 가전 등 제3의 기기까지 자동으로 관리하는 것을 목표로 하고 있다.기기 설정을 사용자 습관이나 시간대, 날씨, 장소 등 상황에 맞는 최적의 상태로 변경, 세분화해 작동하는 방식이다.가령 지금은 카메라 앱에서 인물·음식 사진 등의 모드를 사용자가 직접 스크린을 터치해 실행하지만, 앞으로는 AI가 피사체나 사용자의 촬영 패턴을 분석해 인물·음식·동물·풍경 등으로 분류하고 최적의 카메라 모드를 알아서 작동시키는 방식이 될 것으로 보인다.조도·싱글 테이크·슬로우 모션 등 각종 촬영 설정도 촬영 환경에 기반해 AI가 판단하거나 사용자가 음성으로 제어할 수

INFO:root:page_category: 팩플
INFO:root:category: 경제_과학
INFO:root:https://www.joongang.co.kr/article/25283674 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283628
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283628 HTTP/11" 200 None
INFO:root:page_category: 팩플
INFO:root:category: 경제_과학
INFO:root:https://www.joongang.co.kr/article/25283628 는 해당 카테고리가 아니어서 생략합니다. 
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283624
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283624 HTTP/11" 200 None
INFO:root:page_category: 경제
INFO:root:category: 경제_과학
INFO:root:Article saved to ./joongang/science/2024-10-11-4/source-2024-10-11-4.json


{'title': '‘KES 2024 오프닝 키노트’ 22일 개최, AI 활용 기술혁신 전략 제시', 'source_url': 'https://www.joongang.co.kr/article/25283624', 'content': '사진 제공 = 한국전자정보통신산업진흥회한국전자정보통신산업진흥회(회장 한종희, 이하 ‘KEA’)는 올해로 55회를 맞이하는 ｢KES 2024(한국전자전)｣ “오프닝 키노트”를 10월 22일(화) 오후 2시부터 서울 COEX 컨퍼런스룸 401호에서 개최한다고 밝혔다.이번 KES 2024의 오프닝 키노트는 "Hybrid AI, 지속가능한 세상을 그리다”라는 주제로, AI와 산업의 융합을 통해 지속 가능한 미래와 기술혁신 전략을 제시한다. 글로벌 기술 리더들이 최신 기술 트렌드를 소개하고, 각 산업의 미래 비전에 대한 인사이트를 공유할 계획이다.사진 제공 = 한국전자정보통신산업진흥회작년에 이어 올해도 CES 2025 프리뷰 & 테크트렌드 발표와 함께 서울대 AI 연구원, LG전자, KT가 온디바이스 AI, AICT(인공지능+정보통신기술)를 통한 디지털 전환 등 미래산업을 이끌 혁신적 기술 트렌드를 제시하며, 차세대 AI 기술이 새롭게 열어갈 기회와 도전에 대하여 강연한다.CES를 주최하는 미국 소비자기술협회(CTA)의 브라이언 코미스키(Brian Comiskey)가 CES 2025 프리뷰 세션을 온라인 발표로 진행한다.미국 CES의 "테크 투 와치(Tech to Watch)" 세션을 통해 주요 기술 트렌드와 키워드를 제시해 온 그는 이번 발표를 통해 AI와 모빌리티 등 미래 산업을 이끌 핵심 트렌드에 대한 인사이트를 제공한다.서울대 AI 연구원 장병탁 원장은 "AI의 뉴프론티어" 라는 주제로 기조 발표를 진행한다.AI 기술의 발전이 일상과 산업 전반에 미치는 영향을 분석하고, 다양한 산업 분야에 적용된 AI 기술 사례를 통해 AI 혁명의 현황을 조망하고 AI가 미래 산업에 미칠 잠재적 영향과 혁신적 변화를 심도 있게 다룰 예정이다.다음으로

INFO:root:category (base_url): 사회 (https://www.joongang.co.kr/society)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /society HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283787
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283787 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:https://www.joongang.co.kr/article/25283787 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283788
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283788 HTTP/11" 200 None
INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:https://www.joongang.co.kr/article/

{'title': '"올해 김장 11월 중순 넘어 해달라"…가을배추도 비상 걸렸다', 'source_url': 'https://www.joongang.co.kr/article/25283835', 'content': '지난 6일 서울 동대문구 청량리 종합시장에서 배추가 포기당 1만원에 판매되고 있다. 통계청 9월 소비자물가 동향에 따르면 배추, 무, 상추 등 주요 채소류 가격이 폭등하며 채소류 물가가 전년 동기 대비 11.5% 상승했다. 뉴시스“여름철 내내 폭염과 폭우가 계속된 탓에 ‘금(金)배추’ 10포기 중 1~2포기를 또 버려야 할 판입니다.”지난 9일 오전 국내 최대 가을·겨울배추 산지인 전남 해남군 산이면 한 배추밭. 밭고랑을 가득 메운 배추 사이에 미처 크지 못한 작은 배추가 눈에 띄었다. 올해 잦은 비와 폭염 탓에 수확이 임박한 배추도 생육이 부진했다. 해남군은 전국 가을과 겨울배추 재배 면적의 15~16%, 60~65%를 차지하는 배추 산지다.농민 김효수(67·해남군)씨는 “추석 전부터 영양제를 공급하고 웃거름도 줬지만 10% 이상은 상품성이 떨어진다”며 “옆 농가에서는 지난달 폭우 때 배추밭이 침수돼 밭을 전부 갈아엎을 정도로 피해가 크다”고 말했다.‘금배추’ 214㏊ 폐기…가을배추도 ‘비상’전남 해남군 산이면 배추밭에서 농민들이 폭우 피해를 본 배추를 살리기 위해 작업을 하고 있다. 연합뉴스올여름 배춧값 급등 현상이 가을까지 이어지는 가운데 가을·겨울배추 산지에도 비상이 걸렸다. 지난 8월 말부터 심은 폭염 등으로 모종이 고사하거나 생육 부진 피해가 발생하고 있기 때문이다.12일 해남군에 따르면 올해 해남지역 배추 재배면적 4299㏊ 중 14%에서 생육장애 현상이 발생했다. 지난달 20~21일 집중호우 당시 배추밭 611㏊에서 유실·매몰 피해가 발생한 여파가 컸다. 해남군 관계자는 “생육이 부진한 배추밭 가운데 일부는 영양제를 줘가며 살려냈지만, 재배면적의 5%(214㏊) 정도는 회복이 불가능해 모두 폐기했다”고 말했다.농식품부, “가을배추 출

INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:Article saved to ./joongang/society/2024-10-13-2/source-2024-10-13-2.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283842
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283842 HTTP/11" 200 None


{'title': '고객용 머그컵·달력 가져갔다고 직원 해고… 法 “부당해고”', 'source_url': 'https://www.joongang.co.kr/article/25283836', 'content': "포르쉐 국내 공식 딜러사가 '고객용 머그컵과 달력을 가져갔다'는 등의 이유로 직원을 해고한 건 부당하다는 법원 판단이 나왔다. 사진은 포르쉐 차량 이미지사진, 기사와 직접 관련 없음. 뉴스1한 수입차 딜러사가 고객 증정용 머그컵 세트와 달력을 무단으로 가져갔다는 이유 등으로 직원을 해고한 건 부당해고라는 법원 판단이 나왔다. 서울행정법원 행정 3부(부장판사 최수진)는 포르쉐 공식 딜러사인 아우토슈타트가 중앙노동위원회를 상대로 ‘부당해고판정을 취소해달라’며 낸 청구를 기각했다고 10일 밝혔다. 아우토슈타트가 지난해 직원 A씨를 해고한 게 부당해고라는 중노위의 판단을 그대로 유지했다.아우토슈타트는 지난해 2월 직원 A씨에게 해고를 통보했다. ▶고객사은품인 머그컵 세트 5개, 달력 1개를 무단 반출하고(절도) ▶그로 인해 회사 업무수행에 지장을 주고 재산손실을 입혔으며 ▶‘고객응대 업무 배제’ 상태에서 지시를 따르지 않고 고객을 응대해 보고‧지휘체계를 무시했다는 등의 이유를 댔다.A씨는 직후 지방노동위원회에 부당해고구제신청을 했다. 지방노동위원회는 징계사유 3가지 모두 부당하다며 구제신청을 인용했다. 아우토슈타트가 불복해 중노위에 사건을 가져갔지만 중노위는 ‘머그컵 무단반출’ 부분만 정당한 징계사유로 인정하고, “다른 징계사유는 부당하고 징계양정도 과하다”며 이를 기각했다.이에 결국 법원에 제기한 행정소송에서 법원도 “회사의 징계가 부당했다”고 판단했다. 머그컵 세트 무단반출은 사내 취업규칙 중 ‘무단반출 및 업무상 잘못‧회사에 손해’ 규정에 반해 정당한 징계사유로 볼 수 있지만 절도는 아니고, 나머지 징계사유는 모두 부당하다고 했다. A씨가 가져간 머그컵 세트 5개 중 2개는 고객에게 증정했고 나머지 3개도 고객 증정용으로 가지고 있다가 반납한 점, 머그

INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:Article saved to ./joongang/society/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283843
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283843 HTTP/11" 200 None


{'title': "생후 2개월 아기 성인용 감기약 먹고 사망…'이 성분'이 독 됐다", 'source_url': 'https://www.joongang.co.kr/article/25283842', 'content': '사진 셔터스톡생후 2개월 영아에게 성인용 감기약을 먹여 숨지게 한 30대 남녀가 실형을 선고받았다.13일 법조계에 따르면 창원지법 형사5단독 이재원 부장판사는 과실치사 혐의로 기소된 친모 A씨(30대)씨와 A씨 지인 B씨(30대)에게 각각 금고 1년을 선고했다.A씨 등은 2022년 8월 경남 창원시 한 모텔에서 생후 2개월 된 A씨 아들 C군에게 성인용 감기약을 분유에 타 먹이고 엎어 재운 뒤 숨지게 한 혐의를 받는다.부검 결과 감기약 속 디펜히드라민 성분이 C군에게 독성 작용을 한 것으로 나타났다. 디펜히드라민 성분이 포함된 성인용 감기약은 심각한 부작용으로 영유아가 사망할 수 있어 만 4세 미만 아동에게는 투약을 권고하지 않는다.당시 A씨와 B씨는 C군이 칭얼대며 잠을 자지 않는다는 이유로 약국에서 구입한 성인용 감기약을 분유에 타서 먹였다.아울러 코와 입이 동시에 막혀 C군은 질식사했다.사건 당시 모텔에는 B씨 동거녀 D씨와 D씨 자녀도 함께 있었다.재판부는 "피고인들이 조금만 주의를 기울였다면 C군 사망을 초래하지 않았을 것으로 보여 죄책이 매우 무겁다"며 "수사 초기 감기약을 먹인 사실을 감추는 등 범행 후 사정도 좋지 않지만, 범행을 인정하고 반성하는 점 등을 고려했다"고 양형 이유를 설명했다.하수영 기자 ha.suyoung@joongang.co.kr', 'category': 'society', 'source_created_at': '2024-10-13T11:10:59+09:00', 'press_id': 1, 'press_name': '중앙일보'}


INFO:root:page_category: 사회
INFO:root:category: 사회
INFO:root:Article saved to ./joongang/society/2024-10-13-4/source-2024-10-13-4.json


{'title': "LIVE :[포토타임] 월척 잡은 멸종위기생물 2급 '물수리'", 'source_url': 'https://www.joongang.co.kr/article/25283843', 'content': "오늘의 국내 주요 뉴스 사진(전송시간 기준)을 한눈에 파악할 수 있도록 실시간 업데이트합니다.2024.10.13오후 12:00월척 잡은 멸종위기생물 2급 '물수리'13일 경북 포항시 남구 연일읍 형산강에서 물수리가 물고기를 잡은 후 날아가고 있다. 환경부 지정 멸종위기생물 2급인 물수리는 9월 말부터 11얼 중순까지 형산강에서 사냥을 한다.뉴스1뉴스1물수리가 물고기를 잡기 위해 강물로 뛰어들고 있다. 뉴스1오전 10:30한강에서 배우는 요가, '한강페스티벌 가을편'13일 서울 광진구 뚝섬한강공원에서 열린 '한강페스티벌 가을편'에서 시민들이 수상 요가 프로그램인 패들보드 요가를 배우고 있다.\xa0한강페스티벌은 계절별로 한강에서 느낄 수 있는 매력과 즐거움을 다양한 프로그램으로 구성한 사계절 축제다.오는 20일까지 열리는 이번 행사는 노을 지는 한강 변에서 펼쳐지는 클래식 공연, 선상에서 펼쳐지는 그림여행, 무한 집중력이 요구되는 이색겨루기 대회 등 다양한 프로그램이 준비되어있다.\xa0이외에도 행사기간 다양한 아프리카의 매력을 체험할 수 있는 '서울아프리카페스티벌'과 할인된 가격으로 수상레저를 축제 기간 내내 경험할 수 있는 '세빛섬 요트&카약페스티벌', '한강한류불꽃크루즈' 등도 진행된다.프로그램 관련 자세한 사항은 축제 공식 누리집, 페이스북, 인스타그램에서 확인하거나, 120다산콜로 문의하면 된다.뉴시스뉴시스뉴시스2024.10.13오전 9:00부산 바다 앞에서 열린 ″분포웨이브베이 가을밤 피크닉″지난 12일 밤 부산 남구 용호만 매립부두에 새롭게 조성된 '분포웨이브베이'에서 온가족이 함게 즐길 수 있는 ″분포웨이브베이 가을밤 피크닉″행사에서 시민들이 대형 비누방울 공연을 보고 있다. 이날 가족 단위 참가자들은 가을밤 광안대교와 바다를 배경으로

INFO:root:category (base_url): 스포츠 (https://www.joongang.co.kr/sports)
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /sports HTTP/11" 200 None
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283288
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283288 HTTP/11" 200 None
INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:https://www.joongang.co.kr/article/25283288 은 오늘 오전 8시 이전 기사이므로 생략합니다.
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283352
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283352 HTTP/11" 200 None
INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:https://www.joongang.co.kr/artic

{'title': '프리미어12에서 한국 동료들 상대할 KT 로하스…“가을야구 아쉬움 만회하겠다”', 'source_url': 'https://www.joongang.co.kr/article/25283839', 'content': "KT 멜 로하스 주니어가 11일 서울 잠실구장에서 열린 LG와의 준플레이오프 5차전을 마친 뒤 LG 오스틴 딘과 포옹하고 있다. 고봉준 기자프로야구 KT 위즈의 포스트시즌 돌풍을 이끈 외국인타자 멜 로하스 주니어(34·도미니카공화국)와 오랜 시간 같은 유니폼을 입고 마운드를 지킨 고영표(33)와 엄상백(28), 소형준(23), 박영현(21)이 맞붙는다면 어떤 결과가 나올까. 상상만 해도 흥미로운 맞대결이 다음 달 개막할 프리미어12에서 펼쳐질 수도 있다. 각자의 나라를 대표하는 진검승부를 앞둔 로하스는 “남은 기간 최상의 컨디션을 만들어 가을야구에서의 아쉬움을 만회하겠다”고 힘주어 말했다.SSG와 랜더스와의 5위 결정전 역전승을 발판으로 가을야구 진출을 확정했던 KT는 두산 베어스와의 와일드카드 결정전에서 1차전과 2차전을 모두 잡고 최초의 5위팀 셋업을 이뤄냈다. 이어 준플레이오프에서도 LG 트윈스와 대등하게 싸우며 플레이오프 진출 눈앞까지 갔다. 그러나 지난 11일 서울 잠실구장에서 열린 5차전에서 1-4로 지며 가을야구 여정을 모두 마쳤다.올해 KT의 돌풍에서 빼놓을 수 없는 이름은 로하스다. 2017년부터 KT에서 뛴 로하스는 2020년 142경기에서 타율 0.349 47홈런 135타점 116득점으로 맹활약하고 MVP를 수상했다. 이때의 존재감을 앞세워 이듬해 일본프로야구(NPB)로 떠났다가 올 시즌 다시 KT로 돌아와 144경기를 모두 뛰며 타율 0.329 32홈런 112타점 108득점으로 여전한 방망이를 자랑했다.KT의 가을야구 드라마도 로하스의 방망이에서 출발했다. SSG와의 5위 결정전에서 1-3으로 뒤지던 8회말 김광현으로부터 극적인 역전 3점홈런을 터뜨려 포스트시즌 진출을 이끌었다. 또, 와일드카드 결정전에서도 결

INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:Article saved to ./joongang/sports/2024-10-13-2/source-2024-10-13-2.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283847
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283847 HTTP/11" 200 None


{'title': '불혹 앞둔 호날두, A매치 133호골 폭발...포르투갈 네이션스리그 3연승', 'source_url': 'https://www.joongang.co.kr/article/25283840', 'content': "A매치 133호 골을 터뜨린 호날두. 로이터=연합뉴스불혹을 앞둔 수퍼스타 공격수 크리스티아누 호날두(39·포르투갈)가 A매치(국가대표팀 간 경기) 133호 골을 터뜨렸다.포르투갈은 13일(한국시간) 폴란드의 바르샤바 국립경기장에서 열린 2024~25시즌 유럽축구연맹(UEFA) 네이션스리그 리그A 1조 3차전에서 폴란드에 3-1로 이겼다. 대회 3연승을 달린 포르투갈은 1조 선두(승점 9)를 달렸다.호날두는 포르투갈이 1-0으로 앞서던 전반 37분 추가 골을 터뜨렸다.\xa0하프라인에서 공을 잡아 수비수 3명을 제치며 돌파하던 하파엘 레앙이 시도한 땅볼 슈팅이 오른쪽 골대를 맞고 나오자, 호날두가 왼발로 가볍게 밀어 넣었다. 폴란드가 후반 33분 피오트르 지엘린스키의 골로 한 점을 만회하면서 호날두의 골이 결승 골이 됐다. 이로써 그는 A매치 3경기 연속 골 행진도 이어갔다.지난해 유럽 무대를 떠나 사우디아라비아 알나스르로 이적한 호날두는 은퇴 수순을 밟을 거란 예상과 달리, 여전히 펄펄 날고 있다. 지금의 득점 페이스라면 지난 8월 자신의 소셜미디어(SNS)를 통해 밝힌 목표 '프로·A매치 통산 1000골' 달성도 가능할 것이라는 분석이 나온다. 호날두는 프로 통산 773골을 기록 중이다. A매치 득점 기록을 더하면 통산 904골이다.\xa02023~24시즌 알나스르에서만 50골을 넣은 그는 올 시즌도 소속팀에서 8골, A매치 3골 등 11골을 기록 중이다.리그A 4조에서는 스페인이 덴마크를 홈에서 1-0으로 물리치고 2연승을 기록했다. 승점 7을 쌓은 스페인은 덴마크(승점 6)를 제치고 조 선두로 올라섰다.피주영 기자 akapj@joongang.co.kr", 'category': 'sports', 'source_created_at':

INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:Article saved to ./joongang/sports/2024-10-13-3/source-2024-10-13-3.json
DEBUG:root:Scraping article: https://www.joongang.co.kr/article/25283850
DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25283850 HTTP/11" 200 None


{'title': "고개 숙인 '월드스타' 김예지…막판에 4점 전국체전 본선 탈락", 'source_url': 'https://www.joongang.co.kr/article/25283847', 'content': '전국체전에서 노메달에 그친 파리올림픽 스타 김예지. 연합뉴스"많이 아쉽다."전국체육대회 공기권총 본선에서 \'4점\'을 쏴 결선 진출이 불발된 2024 파리올림픽 은메달리스트 김예지(임실군청)가 아쉬움을 감추지 못했다.\xa0김예지는 13일 경남 창원국제사격장에서 열린 전국체전 사격 여자 일반부 10m 공기권총 본선에서 573점을 쐈다. 그는 전체 13위에 그치며\xa0상위 8명이 겨루는 결선 진출에 실패했다.김예지의 결승행이 좌절된 건 단 한 발의 실수 때문이다.\xa0공기권총 본선은 1시간 15분 동안 한 시리즈마다 10발씩 총 6시리즈(총 60발)을 쏴 순위를 가린다.\xa010.0점 이상은 10점으로, 9.0∼9.9점은 9점으로 처리되는 방식이다.\xa0김예지는 첫 시리즈에서 95점을 쐈다. 이후 2∼4시리즈에서 97점, 96점, 97점을 쏘며 차츰 순위를 끌어 올렸다.김예지는 5시리즈에서 9발까지 89점을 기록해 3위권 진입을 노렸다. 그러나 마지막 발에 4점을 쐈다. 6시리즈에서 95점을 쏴도 경쟁자와의 격차를 줄이기엔 어려웠다.\xa0사격 관계자는 "과녁의 12시 방향 4점에 꽂혔다. 팔을 위에서 내리면서 조준하다가 방아쇠를 잘못 당긴 것"이라고 설명했다.전국체전에서도 금메달을 차지한 파리올림픽 금메달리스트 오예진. 연합뉴스김예지는 경기 뒤 "마지막 시합을 좀 아쉽게 마쳤다. 많이 아쉽다"며 "좀 더 노력해서 좋은 모습을 보여드리도록 하겠다"고 짧게 소감을 밝혔다. 김예지는 전날 자신의 주종목인 25m 공기권총에서 7위, 공기권총 단체전에서도 5위에 머무르며 이번 전국체전은 빈손으로 돌아섰다. 파리올림픽 사격 10m 공기권총 금메달리스트 오예진은 결선에서 242.8점을 쏴 금메달을 목에 걸었다. 오예진은 앞서 열린 본선에서 585점을 

INFO:root:page_category: 스포츠
INFO:root:category: 스포츠
INFO:root:Article saved to ./joongang/sports/2024-10-13-4/source-2024-10-13-4.json


{'title': '염경엽 LG 감독 "손주영 2차전 대신 3차전 선발 기용"', 'source_url': 'https://www.joongang.co.kr/article/25283850', 'content': '선수단에게 박수를 보내는 LG 트윈스 염경엽 감독. 연합뉴스변화 대신 안정을 택했다. LG 트윈스가 준플레이오프 마지막 경기와 거의 같은 라인업을 꺼냈다. 손주영은 2차전 대신 3차전 선발로 나선다.LG는 13일 대구 삼성 라이온즈파크에서 열리는 삼성과의 플레이오프 1차전에 홍창기(우익수)-신민재(2루수)-오스틴 딘(1루수)-김현수(좌익수)-오지환(유격수)-문보경(3루수)-박동원(포수)-박해민(중견수)-문성주(지명타자) 타순을 내세웠다. 준PO 1차전부터 선발로 나간 9명의 야수가 그대로 나선다. 타순도 준PO 5차전과 비교하면 김현수와 오지환 순서만 바뀌었다.염경엽 LG 감독은 "김현수는 최근 타격감도 괜찮고, 상대전적도 좋다. 4번을 올리는 게 흐름상 좋을 것 같다"고 말했다. 문보경은 준PO 4차전까지 무안타를 치면서 타순이 4번에서 6번으로 조정됐다. 그러나 그는 5차전에서 첫 안타를 기록하면서 반등 조짐을 보이고 있다. 올 시즌 대구구장 성적(타율 0.357, 2홈런 7타점)도 좋았다. 염 감독은 "문보경이 분명히 살아날 거다. 선발 투수 최원태도 페넌트레이스 때 기복이 있었는데, 삼성전에서만은 항상 (공이 손에)긁혔다"며 웃었다.LG는 준플레이오프에서 대주자 요원 최원영을 제외하고, 김범석을 엔트리에 합류시켰다. 염 감독은 "상황이 되면 대타 요원 정도로 활용하려고 한다. KT보다는 왼손투수가 있고, 좌완에 대비하려고 한다. 컨디션이 괜찮다는 보고를 받았다"고 말했다.준플레이오프 5차전 데일리 MVP를 수상한 LG 손주영. 연합뉴스LG는 준PO에서 불펜으로 나섰던 손주영을 3차전 선발로 내보내기로 했다. 2차전 디트릭 엔스, 3차전 손주영, 4차전 임찬규로 이어지는 로테이션이 유력하다. 손주영은 준PO에서 7과 3분의 1이닝 동안 안타 3개

## 중앙일보 단일 기사 스크랩

In [10]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import logging
import os
import re

logging.basicConfig(level='DEBUG')

header = {'User-Agent': ('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                         '(KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'),}

output_dir = './joongang'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

def scrap_article(article_url):
    response = requests.get(article_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    # 헤드라인 스크랩
    try:
        title = soup.find('h1', {'class': 'headline'}).get_text(strip=True)
    except AttributeError:
        title = 'N/A'

    # 생성일 스크랩
    try:
        date = soup.find('p', {'class': 'date'})
        time = date.find('time').get('datetime')
    except AttributeError:
        time = 'N/A'

    # 본문 스크랩
    try:
        content = soup.find('div', {'class': 'article_body'}).get_text(strip=True)
    except AttributeError:
        content = 'N/A'

    return {
        'title': title,
        'source_url': article_url,
        'content': content,
        'category': 'sports',  # 이 부분은 해당 카테고리에 맞게 수정할 수 있습니다.
        'source_created_at': time,
        'press_id': 1,
        'press_name': '중앙일보'
    }

# 파일 생성
def save_article_as_json(article_data, date, file_idx):
    category = "sports"
    file_name = date + "-" + str(file_idx) + '.json'
    result_dir = output_dir + "/" + category + "/" + date + "-" + str(file_idx)
    if not os.path.exists(result_dir):
        os.makedirs(result_dir)

    file_path = os.path.join(result_dir, 'source-' + file_name)
    
    # 단일 dataframe 생성
    single_article_df = pd.DataFrame([article_data])
    
    # json으로 변환
    single_article_df.to_json(file_path, orient='records', lines=True, force_ascii=False)
    logging.info(f"Article saved to {file_path}")

def scrap_single_categories():
    article_url = "https://www.joongang.co.kr/article/25284548"
    
    result = scrap_article(article_url)
    
    if result:
        date = re.match(r'^[^T]+', result.get('source_created_at')).group()  # 날짜 추출
        save_article_as_json(result, date, 1)
    else:
        logging.info(f"Failed to scrape article from {article_url}")

scrap_single_categories()

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.joongang.co.kr:443
DEBUG:urllib3.connectionpool:https://www.joongang.co.kr:443 "GET /article/25284548 HTTP/11" 200 None
INFO:root:Article saved to ./joongang/sports/2024-10-16-1/source-2024-10-16-1.json


## 동아일보 단일 기사 스크랩

In [6]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
import logging
import os
import re
from datetime import datetime
from urllib.parse import urlparse

logging.basicConfig(level='DEBUG')

header = {'User-Agent': ('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                         '(KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'),}

output_dir = './donga'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

def scrap_article(article_url):
    response = requests.get(article_url, headers=header)
    soup = BeautifulSoup(response.text, 'html.parser')

    # 헤드라인 스크랩
    try:
        title = soup.find('section', {'class': 'head_group'}).find('h1').get_text(strip=True)
    except AttributeError:
        title = 'N/A'
        
    try:
        date_button = soup.find('button', {'aria-controls': 'dateInfo'})
        time_span = date_button.find('span', {'aria-hidden': 'true'})
        time = time_span.get_text(strip=True)  # "2024-09-30 21:44" 형태
        time = time.replace(" ", "T") + ":00+09:00"  # ISO 8601 형식으로 변환 (예: 2024-09-30T21:44:00+09:00)
    except AttributeError:
        time = 'N/A'

    # 본문 스크랩
    try:
        # 광고, 이미지 등 제외하고 텍스트만 추출
        content_section = soup.find('section', class_='news_view')
        for tag in content_section(['figure', 'script', 'div', 'ul']):  # 불필요한 태그 제거
            tag.decompose()
        content = content_section.get_text(separator="\n", strip=True)
    except AttributeError:
        content = 'N/A'

    return {
        'title': title,
        'source_url': article_url,
        'content': content,
        'category': 'society',  # 이 부분은 해당 카테고리에 맞게 수정할 수 있습니다.
        'source_created_at': time,
        'press_id': 2,
        'press_name': '동아일보'
    }

# 파일 생성
def save_article_as_json(article_data, date, file_idx):
    category = "society"
    file_name = date + "-" + str(file_idx) + '.json'
    result_dir = output_dir + "/" + category + "/" + date + "-" + str(file_idx)
    if not os.path.exists(result_dir):
        os.makedirs(result_dir)

    file_path = os.path.join(result_dir, 'source-' + file_name)
    
    # 단일 dataframe 생성
    single_article_df = pd.DataFrame([article_data])
    
    # json으로 변환
    single_article_df.to_json(file_path, orient='records', lines=True, force_ascii=False)
    logging.info(f"Article saved to {file_path}")

def scrap_single_categories():
    article_url = "https://www.donga.com/news/Society/article/all/20241016/130226096/1"
    
    result = scrap_article(article_url)
    
    if result:
        date = re.match(r'^[^T]+', result.get('source_created_at')).group()  # 날짜 추출
        save_article_as_json(result, date, 2)
    else:
        logging.info(f"Failed to scrape article from {article_url}")

scrap_single_categories()

DEBUG:urllib3.connectionpool:Starting new HTTPS connection (1): www.donga.com:443
DEBUG:urllib3.connectionpool:https://www.donga.com:443 "GET /news/Society/article/all/20241016/130226096/1 HTTP/11" 200 None
INFO:root:Article saved to ./donga/society/2024-10-16-2/source-2024-10-16-2.json
