In [9]:
from pymongo import MongoClient
from datetime import datetime, timedelta, timezone
from collections import defaultdict

client = MongoClient("mongodb://localhost:27017")
db = client["howabout"]  # MongoDB 데이터베이스 이름

def get_data_by_date_and_category(start_date_str, collection_name):
    """
    지정한 날짜부터 오늘까지의 데이터를 MongoDB에서 가져옴.

    Args:
        from_date_str (str): 시작 날짜 (예: '2023-10-01')
        db_name (str): MongoDB 데이터베이스 이름
        collection_name (str): 컬렉션 이름
        data_type (str): 데이터 타입(예: 'trending_videos', 'comments' 등)

    Returns:
        list: 해당 범위에 해당하는 문서 리스트
    """
    # MongoDB 연결
    collection = db[collection_name]

    start = datetime.strptime(start_date_str, '%Y-%m-%d').replace(tzinfo=timezone.utc)
    end = datetime.now(timezone.utc)  # 현재 시각 (UTC 기준)

    query = {
        "timestamp": {
            "$gte": start,
            "$lt": end
        }
    }

    result = list(collection.find(query))

    # 카테고리별로 묶기
    grouped = defaultdict(list)
    for doc in result:
        cat_id = doc.get("metadata", {}).get("category_id")
        if cat_id:
            grouped[cat_id].append(doc)

    return grouped

data = get_data_by_date_and_category('2025-03-28', 'raw_video_data')

data

defaultdict(list,
            {'25': [{'timestamp': datetime.datetime(2025, 3, 29, 22, 51, 50, 212000),
               'metadata': {'category_id': '25'},
               'description': '#이재명 #산불 #항의\n#MBC #뉴스 #뉴스데스크 #MBC뉴스 #뉴스투데이 #뉴스ZIP #뉴스꾹 #오늘이뉴스 #자막뉴스\nㅤ\nⓒ MBC & iMBC 무단 전재, 재배포 및 이용(AI학습 포함)금지',
               'comment_count': 47548,
               'tags': ['MBC',
                'MBC뉴스',
                '뉴스데스크',
                'newsdesk',
                '뉴스투데이',
                'newstoday',
                '8시뉴스',
                '아침뉴스',
                '뉴스',
                '정오뉴스',
                'news',
                '실시간',
                '실시간 뉴스',
                '엠비씨 뉴스',
                '엠비씨',
                '뉴스 실시간',
                '뉴스속보',
                'genre:정치',
                'format:리포트',
                'type:디지털',
                'source:영상',
                'series:오늘 이 뉴스',
                'topic:이재명 청송대피소 방문',
                'person:이재명',
               