# Database Query Notebook

PostgreSQL 데이터베이스에서 뉴스 기사를 조회하는 노트북입니다.

In [None]:
import psycopg2
import pandas as pd
from datetime import datetime

# PostgreSQL 연결 설정
def get_db_connection():
    return psycopg2.connect(
        host="localhost",  # Docker service name
        database="news_db",
        user="postgres",
        password="password"
    )

In [1]:
import psycopg2

conn = psycopg2.connect(
    host='localhost',
    port=5432,
    database='news_db',
    user='postgres',
    password='password'
)

cur = conn.cursor()
cur.execute("SELECT * FROM articles LIMIT 10;")
rows = cur.fetchall()
for row in rows:
    print(row)

cur.close()
conn.close()


(1, '카카오모빌리티', 'https://www.seoultimes.news/news/article.html?no=2000058978', 'https://www.seoultimes.news/news/article.html?no=2000058978', "“사장님부터 회장님까지”...대기업 CEO '국감 증인' 줄소환", '류긍선카카오모빌리티대표(카카오택시 등 수수료 및 이용 불편), , 피터알덴우드 애플코리아 대표이사(불법 개인정보 유출과 앱마켓 독과점 지위), 김태영 웹젠 대표이사(게임 아이템 확률 조작) 등의 CEO도 마찮가지다. 이처럼 대기업 총수나 후계자, CEO들이 줄줄이 국감장 증인으로 채택되면서 이를...', '서울타임즈뉴스', 'www.seoultimes.news', datetime.datetime(2024, 9, 30, 15, 32, tzinfo=datetime.timezone.utc), '2024.10.01', datetime.datetime(2024, 11, 29, 1, 40, 57, 213465, tzinfo=datetime.timezone.utc), False, True, False)
(3, '카카오모빌리티', 'https://www.ajunews.com/view/20241001140944533', 'https://www.ajunews.com/view/20241001140944533', "올해도 기업인 줄소환… '보여주기' 전락한 국감", '이 밖에도 △장재훈 현대차 사장(대기업·중견중소기업 교란행위) △류긍선카카오모빌리티대표(카카오택시 등 수수료 및 이용 불편) △김영섭 KT 대표(한전 원격검침 인프라 구축 모뎀사업 관련) △방경만 KT&G 대표(불공정 판매 강요 문제) △강한승 쿠팡 대표(자사 우대 노출), 피터얀 반데비트 우아한형제들...', '아주경제', 'www.ajunews.com', datetime.datetime(2024, 9, 30, 15, 32, tzinfo=datetime.timezone.utc), '2024.10.0

## 날짜별 기사 검색

In [None]:
def search_by_date(date_str):
    """
    특정 날짜의 기사를 검색합니다.
    :param date_str: 'YYYY-MM-DD' 형식의 날짜 문자열
    """
    conn = get_db_connection()
    
    query = """
    SELECT 
        id,
        title,
        publisher,
        naver_link,
        published_at
    FROM articles
    WHERE DATE(published_at) = %s
    ORDER BY published_at DESC
    """
    
    df = pd.read_sql_query(query, conn, params=[date_str])
    conn.close()
    return df

# 사용 예시:
# df = search_by_date('2024-01-15')
# display(df)

## 키워드로 기사 검색

In [None]:
def search_by_keyword(keyword):
    """
    키워드가 포함된 기사를 검색합니다.
    :param keyword: 검색할 키워드
    """
    conn = get_db_connection()
    
    query = """
    SELECT 
        id,
        title,
        publisher,
        naver_link,
        published_at
    FROM articles
    WHERE 
        title LIKE %s OR
        main_keyword LIKE %s
    ORDER BY published_at DESC
    """
    
    search_pattern = f'%{keyword}%'
    df = pd.read_sql_query(query, conn, params=[search_pattern, search_pattern])
    conn.close()
    return df

# 사용 예시:
# df = search_by_keyword('카카오모빌리티')
# display(df)

## 날짜와 키워드로 기사 검색

In [None]:
def search_by_date_and_keyword(date_str, keyword):
    """
    특정 날짜와 키워드로 기사를 검색합니다.
    :param date_str: 'YYYY-MM-DD' 형식의 날짜 문자열
    :param keyword: 검색할 키워드
    """
    conn = get_db_connection()
    
    query = """
    SELECT 
        id,
        title,
        publisher,
        naver_link,
        published_at
    FROM articles
    WHERE 
        DATE(published_at) = %s AND
        (title LIKE %s OR main_keyword LIKE %s)
    ORDER BY published_at DESC
    """
    
    search_pattern = f'%{keyword}%'
    df = pd.read_sql_query(query, conn, params=[date_str, search_pattern, search_pattern])
    conn.close()
    return df

# 사용 예시:
# df = search_by_date_and_keyword('2024-01-15', '카카오모빌리티')
# display(df)

## 기사 내용 조회

In [None]:
def get_article_content(article_id):
    """
    특정 기사의 내용을 조회합니다.
    :param article_id: 기사 ID
    """
    conn = get_db_connection()
    
    query = """
    SELECT 
        a.id,
        a.title,
        a.publisher,
        c.content,
        a.published_at
    FROM articles a
    LEFT JOIN contents c ON a.id = c.article_id
    WHERE a.id = %s
    """
    
    df = pd.read_sql_query(query, conn, params=[article_id])
    conn.close()
    return df

# 사용 예시:
# df = get_article_content(3514)
# display(df)

## 카카오모빌리티 관련 기사 검색 예시

In [None]:
# 특정 날짜의 카카오모빌리티 관련 기사 검색
date_str = '2024-01-15'  # 날짜를 원하는 날짜로 변경하세요
keyword = '카카오모빌리티'

df = search_by_date_and_keyword(date_str, keyword)
display(df)