### BeautifulSoup 
* select() 함수 사용
* melon 100 chart 데이터 파싱

In [2]:
import re
import requests
from bs4 import BeautifulSoup

url = 'https://www.melon.com/chart/index.htm'

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}

res = requests.get(url, headers=headers)
if res.ok:
    soup = BeautifulSoup(res.text,'html.parser')
    atag_list = soup.select("a[href*='playSong']")
    print(len(atag_list))
    
    #100곡의 song list
    song_list = []
    for idx, atag in enumerate(atag_list,1):
        #1곡의 song dict
        song_dict = {}
        #song 제목
        song_dict['title'] = atag.text
        #href 링크 추출
        href = atag['href']
        matched = re.search(r'(\d+)\);',href)
        if matched:
            song_id = matched.group(1)
        song_dict['id'] = song_id

        song_url = f'https://www.melon.com/song/detail.htm?songId={song_id}'
        song_dict['url'] = song_url
        #song_dict를 song_list에 append
        song_list.append(song_dict)



100


### 곡상세 정보 추출하기

In [3]:
import re
import requests
from bs4 import BeautifulSoup
from pprint import pprint

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}

# 좋아요 건수 가져오기 ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'

# Song 100곡의 상세정보 목록을 저장할 list 선언
song_lyric_list = list()
print('===> 100 곡 노래 파싱 시작')
for idx,song in enumerate(song_list,1):
    print(f'==> {idx} {song['title']}')
    # Song 1곡의 상세정보를 저장할 dict 선언
    song_lyric_dict = dict()
    
    res = requests.get(song['url'], headers=headers)
    if res.ok:
        soup = BeautifulSoup(res.text,'html.parser')
        song_lyric_dict['곡명'] = song['title']
        
        singer_span = soup.select_one("a[href*='goArtistDetail'] span")
        song_lyric_dict['가수'] = singer_span.text

        song_dd = soup.select('div.meta dd') #song_dd는 ResultSet타입, song_dd[0]는 Tag 타입
        if song_dd:
            song_lyric_dict['앨범'] = song_dd[0].get_text(strip=True).replace('\xa0', ' ')
            song_lyric_dict['발매일'] = song_dd[1].text
            song_lyric_dict['장르'] = song_dd[2].text
        
        # song 상세정보 url 저장
        song_lyric_dict['detail_url'] = song['url']

                # 좋아요 건수
        song_id = song['id']
        ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'
        res = requests.get(ajax_url, headers=headers)
        '''
        {
            ``    "contsLike": [
                    {
                        "CONTSID": 600287375,
                        "LIKEYN": "N",
                        "SUMMCNT": 109704
                    }
                ],
                "httpDomain": "http://www.melon.com",
                "httpsDomain": "https://www.melon.com",
                "staticDomain": "https://static.melon.co.kr"
            }``
        '''
        if res.ok:
            song_lyric_dict['좋아요'] = res.json()['contsLike'][0]['SUMMCNT']

        # 노래 가사     
        lyric_div = soup.select('div#d_video_summary')
        if lyric_div:
            lyric = lyric_div[0].text
        else:
            lyric = ''    

        # \n\r\t 특수문자를 찾는 Pattern객체 생성
        pattern = re.compile(r'[\n\r\t]')
        song_lyric_dict['가사'] = pattern.sub('', lyric)

        # song list에 노래상세 정보 dict를 저장하기
        song_lyric_list.append(song_lyric_dict)
    else:
        print(f'Error 코드 = {res.status_code}')    

print(len(song_lyric_list))
pprint(song_lyric_list)
print('===> 100 곡 노래 파싱 끝')

===> 100 곡 노래 파싱 시작
==> 1 404 (New Era)
==> 2 Good Goodbye
==> 3 BANG BANG
==> 4 그대 작은 나의 세상이 되어
==> 5 사랑하게 될 거야
==> 6 Drowning
==> 7 타임캡슐
==> 8 Blue Valentine
==> 9 0+0
==> 10 Golden
==> 11 ONE MORE TIME
==> 12 멸종위기사랑
==> 13 어제보다 슬픈 오늘
==> 14 SPAGHETTI (feat. j-hope of BTS)
==> 15 NOT CUTE ANYMORE
==> 16 뛰어(JUMP)
==> 17 toxic till the end
==> 18 모르시나요(PROD.로코베리)
==> 19 달리 표현할 수 없어요
==> 20 어떻게 이별까지 사랑하겠어, 널 사랑하는 거지
==> 21 사랑은 봄비처럼...이별은 겨울비처럼...
==> 22 너의 모든 순간
==> 23 하얀 그리움
==> 24 내게 사랑이 뭐냐고 물어본다면
==> 25 like JENNIE
==> 26 천상연
==> 27 FAMOUS
==> 28 OVERDRIVE
==> 29 힙합보단 사랑, 사랑보단 돈 (Feat. 베이식)
==> 30 HOME SWEET HOME (feat. 태양, 대성)
==> 31 너에게 닿기를
==> 32 Love Love Love (Feat. Yoong Jin Of Casker)
==> 33 시작의 아이 ❍
==> 34 사랑의 언어 (Love Language)
==> 35 Whiplash
==> 36 청춘만화
==> 37 나는 반딧불
==> 38 HAPPY
==> 39 사랑은 늘 도망가
==> 40 모든 날, 모든 순간 (Every day, Every Moment)
==> 41 그대만 있다면 (여름날 우리 X 너드커넥션 (Nerd Connection))
==> 42 REBEL HEART
==> 43 Soda Pop
==> 44 한 페이지가 될 수 있게
==> 45 소나기
==> 46 예뻤어
==> 47

#### song_lyric_lists를 DataFrame으로 저장하기

In [4]:
# [{'가수';'BTS','앨범':''},{}]
import pandas as pd

#컬럼명을 설정하면서 empty DataFrame 객체생성
song_list_df = pd.DataFrame(columns=['곡명','가수','앨범','발매일','장르','detail_url','좋아요','가사'])

for song_lyric in song_lyric_list: #[ {},{},{} ]
    df_new_row = pd.DataFrame.from_records([song_lyric])
    song_list_df = pd.concat([song_list_df, df_new_row])
    
song_list_df.head(3)

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,404 (New Era),KiiiKiii (키키),Delulu Pack,2026.01.26,댄스,https://www.melon.com/song/detail.htm?songId=6...,24133,404 Not Found in the system404 The new era era...
0,Good Goodbye,화사 (HWASA),Good Goodbye,2025.10.15,발라드,https://www.melon.com/song/detail.htm?songId=6...,109857,나를 그냥 짓밟고 가괜찮아 돌아보지 마내가 아파봤자 너만 하겠니이젠 너를 헤아려봐날...
0,BANG BANG,IVE (아이브),REVIVE+,2026.02.09,댄스,https://www.melon.com/song/detail.htm?songId=6...,15882,It’s a new scene It’s aggressive이미 알아차렸겠지그치 언니...


#### song_lyric_lists를 Json 파일로 저장
* json 파일로 저장해야 DataFrame으로 저장하기 용이함

In [5]:

import json

with open('data/songs100.json','w',encoding='utf-8') as file:
    json.dump(song_lyric_list, file)

### Json File을 DataFrame (표데이터) 객체로 저장하기

In [6]:
import pandas as pd

song_df = pd.read_json('data/songs100.json')
print(type(song_df))
song_df.head()

<class 'pandas.core.frame.DataFrame'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,404 (New Era),KiiiKiii (키키),Delulu Pack,2026.01.26,댄스,https://www.melon.com/song/detail.htm?songId=6...,24133,404 Not Found in the system404 The new era era...
1,Good Goodbye,화사 (HWASA),Good Goodbye,2025.10.15,발라드,https://www.melon.com/song/detail.htm?songId=6...,109857,나를 그냥 짓밟고 가괜찮아 돌아보지 마내가 아파봤자 너만 하겠니이젠 너를 헤아려봐날...
2,BANG BANG,IVE (아이브),REVIVE+,2026.02.09,댄스,https://www.melon.com/song/detail.htm?songId=6...,15882,It’s a new scene It’s aggressive이미 알아차렸겠지그치 언니...
3,그대 작은 나의 세상이 되어,카더가든,부재,2021.01.28,발라드,https://www.melon.com/song/detail.htm?songId=3...,69599,어쩌면 나는 알았을까붉어진 뺨과 수줍게도 모은 손 위로무얼 기대하고 있는지날 그리도...
4,사랑하게 될 거야,한로로,이상비행,2023.08.29,"인디음악, 록/메탈",https://www.melon.com/song/detail.htm?songId=3...,102313,영원을 꿈꾸던 널 떠나보내고슬퍼하던 날까지도 떠나보냈네오늘의 나에게 남아있는 건피하...


In [7]:
# 가수 별 Row Counting
# 가수 별 Row Counting
print(type(song_df['가수']))
song_df['가수'].value_counts().head()

<class 'pandas.core.series.Series'>


가수
임영웅            6
DAY6 (데이식스)    4
IVE (아이브)      4
이무진            4
aespa          4
Name: count, dtype: int64

In [8]:
# 장르 별 Row Counting
song_df['장르'].value_counts()

장르
발라드                34
댄스                 32
록/메탈               10
발라드, 국내드라마          6
랩/힙합                4
인디음악, 록/메탈          3
발라드, 인디음악           3
애니메이션/웹툰            2
R&B/Soul, 인디음악      2
록/메탈, 국내드라마         1
POP, 애니메이션/웹툰       1
POP                 1
애니메이션/웹툰, J-POP     1
Name: count, dtype: int64

In [9]:
# 조건을 만족하는 특정 Row와 모든 컬럼이 출력됨 
song_df.loc[song_df['가수'] == 'G-DRAGON']

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
29,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,228200,"You say, It’s changedShow must go on, Behave오랜..."
72,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,154828,"‘G’, ‘A.P’(Let me kill 'em like I usually do, ..."


In [10]:
# 특정 가수의 노래 정보 출력하기
# 조건을 만족하는 특정 Row와 선택된 특정 컬럼이 출력된다.
#song_df.loc[row,col]
song_df.loc[song_df['가수'] == 'G-DRAGON',['곡명','장르']]

Unnamed: 0,곡명,장르
29,"HOME SWEET HOME (feat. 태양, 대성)",랩/힙합
72,TOO BAD (feat. Anderson .Paak),랩/힙합


In [11]:
# 조건을 만족하는 특정 Row와 Slicing으로 선택된 특정 구간의 컬럼이 출력된다.
song_df.loc[song_df['가수'] == 'G-DRAGON','곡명':'장르'].reset_index(drop=True)

Unnamed: 0,곡명,가수,앨범,발매일,장르
0,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합
1,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합


In [12]:
# unique 한 가수명을 리스트 형태로 출력하기
print(type(song_df['가수'].unique()))
print(len(song_df['가수'].unique()))
song_df['가수'].unique()

<class 'numpy.ndarray'>
69


array(['KiiiKiii (키키)', '화사 (HWASA)', 'IVE (아이브)', '카더가든', '한로로', 'WOODZ',
       '다비치', 'NMIXX', 'HUNTR/X', 'ALLDAY PROJECT', '이찬혁', '우디 (Woody)',
       'LE SSERAFIM (르세라핌)', '아일릿(ILLIT)', 'BLACKPINK', '로제 (ROSÉ)',
       '조째즈', '로이킴', 'AKMU (악뮤)', '임현정', '성시경', '프로미스나인', '제니 (JENNIE)',
       '이창섭', 'TWS (투어스)', '노아주다 (noahjooda)', 'G-DRAGON', '10CM',
       '에픽하이 (EPIK HIGH)', '박다혜', '김민석 (멜로망스)', 'aespa', '이무진', '황가람',
       'DAY6 (데이식스)', '임영웅', '폴킴', '너드커넥션 (Nerd Connection)',
       'KPop Demon Hunters Cast', '이클립스 (ECLIPSE)', '아샤트리', 'Disney',
       'BOYNEXTDOOR', '마크툽 (MAKTUB)', '오반(OVAN)', '아이유',
       'Hearts2Hearts (하츠투하츠)', 'Lady Gaga', '정승환', '잔나비', '웬디 (WENDY)',
       '멜로망스', '나윤권', '먼데이 키즈', '경서예지', 'Kenshi Yonezu', 'EXO', '범진',
       '임재현', '박재정', '이예은', '정국', '순순희(지환)', 'NewJeans', 'DK(디셈버)',
       'QWER', 'PLAVE', '지코 (ZICO)', '다영 (DAYOUNG)'], dtype=object)

In [13]:
#앨범이 OST 인 노래는?
print(type(song_df['앨범'].str))

song_df.loc[song_df['앨범'].str.contains('OST')]

<class 'pandas.core.strings.accessor.StringMethods'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
21,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014.02.12,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=4...,318138,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
38,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,236189,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
39,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018.03.20,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,438483,네가 없이 웃을 수 있을까생각만 해도 눈물이 나힘든 시간 날 지켜준 사람이제는 내가...
44,소나기,이클립스 (ECLIPSE),선재 업고 튀어 OST Part 1,2024.04.08,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,192434,그치지 않기를 바랬죠처음 그대 내게로 오던 그날에잠시 동안 적시는그런 비가 아니길간...
62,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022.02.18,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,233863,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...


In [14]:
# 좋아요 건수가 가장 많은 가수는?
song_df.loc[song_df['좋아요'] == song_df['좋아요'].max()]

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
19,"어떻게 이별까지 사랑하겠어, 널 사랑하는 거지",AKMU (악뮤),항해,2019.09.25,발라드,https://www.melon.com/song/detail.htm?songId=3...,492129,일부러 몇 발자국 물러나내가 없이 혼자 걷는 널 바라본다옆자리 허전한 너의 풍경흑백...


### SqlAlchemy와 Pymysql을 사용하여 DataFrame을 RDB의 테이블로 저장하기

In [15]:
!pip show pymysql

Name: PyMySQL
Version: 1.1.2
Summary: Pure Python MySQL Driver
Home-page: 
Author: 
Author-email: Inada Naoki <songofacandy@gmail.com>, Yutaka Matsubara <yutaka.matsubara@gmail.com>
License-Expression: MIT
Location: C:\Users\wlgh5\anaconda3\Lib\site-packages
Requires: 
Required-by: 


### DataFrame을 Table로 저장하기

In [16]:
import pymysql

#pymysql과 sqlalchemy 연동
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

engine = None
conn = None
try:
    # dialect+driver://username:password@host:port/database
    engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')#, encoding='utf-8')
    print('engine', engine)
    print(type(engine), engine)
    conn = engine.connect()
    print(type(conn), conn)
    
    #song_df(DataFrame객체)를 songs 테이블로 저장하기 to_sql() 함수 사용
    song_df.to_sql(name='songs', con=engine, if_exists='replace', index=False)
finally:
    if conn is not None: 
        conn.close()
    if engine is not None:
        engine.dispose()

engine Engine(mysql+pymysql://python:***@localhost:3306/python_db?charset=utf8mb4)
<class 'sqlalchemy.engine.base.Engine'> Engine(mysql+pymysql://python:***@localhost:3306/python_db?charset=utf8mb4)
<class 'sqlalchemy.engine.base.Connection'> <sqlalchemy.engine.base.Connection object at 0x00000237F11CF750>


### 복사한 DataFrame을 Table로 저장
* 컬럼명을 영문으로 변경
* 인덱스를 1부터 시작하도록 변경하고 DataFrame 객체의 인덱스가 테이블의 PK(primary key)가 되도록 설정
* 컬럼의 데이터 타입을 변경 (발매일을 DATE 타입으로 변경)

In [26]:
# 기존의 DataFrame의 복사본을 만들기 
table_df = song_df.copy()
table_df.head(3)

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,404 (New Era),KiiiKiii (키키),Delulu Pack,2026.01.26,댄스,https://www.melon.com/song/detail.htm?songId=6...,24133,404 Not Found in the system404 The new era era...
1,Good Goodbye,화사 (HWASA),Good Goodbye,2025.10.15,발라드,https://www.melon.com/song/detail.htm?songId=6...,109857,나를 그냥 짓밟고 가괜찮아 돌아보지 마내가 아파봤자 너만 하겠니이젠 너를 헤아려봐날...
2,BANG BANG,IVE (아이브),REVIVE+,2026.02.09,댄스,https://www.melon.com/song/detail.htm?songId=6...,15882,It’s a new scene It’s aggressive이미 알아차렸겠지그치 언니...


In [27]:
table_df.columns = ['title','singer','album','release_date','genre','url','likes','lyric']
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
0,404 (New Era),KiiiKiii (키키),Delulu Pack,2026.01.26,댄스,https://www.melon.com/song/detail.htm?songId=6...,24133,404 Not Found in the system404 The new era era...
1,Good Goodbye,화사 (HWASA),Good Goodbye,2025.10.15,발라드,https://www.melon.com/song/detail.htm?songId=6...,109857,나를 그냥 짓밟고 가괜찮아 돌아보지 마내가 아파봤자 너만 하겠니이젠 너를 헤아려봐날...


In [28]:
#index 값의 1 부터 시작하도록 설정
import numpy as np

#index 변경
table_df.index = np.arange(1, len(table_df)+1)
table_df.index

Index([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,  14,
        15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,  27,  28,
        29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,  40,  41,  42,
        43,  44,  45,  46,  47,  48,  49,  50,  51,  52,  53,  54,  55,  56,
        57,  58,  59,  60,  61,  62,  63,  64,  65,  66,  67,  68,  69,  70,
        71,  72,  73,  74,  75,  76,  77,  78,  79,  80,  81,  82,  83,  84,
        85,  86,  87,  88,  89,  90,  91,  92,  93,  94,  95,  96,  97,  98,
        99, 100],
      dtype='int64')

In [29]:
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
1,404 (New Era),KiiiKiii (키키),Delulu Pack,2026.01.26,댄스,https://www.melon.com/song/detail.htm?songId=6...,24133,404 Not Found in the system404 The new era era...
2,Good Goodbye,화사 (HWASA),Good Goodbye,2025.10.15,발라드,https://www.melon.com/song/detail.htm?songId=6...,109857,나를 그냥 짓밟고 가괜찮아 돌아보지 마내가 아파봤자 너만 하겠니이젠 너를 헤아려봐날...


In [30]:
# url 컬럼 삭제하기 axis=1은 column, axis=0 은 Row
table_df.drop('url', axis=1, inplace=True)

In [31]:
table_df.columns

Index(['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric'], dtype='object')

#### DataFrame 객체 ==> Table 로 변환
* ['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric']
* table_df(DataFrame객체)를 songs100 테이블로 저장하기 to_sql() 함수 사용


In [32]:
import pymysql
import sqlalchemy

pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

engine = None
conn = None
try:
    engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')
    conn = engine.connect()    

    table_df.to_sql(name='songs100', con=engine, if_exists='replace', index=True,\
                    index_label='id',
                    dtype={
                        'id':sqlalchemy.types.INTEGER(),
                        'title':sqlalchemy.types.VARCHAR(200),
                        'singer':sqlalchemy.types.VARCHAR(200),
                        'album':sqlalchemy.types.VARCHAR(200),
                        'release_date':sqlalchemy.types.DATE,
                        'genre':sqlalchemy.types.VARCHAR(200),
                        'likes':sqlalchemy.types.BigInteger,
                        'lyric':sqlalchemy.types.VARCHAR(5000)
                    })
    print('songs100 테이블 생성됨')
finally:
    if conn is not None: 
        conn.close()
    if engine is not None:
        engine.dispose()

songs100 테이블 생성됨


#### SQL 쿼리 결과를 DataFrame 객체로 저장하는 함수선언하기
* read_sql_query() sql문을 실행한 결과를 DataFrame 객체로 반환해주는 함수

In [33]:
def search_album(keyword):
    sql = """select * from songs100 where album like %s;"""

    import pandas as pd
    import pymysql
    import sqlalchemy

    pymysql.install_as_MySQLdb()
    from sqlalchemy import create_engine
    
    engine = None
    conn = None
    try:
        engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')
        conn = engine.connect()

        album_df = pd.read_sql_query(sql, con=conn, params=('%' + keyword + '%',))
        print(album_df.shape)
        return album_df
    finally:
        print('finally')
        if conn is not None: 
            conn.close()
        if engine is not None:
            engine.dispose()

In [34]:
search_album('OST')

(5, 8)
finally


Unnamed: 0,id,title,singer,album,release_date,genre,likes,lyric
0,22,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014-02-12,"발라드, 국내드라마",318138,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
1,39,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021-10-11,"발라드, 국내드라마",236189,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
2,40,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018-03-20,"발라드, 국내드라마",438483,네가 없이 웃을 수 있을까생각만 해도 눈물이 나힘든 시간 날 지켜준 사람이제는 내가...
3,45,소나기,이클립스 (ECLIPSE),선재 업고 튀어 OST Part 1,2024-04-08,"발라드, 국내드라마",192434,그치지 않기를 바랬죠처음 그대 내게로 오던 그날에잠시 동안 적시는그런 비가 아니길간...
4,63,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022-02-18,"발라드, 국내드라마",233863,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...


In [36]:
import pandas as pd
import pymysql
from sqlalchemy import create_engine

# 1. DB 연결 설정
pymysql.install_as_MySQLdb()

def get_trend_analysis_to_markdown(filename="melon_history_report.md"):
    engine = None
    conn = None
    
    # 기준 날짜 설정: 데이터가 2025년 초반에 몰려있으므로, 
    # 2024년 1월 1일 이후 데이터를 가져오도록 설정 (혹은 원하는 날짜로 변경 가능)
    base_date = '2024-01-01'
    
    try:
        engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')
        conn = engine.connect()

        # 쿼리: 기준일 이후 곡들을 좋아요 순으로 정렬
        sql = """
        SELECT release_date, title, singer, album, genre, likes 
        FROM songs100 
        WHERE release_date >= %s 
        ORDER BY release_date DESC, likes DESC;
        """
        
        df = pd.read_sql_query(sql, con=conn, params=(base_date,))
        
        if df.empty:
            print(f"⚠️ {base_date} 이후로 등록된 노래 데이터가 없습니다.")
            return None

        # 2. Markdown 파일 작성
        file_path = 'data/' + filename
        with open(file_path, "w", encoding="utf-8") as f:
            f.write(f"# 🎵 멜론 차트 발매 트렌드 분석\n\n")
            f.write(f"> **조회 범위:** {base_date} ~ 현재 데이터 시점까지\n\n")
            f.write(f"해당 기간 내 총 **{len(df)}**개의 곡이 발견되었습니다.\n\n")
            
            # 데이터 요약 (장르별 분포 등 추가하면 더 좋음)
            f.write("### 📊 장르별 곡 수 요약\n")
            genre_counts = df['genre'].value_counts().to_frame().reset_index()
            genre_counts.columns = ['장르', '곡 수']
            f.write(genre_counts.to_markdown(index=False) + "\n\n")
            
            f.write("--- \n\n")
            f.write("### 📝 상세 곡 목록 (최신순)\n")
            f.write(df.to_markdown(index=False))
            
        print(f"✅ 분석 결과가 '{filename}' 파일로 저장되었습니다.")
        return df

    except Exception as e:
        print(f"❌ 오류 발생: {e}")
    finally:
        if conn is not None: 
            conn.close()
        if engine is not None:
            engine.dispose()

# 실행
if __name__ == "__main__":
    # tabulate 패키지가 필요합니다: pip install tabulate
    get_trend_analysis_to_markdown("melon_data_report.md")

✅ 분석 결과가 'melon_data_report.md' 파일로 저장되었습니다.
