### BeautifulSoup 
* select() 함수 사용
* melon 100 chart 데이터 파싱

In [1]:
import re
import requests
from bs4 import BeautifulSoup
from pprint import pprint   # 정돈된 print

url = 'https://www.melon.com/chart/index.htm'

# 필수!
headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}

# 요청
res = requests.get(url, headers=headers)
if res.ok:
    soup = BeautifulSoup(res.text, 'html.parser')
    #pprint(soup)
    print(len(soup.select("a[href*='playSong']")))    # a tag -> href 키워드 포함 개수 확인
    atag_list = soup.select("a[href*='playSong']")
    

    
    song_list = [] # 100곡의 song list # [{}, {}] 형식으로 저장장
    for idx, atag in enumerate(atag_list, 1):   # enumerate : index를 발생시키는 함수, idx 1부터 시작하도록록
        print(f'순서 - {idx}')
        
        # song_dict는 1곡의 song 정보를 저장할 dict
        song_dict = {}
        
        # song의 제목 추출하기
        title = atag.text
        song_dict['title'] = title  #song_dict에 title 넣기. #print(song_dict)

        # song id 추출하기
        href = atag['href'] # href에 있는 곡 번호 가져와야해서, ex 38589554
        
        matched = re.search(r'(\d+)\)', href)   # 정규표현식 사용, ex 38589554) 가져옴옴
        #print(matched)
        if matched:
            #print(matched.group(1)) print(matched.group(0))
            song_id = matched.group(1)  # group(0) : 38589554) // group(1) : 38589554
        song_dict['id'] = song_id   #print(song_dict)
        
        # 노래 상세정보 url 
        song_url = f'https://www.melon.com/song/detail.htm?songId={song_id}'
        print(song_url)
        song_dict['url'] = song_url

        song_list.append(song_dict)
    pprint(len(song_list))
    pprint(song_list[:3])
else:
    print(f"Error Code : {res.status_code}")





100
순서 - 1
https://www.melon.com/song/detail.htm?songId=38589554
순서 - 2
https://www.melon.com/song/detail.htm?songId=38429074
순서 - 3
https://www.melon.com/song/detail.htm?songId=38629386
순서 - 4
https://www.melon.com/song/detail.htm?songId=36397952
순서 - 5
https://www.melon.com/song/detail.htm?songId=38242510
순서 - 6
https://www.melon.com/song/detail.htm?songId=38123338
순서 - 7
https://www.melon.com/song/detail.htm?songId=38444825
순서 - 8
https://www.melon.com/song/detail.htm?songId=38123332
순서 - 9
https://www.melon.com/song/detail.htm?songId=38426197
순서 - 10
https://www.melon.com/song/detail.htm?songId=38120327
순서 - 11
https://www.melon.com/song/detail.htm?songId=38660167
순서 - 12
https://www.melon.com/song/detail.htm?songId=37323944
순서 - 13
https://www.melon.com/song/detail.htm?songId=38516958
순서 - 14
https://www.melon.com/song/detail.htm?songId=38635449
순서 - 15
https://www.melon.com/song/detail.htm?songId=38560939
순서 - 16
https://www.melon.com/song/detail.htm?songId=38300904
순서 - 17
https

### 곡상세 정보 추출하기

In [2]:
import re
import requests
from bs4 import BeautifulSoup

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}

# Song 100곡의 상세정보 목록을 저장할 list 선언
song_lyric_list = list()    # [] 가능
print('===> 100곡 노래 파싱 시작')

for idx, song in enumerate(song_list, 1):
    print(f'==> {idx} {song['title']}')
    #print(idx, song)

    # Song 1곡의 상세정보를 저장한 dict 선언
    song_lyric_dict = dict()
    
    # song에서 url 빼옴
    res = requests.get(song['url'], headers=headers)
    if res.ok:
        soup = BeautifulSoup(res.text, 'html.parser')
        
        # 노래제목, 노래명은 song에 이미 있어서 가져온다
        song_lyric_dict['곡명'] = song['title']
        #print(song_lyric_dict)

        # 가수
        singer_span = soup.select_one("a[href*='goArtistDetail'] span")
        song_lyric_dict['가수'] = singer_span.text
        
        # 앨범명, 발매일, 장르 - div.meta dd tag에 있음
        song_dd = soup.select('div.meta dd')    #song_dd는 ResultSet타입, song_dd[0]는 Tag 타입
        #print(song_dd)
        
        if song_dd:
            song_lyric_dict['앨범'] = song_dd[0].text
            song_lyric_dict['발매일'] = song_dd[1].text
            song_lyric_dict['장르'] = song_dd[2].text


        # Song 상세정보 링크
        song_lyric_dict['detail_url'] = song['url']
        
        # 좋아요 건수
        song_id = song['id']
        # 좋아요 건수 url
        ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'

        res = requests.get(ajax_url, headers=headers)
        if res.ok:
            # 좋아요 건수만 출력
            #print(res.json()['contsLike'][0]['SUMMCNT'])
            song_lyric_dict['좋아요'] = res.json()['contsLike'][0]['SUMMCNT']


        # Song 가사
        lyric_div = soup.select('div#d_video_summary')
        if lyric_div:
            lyric = lyric_div[0].text   # [0]하는 이유? select 명령어로 인해 -> resultSet이라서
        else:
            lyric = ''

        # \n\r\t 특수문자를 찾는 Pattern객체 생성
        pattern = re.compile(r'[\n\r\t]')
        #print(type(regex), regex)  # re.Pattern 타입, re.compile('[\\n\\r\\t]' 형태
        song_lyric_dict['가사'] = pattern.sub('', lyric)

        # list에 상세정보 담은 dict를 저장
        song_lyric_list.append(song_lyric_dict)

        #print(song_lyric_dict)
    else:
        print(f'Error Code : {res.status_code}')
    
print(len(song_lyric_list))
pprint(song_lyric_list[:2])
print('===> 100곡 노래 파싱 끝')


===> 100곡 노래 파싱 시작
==> 1 TOO BAD (feat. Anderson .Paak)
==> 2 모르시나요(PROD.로코베리)
==> 3 like JENNIE
==> 4 Drowning
==> 5 HOME SWEET HOME (feat. 태양, 대성)
==> 6 나는 반딧불
==> 7 REBEL HEART
==> 8 Whiplash
==> 9 오늘만 I LOVE YOU
==> 10 APT.
==> 11 HOT
==> 12 HAPPY
==> 13 ATTITUDE
==> 14 Flower
==> 15 I DO ME
==> 16 toxic till the end
==> 17 내게 사랑이 뭐냐고 물어본다면
==> 18 PO￦ER
==> 19 미치게 그리워서
==> 20 TAKE ME
==> 21 소나기
==> 22 한 페이지가 될 수 있게
==> 23 Welcome to the Show
==> 24 사랑은 늘 도망가
==> 25 천상연
==> 26 Supernova
==> 27 Dash
==> 28 청춘만화
==> 29 Die With A Smile
==> 30 예뻤어
==> 31 DRIP
==> 32 어떻게 이별까지 사랑하겠어, 널 사랑하는 거지
==> 33 슬픈 초대장
==> 34 우리들의 블루스
==> 35 MY LOVE(2025)
==> 36 Love wins all
==> 37 UP (KARINA Solo)
==> 38 온기
==> 39 RIZZ
==> 40 청혼하지 않을 이유를 못 찾았어
==> 41 The Chase
==> 42 내 이름 맑음
==> 43 모래 알갱이
==> 44 Island
==> 45 그대만 있다면 (여름날 우리 X 너드커넥션 (Nerd Connection))
==> 46 Home
==> 47 사랑인가 봐
==> 48 Chroma Drift
==> 49 이제 나만 믿어요
==> 50 다시 만날 수 있을까
==> 51 고민중독
==> 52 무제(無題) (Untitled, 2014)
==> 53 12:32 (A to T)
=

#### song_lyric_lists를 DataFrame으로 저장하기

In [3]:
# [{'가수';'BTS','앨범':''},{}]
import pandas as pd

#컬럼명을 설정하면서 empty DataFrame 객체생성
song_list_df = pd.DataFrame(columns=['곡명','가수','앨범','발매일','장르','detail_url','좋아요','가사'])
print(song_list_df)

for song_lyric in song_lyric_list: #[ {},{},{} ]
    df_new_row = pd.DataFrame.from_records([song_lyric])   # 새로운 row를 만드는 작업
    song_list_df = pd.concat([song_list_df, df_new_row])    # 만들어진 row를 기존에 누적된 row에 추가한다
    
song_list_df.tail(3)

Empty DataFrame
Columns: [곡명, 가수, 앨범, 발매일, 장르, detail_url, 좋아요, 가사]
Index: []


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,Igloo,KISS OF LIFE,Lose Yourself,2024.10.15,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,43039,"Imma back up every wordMini skirt, pretty pink..."
0,보금자리,임영웅,IM HERO,2022.05.02,성인가요/트로트,https://www.melon.com/song/detail.htm?songId=3...,54647,그대 사랑이 나였음 좋겠다아무것도 필요 없어요든든한 품에 안겨 잠들고 싶어라내 사랑...
0,number one girl,로제 (ROSÉ),number one girl,2024.11.22,발라드,https://www.melon.com/song/detail.htm?songId=3...,55096,Tell me that I’m specialTell me I look prettyT...


#### song_lyric_lists를 Json 파일로 저장
* json 파일로 저장해야 DataFrame으로 저장하기 용이함

In [4]:
import json

with open('data/songs100.json','w',encoding='utf-8') as file:
    json.dump(song_lyric_list, file)

### Json File을 DataFrame (표데이터) 객체로 저장하기

In [27]:
import pandas as pd

song_df = pd.read_json('data/songs100.json')
print(type(song_df))    # DataFrame 객체, 2줄 이상이면 dataframe이다
song_df.head(20)    # head() default value : 5

<class 'pandas.core.frame.DataFrame'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,124814,"‘G’, ‘A.P’“Let me kill ’em like I usually do, ..."
1,모르시나요(PROD.로코베리),조째즈,모르시나요,2025.01.07,발라드,https://www.melon.com/song/detail.htm?songId=3...,58760,찬바람 불어오니그대 생각에 눈물짓네인사 없이 떠나시던 날그리움만 남겨놓고그리워 글썽...
2,like JENNIE,제니 (JENNIE),Ruby,2025.03.07,댄스,https://www.melon.com/song/detail.htm?songId=3...,54887,"Come on, it’s gon be f hardSpecial edition and..."
3,Drowning,WOODZ,OO-LI,2023.04.26,록/메탈,https://www.melon.com/song/detail.htm?songId=3...,168229,미치도록 사랑했던지겹도록 다투었던네가 먼저 떠나고여긴 온종일 비가 왔어금세 턱 끝까...
4,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,206175,"You say, It’s changedShow must go on, Behave오랜..."
5,나는 반딧불,황가람,나는 반딧불,2024.10.21,발라드,https://www.melon.com/song/detail.htm?songId=3...,133796,나는 내가 빛나는 별인 줄 알았어요한 번도 의심한 적 없었죠몰랐어요 난 내가 벌레라...
6,REBEL HEART,IVE (아이브),IVE EMPATHY,2025.01.13,댄스,https://www.melon.com/song/detail.htm?songId=3...,92538,시작은 항상 다 이룬 것처럼엔딩은 마치 승리한 것처럼겁내지 않고 마음을 쏟을래 내 ...
7,Whiplash,aespa,Whiplash - The 5th Mini Album,2024.10.21,댄스,https://www.melon.com/song/detail.htm?songId=3...,128405,One look give ‘em WhiplashBeat drop with a big...
8,오늘만 I LOVE YOU,BOYNEXTDOOR,오늘만 I LOVE YOU,2025.01.06,댄스,https://www.melon.com/song/detail.htm?songId=3...,129874,그날 이후로 난 이렇게 살고더는 기타 한 번도 들지 못 하고그날 이후로 난 이렇게 ...
9,APT.,로제 (ROSÉ),APT.,2024.10.18,댄스,https://www.melon.com/song/detail.htm?songId=3...,209874,"아파트 아파트 아파트 아파트 아파트 아파트 Uh, uh huh uh huh 아파트 ..."


In [6]:
song_df.tail()

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
95,earthquake,지수 (JISOO),AMORTAGE,2025.02.14,댄스,https://www.melon.com/song/detail.htm?songId=3...,27353,It hits me like an earthquake더 빠르게 my heart ra...
96,벚꽃 엔딩,버스커 버스커,버스커 버스커 1집,2012.03.29,록/메탈,https://www.melon.com/song/detail.htm?songId=3...,317891,그대여 그대여 그대여 그대여 그대여 오늘은 우리 같이 걸어요 이 거리를 밤에 들려...
97,Igloo,KISS OF LIFE,Lose Yourself,2024.10.15,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,43039,"Imma back up every wordMini skirt, pretty pink..."
98,보금자리,임영웅,IM HERO,2022.05.02,성인가요/트로트,https://www.melon.com/song/detail.htm?songId=3...,54647,그대 사랑이 나였음 좋겠다아무것도 필요 없어요든든한 품에 안겨 잠들고 싶어라내 사랑...
99,number one girl,로제 (ROSÉ),number one girl,2024.11.22,발라드,https://www.melon.com/song/detail.htm?songId=3...,55096,Tell me that I’m specialTell me I look prettyT...


In [7]:
# 가수 별 Row Counting : 중복이 많아서서
print(type(song_df['가수']))    # Series 객체임, row 하나도 series임임
song_df['가수'].value_counts().head()

<class 'pandas.core.series.Series'>


가수
임영웅            14
G-DRAGON        6
PLAVE           5
DAY6 (데이식스)     5
aespa           4
Name: count, dtype: int64

In [8]:
# 장르 별 Row Counting
song_df['장르'].value_counts()

장르
댄스            30
발라드           27
록/메탈          17
랩/힙합           7
발라드, 국내드라마     6
발라드, 인디음악      4
R&B/Soul       3
성인가요/트로트       2
POP            1
인디음악, 록/메탈     1
포크/블루스         1
J-POP          1
Name: count, dtype: int64

In [9]:
# 특정 가수의 노래 정보 출력하기
# loc = location

#song_df['가수'] == '로제 (ROSÉ)' # 결과값 boolean

# 조건을 만족하는 특정 Row와 모든 컬럼이 출력됨
#song_df.loc[song_df['가수'] == '로제 (ROSÉ)']

# 노래 이름이랑 장르만 보고 싶으면?

# series이기 때문에 결과가 표가 아님
#song_df.loc[song_df['가수'] == '로제 (ROSÉ)', '곡명']

# 조건을 만족하는 특정 Row와 선택된 특정 Column이 출력된다
# song_df.loc[로우 ,컬럼] - 컬럼 조건은 생략 가능하다
song_df.loc[song_df['가수'] == '로제 (ROSÉ)', ['곡명', '장르']]

Unnamed: 0,곡명,장르
9,APT.,댄스
15,toxic till the end,록/메탈
99,number one girl,발라드


In [10]:
# 조건을 만족하는 특정 Row와 Slicing으로 선택된 특정 구간의 컬럼이 출력된다
# 곡명부터 장르까지 출력 / index 변경하기기
song_df.loc[song_df['가수'] == '로제 (ROSÉ)', '곡명':'장르'].reset_index(drop=True)

Unnamed: 0,곡명,가수,앨범,발매일,장르
0,APT.,로제 (ROSÉ),APT.,2024.10.18,댄스
1,toxic till the end,로제 (ROSÉ),rosie,2024.12.06,록/메탈
2,number one girl,로제 (ROSÉ),number one girl,2024.11.22,발라드


In [11]:
# unique 한 가수명을 리스트 형태로 출력하기
print(type(song_df['가수'].unique()))
print(len(song_df['가수'].unique()))
song_df['가수'].unique()

<class 'numpy.ndarray'>
55


array(['G-DRAGON', '조째즈', '제니 (JENNIE)', 'WOODZ', '황가람', 'IVE (아이브)',
       'aespa', 'BOYNEXTDOOR', '로제 (ROSÉ)', 'LE SSERAFIM (르세라핌)',
       'DAY6 (데이식스)', '오반(OVAN)', 'KiiiKiii (키키)', '로이킴',
       '이클립스 (ECLIPSE)', '임영웅', '이창섭', 'PLAVE', '이무진', 'Lady Gaga',
       'BABYMONSTER', 'AKMU (악뮤)', '순순희(지환)', '이예은', '아이유',
       'Hearts2Hearts (하츠투하츠)', 'QWER', '너드커넥션 (Nerd Connection)', '멜로망스',
       'TWS (투어스)', '성시경', '임재현', 'NewJeans', '방탄소년단', '아일릿(ILLIT)',
       '(여자)아이들', 'j-hope', '폴킴', '경서예지', '정국', '재쓰비 (JAESSBEE)', '10CM',
       '잔나비', '박재정', '프로미스나인', '범진', '이영지', '우디 (Woody)', 'Crush', '송필근',
       '김민석', '순순희', 'KISS OF LIFE', '지수 (JISOO)', '버스커 버스커'],
      dtype=object)

In [12]:
#앨범이 OST 인 노래는?
print(type(song_df['앨범'].str))    # type : StringMethods -> contains()함수를 사용하려면 type을 stringmethods로 만들어줌

song_df.loc[song_df['앨범'].str.contains('OST')]

#song_df['앨범'].str.contains('OST')    # 결과값 : boolean
#song_df['앨범'].head()
#song-df['앨범'].sample(10)

<class 'pandas.core.strings.accessor.StringMethods'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
20,소나기,이클립스 (ECLIPSE),선재 업고 튀어 OST Part 1,2024.04.08,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,177741,그치지 않기를 바랬죠처음 그대 내게로 오던 그날에잠시 동안 적시는그런 비가 아니길간...
23,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,225184,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
46,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022.02.18,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,222529,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...
54,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014.02.12,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=4...,307529,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
65,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018.03.20,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,436971,네가 없이 웃을 수 있을까생각만 해도 눈물이나힘든 시간 날 지켜준 사람이제는 내가 ...
83,미안해 미워해 사랑해,Crush,눈물의 여왕 OST Part.4,2024.03.24,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,106710,It's the same day이렇게 너를다시 불러보는 잊고 있던 마음들과이제야 내...


In [None]:
# 좋아요 건수가 가장 많은 가수는?
#song_df.loc[song_df['좋아요'] == song_df['좋아요'].max(), ['가수']]

# 평균보다 많은 좋아요 수
mean_like_value = song_df['좋아요'].mean()

# reset_index(drop=True) : index 차례대로 달아주기
#song_df.loc[song_df['좋아요'] >= mean_like_value, "곡명":"장르"].reset_index(drop=True)

# sort 내림차순순
song_df.loc[song_df['좋아요'] >= mean_like_value].sort_values(by='좋아요', ascending=False).reset_index(drop=True)


In [14]:
# 곡명 - 장르 + 좋아요 요소도 표에 보이도록 하고 싶음. (detail_url과 가사 요소를 빼고 싶음) 좋아요로 sort하려면 정렬하는 요소 중 좋아요가 있어야 함.
# detail_url, 가사를 빼는 방식으로 song_df.columns.drop(['detail_url', '가사']) 추가
song_df.loc[song_df['좋아요'] >= mean_like_value, song_df.columns.drop(['detail_url', '가사'])]\
    .sort_values(by='좋아요', ascending=False).reset_index(drop=True)

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요
0,봄날,방탄소년단,YOU NEVER WALK ALONE,2017.02.13,랩/힙합,517118
1,"어떻게 이별까지 사랑하겠어, 널 사랑하는 거지",AKMU (악뮤),항해,2019.09.25,발라드,481777
2,주저하는 연인들을 위해,잔나비,전설,2019.03.13,"인디음악, 록/메탈",438856
3,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018.03.20,"발라드, 국내드라마",436971
4,예뻤어,DAY6 (데이식스),Every DAY6 February,2017.02.06,록/메탈,366410
5,한 페이지가 될 수 있게,DAY6 (데이식스),The Book of Us : Gravity,2019.07.15,록/메탈,348605
6,벚꽃 엔딩,버스커 버스커,버스커 버스커 1집,2012.03.29,록/메탈,317891
7,"무제(無題) (Untitled, 2014)",G-DRAGON,권지용,2017.06.08,R&B/Soul,311965
8,Hype Boy,NewJeans,NewJeans 1st EP 'New Jeans',2022.08.01,댄스,308765
9,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014.02.12,"발라드, 국내드라마",307529


In [15]:
# 가장 최근에 발매된 앨범
print(song_df['발매일'].max())

song_df.loc[song_df['발매일'] == song_df['발매일'].max()]

2025.03.31


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
80,어제보다 슬픈 오늘,우디 (Woody),어제보다 슬픈 오늘,2025.03.31,발라드,https://www.melon.com/song/detail.htm?songId=3...,5904,밤새도록 내리던 소낙비가 네 모습을 지울까네가 떠난 어제보다도 난 오늘이 더 슬퍼지...


### SqlAlchemy와 Pymysql을 사용하여 DataFrame을 RDB의 테이블로 저장하기

In [16]:
!pip show pymysql

Name: PyMySQL
Version: 1.1.1
Summary: Pure Python MySQL Driver
Home-page: 
Author: 
Author-email: Inada Naoki <songofacandy@gmail.com>, Yutaka Matsubara <yutaka.matsubara@gmail.com>
License: MIT License
Location: C:\Users\yondu\anaconda3\Lib\site-packages
Requires: 
Required-by: 


### DataFrame을 Table로 저장하기

In [29]:
import pymysql

# Object : DataFrame // Object를 바로 Table로 매핑 - squlalchemy이다

#pymysql과 sqlalchemy 연동
pymysql.install_as_MySQLdb()    # 연결
from sqlalchemy import create_engine    # 07파일에서는에서는 connect를 통해 연결했는데, sqlalchemy을 통해 연결할 수 있다!

engine = None
conn = None
try:
    # dialect+driver://username:password@host:port/database # db마다 dialect+driver가 다름
    engine = create_engine('mysql+pymysql://python:python@localhost:3307/python_db?charset=utf8mb4')#, encoding='utf-8')
    print('engine', engine)
    print(type(engine), engine)
    conn = engine.connect()
    print(type(conn), conn)
    
    #song_df(DataFrame객체)를 songs 테이블로 저장하기 to_sql() 함수 사용
    song_df.to_sql(name='songs', con=engine, if_exists='replace', index=False)
finally:
    if conn is not None: 
        conn.close()
    if engine is not None:
        engine.dispose()

engine Engine(mysql+pymysql://python:***@localhost:3307/python_db?charset=utf8mb4)
<class 'sqlalchemy.engine.base.Engine'> Engine(mysql+pymysql://python:***@localhost:3307/python_db?charset=utf8mb4)
<class 'sqlalchemy.engine.base.Connection'> <sqlalchemy.engine.base.Connection object at 0x000001B6E1DCFF20>


### 복사한 DataFrame을 Table로 저장
* 컬럼명을 영문으로 변경
* 인덱스를 1부터 시작하도록 변경하고 DataFrame 객체의 인덱스가 테이블의 PK(primary key)가 되도록 설정
* 컬럼의 데이터 타입을 변경 (발매일을 DATE 타입으로 변경)

In [45]:
# 기존의 DataFrame의 복사본을 만들기
# table_df = song_df (x) -> 같은 주소를 가리킴.
table_df = song_df.copy()
table_df.head(3)

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,124814,"‘G’, ‘A.P’“Let me kill ’em like I usually do, ..."
1,모르시나요(PROD.로코베리),조째즈,모르시나요,2025.01.07,발라드,https://www.melon.com/song/detail.htm?songId=3...,58760,찬바람 불어오니그대 생각에 눈물짓네인사 없이 떠나시던 날그리움만 남겨놓고그리워 글썽...
2,like JENNIE,제니 (JENNIE),Ruby,2025.03.07,댄스,https://www.melon.com/song/detail.htm?songId=3...,54887,"Come on, it’s gon be f hardSpecial edition and..."


In [46]:
table_df.columns = ['title','singer','album','release_date','genre','url','likes','lyric']
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
0,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,124814,"‘G’, ‘A.P’“Let me kill ’em like I usually do, ..."
1,모르시나요(PROD.로코베리),조째즈,모르시나요,2025.01.07,발라드,https://www.melon.com/song/detail.htm?songId=3...,58760,찬바람 불어오니그대 생각에 눈물짓네인사 없이 떠나시던 날그리움만 남겨놓고그리워 글썽...


In [47]:
print(table_df.index)
#list(table_df.index)

RangeIndex(start=0, stop=100, step=1)


In [48]:
#index 값의 1 부터 시작하도록 설정
import numpy as np

#index 변경
table_df.index = np.arange(1, len(table_df)+1)
table_df.index

Index([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,  14,
        15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,  27,  28,
        29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,  40,  41,  42,
        43,  44,  45,  46,  47,  48,  49,  50,  51,  52,  53,  54,  55,  56,
        57,  58,  59,  60,  61,  62,  63,  64,  65,  66,  67,  68,  69,  70,
        71,  72,  73,  74,  75,  76,  77,  78,  79,  80,  81,  82,  83,  84,
        85,  86,  87,  88,  89,  90,  91,  92,  93,  94,  95,  96,  97,  98,
        99, 100],
      dtype='int32')

In [49]:
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
1,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,124814,"‘G’, ‘A.P’“Let me kill ’em like I usually do, ..."
2,모르시나요(PROD.로코베리),조째즈,모르시나요,2025.01.07,발라드,https://www.melon.com/song/detail.htm?songId=3...,58760,찬바람 불어오니그대 생각에 눈물짓네인사 없이 떠나시던 날그리움만 남겨놓고그리워 글썽...


##### inplace 속성
* default는 False
* inplace = False는 df에 반영은 하지 않고, 처리한 결과를 출력만 하기. Default value!
* inplace = True 는 df에 반영을 하고, 처리한 결과를 출력하지 않기

In [50]:
# url 컬럼 삭제하기 numpy axis=1은 column, axis=0 은 Row
# url 컬럼을 삭제해라
#table_df.drop('url', axis=1) # inplace 없이 drop하면 url은 일시적 출력임.
table_df.drop('url', axis=1,inplace=True)

In [51]:
# table_df.drop('url', axis=1)하고 실행하면 url 있음
table_df.columns

Index(['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric'], dtype='object')

#### DataFrame 객체 ==> Table 로 변환
* ['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric']
* table_df(DataFrame객체)를 songs100 테이블로 저장하기 to_sql() 함수 사용


In [52]:
import pymysql
import sqlalchemy

pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

engine = None
conn = None
try:
    engine = create_engine('mysql+pymysql://python:python@localhost:3307/python_db?charset=utf8mb4')
    conn = engine.connect()    

    table_df.to_sql(name='songs100', con=engine, if_exists='replace', index=True,\
                    index_label='id',
                    dtype={
                        'id':sqlalchemy.types.INTEGER(),
                        'title':sqlalchemy.types.VARCHAR(200),
                        'singer':sqlalchemy.types.VARCHAR(200),
                        'album':sqlalchemy.types.VARCHAR(200),
                        'release_date':sqlalchemy.types.DATE,
                        'genre':sqlalchemy.types.VARCHAR(200),
                        'likes':sqlalchemy.types.BigInteger,
                        'lyric':sqlalchemy.types.VARCHAR(5000)
                    })
    print('songs100 테이블 생성됨')
finally:
    if conn is not None: 
        conn.close()
    if engine is not None:
        engine.dispose()

songs100 테이블 생성됨


#### SQL 쿼리 결과를 DataFrame 객체로 저장하는 함수선언하기
* pandas의 read_sql_query() sql문을 실행한 결과를 DataFrame 객체로 반환해주는 함수

In [53]:
import pandas as pd
import pymysql
#import sqlalchemy
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

def search_album(keyword):
    sql = """select * from songs100 where album like %s;"""
    
    engine = None
    conn = None
    try:
        engine = create_engine('mysql+pymysql://python:python@localhost:3307/python_db?charset=utf8mb4')
        conn = engine.connect()

        album_df = pd.read_sql_query(sql, con=conn, params=('%' + keyword + '%',))  # keyword 포함하는는
        print(album_df.shape)
        return album_df
    finally:
        print('finally')
        if conn is not None: 
            conn.close()
        if engine is not None:
            engine.dispose()

In [58]:
search_album('기')

(4, 8)
finally


Unnamed: 0,id,title,singer,album,release_date,genre,likes,lyric
0,38,온기,임영웅,온기,2024-05-06,발라드,43873,아무도 모를 거야 말한 적 없을 테니아이처럼 울고 싶은 순간들어른이란 말은 참 그댈...
1,46,Home,임영웅,온기,2024-05-06,댄스,45195,쓸쓸한 거리에외로움이 더 쌓이고사람도 이 밤도사랑 찾아 헤매이네그대 마음이 허전하다...
2,73,너에게 닿기를,10CM,너에게 닿기를,2025-03-06,록/메탈,28270,따사로운 햇살 속에서종소리가 울려 퍼지네뺨을 매만지는 바람한숨만은 깊어져만 가고저 ...
3,90,살기 위해서,순순희,살기 위해서,2022-04-24,"발라드, 인디음악",29387,원합니다 내가 살기 위해서내가 이렇게도 가슴이 뛰는 건그대가 내 마음에 다녀 갔었나...


In [56]:
table_df['singer'].unique()

array(['G-DRAGON', '조째즈', '제니 (JENNIE)', 'WOODZ', '황가람', 'IVE (아이브)',
       'aespa', 'BOYNEXTDOOR', '로제 (ROSÉ)', 'LE SSERAFIM (르세라핌)',
       'DAY6 (데이식스)', '오반(OVAN)', 'KiiiKiii (키키)', '로이킴',
       '이클립스 (ECLIPSE)', '임영웅', '이창섭', 'PLAVE', '이무진', 'Lady Gaga',
       'BABYMONSTER', 'AKMU (악뮤)', '순순희(지환)', '이예은', '아이유',
       'Hearts2Hearts (하츠투하츠)', 'QWER', '너드커넥션 (Nerd Connection)', '멜로망스',
       'TWS (투어스)', '성시경', '임재현', 'NewJeans', '방탄소년단', '아일릿(ILLIT)',
       '(여자)아이들', 'j-hope', '폴킴', '경서예지', '정국', '재쓰비 (JAESSBEE)', '10CM',
       '잔나비', '박재정', '프로미스나인', '범진', '이영지', '우디 (Woody)', 'Crush', '송필근',
       '김민석', '순순희', 'KISS OF LIFE', '지수 (JISOO)', '버스커 버스커'],
      dtype=object)