### Melon 100 chart 수집/분석/저장
* 100곡 노래의 제목,번호,노래상세정보url을 List에 저장하기 (정규표현식 사용)
* 노래의 상세정보를 추출해서 자료구조에 저장하고, json 파일로 저장하기
* json 파일을 Pandas의 read_json() 이용해서 DataFrame 객체로 저장하기
* DataFrame객체를 DB의 Table로 저장하기

In [1]:
import requests
from bs4 import BeautifulSoup
import re # Regular Expression
import pandas as pd
import json

In [2]:
url = 'https://www.melon.com/chart/index.htm'
req_header = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36'
}

res = requests.get(url, headers=req_header)
print(res.status_code)
if res.ok:
    soup = BeautifulSoup(res.text, 'html.parser')
    print(len(soup.select("a[href*='playSong']")))
    print(len(soup.select("div#tb_list tr a[href*='playSong']")))
    a_tags = soup.select("a[href*='playSong']")
    
    # 100곡의 songs 정보를 저장할 List
    song_list = []
    for idx,a_tag in enumerate(a_tags,1):
        # 1곡의 song 정보를 저장할 dict
        song_dict = {}
        song_title = a_tag.text
        song_dict['song_title'] = song_title
        
        #print(idx, type(a_tag), a_tag, song_title)
        href_value = a_tag['href']
        #song id를 찾기 위한 정규표현식
        matched = re.search(r'(\d+)\);', href_value)
        if matched:
            song_id = matched.group(1)
            song_dict['song_id'] = song_id
                
            song_detail_url = f'https://www.melon.com/song/detail.htm?songId={song_id}'
            song_dict['song_url'] = song_detail_url
        song_list.append(song_dict)

print(len(song_list))
print(song_list[0:3])

200
100
100
100
[{'song_title': 'GANADARA (Feat. 아이유)', 'song_id': '34752700', 'song_url': 'https://www.melon.com/song/detail.htm?songId=34752700'}, {'song_title': 'INVU', 'song_id': '34626109', 'song_url': 'https://www.melon.com/song/detail.htm?songId=34626109'}, {'song_title': '사랑은 늘 도망가', 'song_id': '34061322', 'song_url': 'https://www.melon.com/song/detail.htm?songId=34061322'}]


#### 100개의 노래 상세정보 추출하기

In [3]:
import requests
from bs4 import BeautifulSoup
import re # Regular Expression
import pandas as pd
import json

req_header = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36'
}

song_detail_list = []
for idx,song in enumerate(song_list,1):
    song_detail_dict = {}
    
    song_detail_url = song['song_url']
    res = requests.get(song_detail_url, headers=req_header)
    if res.ok:
        soup = BeautifulSoup(res.text, 'html.parser')
        #곡명
        song_detail_dict['곡명'] = song['song_title']
        
        print(idx , song['song_title'])
        
        #가수이름
        singer_span = soup.select("a[href*='goArtistDetail'] span")
        if singer_span:            
            song_detail_dict['가수'] = singer_span[0].text
        
        #앨범,발매일,장르
        song_dd = soup.select('div.meta dd')    
        if song_dd:
            song_detail_dict['앨범'] = song_dd[0].text
            song_detail_dict['발매일'] = song_dd[1].text
            song_detail_dict['장르'] = song_dd[2].text
        
        #좋아요 건수
        song_id = song['song_id']
        ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'    
        res = requests.get(ajax_url, headers=req_header)
        if res.ok:
            song_detail_dict['좋아요'] = res.json()['contsLike'][0]['SUMMCNT']
            
        #상세정보URL
        song_detail_dict['url'] = song['song_url']
        
        #가사
        lyric_div = soup.select('div#d_video_summary')
        if lyric_div:
            lyric_temp = lyric_div[0].text
            # \n\r\t 특수문자를 찾아주는 Pattern 객체생성
            pattern = re.compile(r'[\r\n\t]')
            # 특수문자를 ''(empty string) 으로 대체(substitute)해라
            lyric = pattern.sub('', lyric_temp.strip())                        
        else: #가사가 없는 경우
            lyric = ''
        
        song_detail_dict['가사'] = lyric
        
        #song_detail_dict를 song_detail_list에 추가
        song_detail_list.append(song_detail_dict)

print(len(song_detail_list))        
song_detail_list[0:2]        

1 GANADARA (Feat. 아이유)
2 INVU
3 사랑은 늘 도망가
4 듣고 싶을까
5 취중고백
6 사랑인가 봐
7 RUN2U
8 TOMBOY
9 abcdefu
10 언제나 사랑해
11 ELEVEN
12 SMILEY (Feat. BIBI)
13 너, 너 (N번째 연애 X 휘인 (Whee In))
14 Step Back
15 회전목마 (Feat. Zion.T, 원슈타인) (Prod. Slom)
16 다정히 내 이름을 부르면
17 이제 나만 믿어요
18 신호등
19 어제처럼
20 리무진 (Feat. MINO) (Prod. GRAY)
21 STAY
22 호랑수월가
23 다시 사랑한다면 (김필 Ver.)
24 눈이 오잖아(Feat.헤이즈)
25 그대라는 사치
26 Next Level
27 별빛 같은 나의 사랑아
28 Counting Stars (Feat. Beenzino)
29 strawberry moon
30 잊었니
31 HERO
32 Dreams Come True
33 드라마
34 끝사랑
35 Weekend
36 존재만으로
37 Butter
38 Dynamite
39 Savage
40 너를 생각해
41 내 생에 아름다운
42 Bk Love
43 Permission to Dance
44 바라만 본다
45 노래 (The Song)
46 Can't Control Myself
47 겨울잠
48 만남은 쉽고 이별은 어려워 (Feat. Leellamarz) (Prod. TOIL)
49 라일락
50 OHAYO MY NIGHT
51 잊을 수 있을까
52 Celebrity
53 서랍
54 봄날
55 My Universe
56 찰나가 영원이 될 때 (The Eternal Moment)
57 사이렌 Remix (Feat. UNEDUCATED KID, Paul Blanco)
58 Christmas Tree
59 우리가 헤어져야 했던 이유
60 문득
61 Blueming
62 Bad Habits
63 너의 모든 순간
64 헤픈 우연
65 내 손을 잡아
66 낙하 (with 아이유

[{'곡명': 'GANADARA (Feat. 아이유)',
  '가수': '박재범',
  '앨범': 'GANADARA',
  '발매일': '2022.03.11',
  '장르': 'R&B/Soul',
  '좋아요': 45545,
  'url': 'https://www.melon.com/song/detail.htm?songId=34752700',
  '가사': '길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번역기도 전혀 도움 안 돼네 맘엔 어떨까 걱정만어떤 단어를 쓸지 I don’t know어떤 말을 할지 I don’t know나는 왜 이런지 I don’t knowYou’re on my mind어떤 단어를 쓸지 I don’t know어떤 말을 할지 I don’t know나는 왜 이런지 I don’t knowYou’re on my mindBaby 정말 생각 안 나Body language로 자신 있어보여줄게girl just give me some your time너를 보면 손에 땀 나긴장 풀게 한 번 웃어줘Let me take u on a magic carpet ride손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤가나다라마바사손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤가나다라마바사너무 완벽하지 않아도걱정 마 네 맘을 조금 알 것 같아네게 좀 더 다가서 볼까고민해 매일 밤길거리를 걷다 보면계속 계속 네 생각이 나이런 내 모습이 왜 낯설까번역기 위에서헤매는 네 손가락까지자꾸만 생각이 나는 걸Body language도 나는 괜찮아But 생각 안 나면 그냥 웃어줘모든 것을 알려줄게 오늘 밤내가 나쁜 남자처럼 보여도너를 볼 때면 맘이 여려져I wouldn’t mind if I died in your arms손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤가나다라마바사손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤가나다라마바사손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤가나다라마바사손을 잡아 따라와맑은 날씨 보름달가르쳐줘 오늘 밤

In [4]:
import json

with open('data/songs.json','w', encoding='utf-8') as file:
    json.dump(song_detail_list, file)

In [5]:
#song_detail_list 를 읽어서 DataFrame 객체 생성하는 방법
# [{},{},{}] {} => Series 객체, [] => DataFrame 객첸

import pandas as pd

song_list_df = pd.DataFrame(columns=['곡명','가수','앨범','발매일','장르','좋아요','url','가사'])

for song_detail in song_detail_list:
    # dict <=> Series
    series_obj = pd.Series(song_detail)
    # Series 객체를 append 
    song_list_df = song_list_df.append(series_obj, ignore_index=True)
    
song_list_df.head(3)    

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
0,GANADARA (Feat. 아이유),박재범,GANADARA,2022.03.11,R&B/Soul,45545,https://www.melon.com/song/detail.htm?songId=3...,길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번...
1,INVU,태연 (TAEYEON),INVU - The 3rd Album,2022.02.14,댄스,81626,https://www.melon.com/song/detail.htm?songId=3...,Falling in love너에겐 난 Option시작부터 다른 너와 나깨지는 Hea...
2,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",138022,https://www.melon.com/song/detail.htm?songId=3...,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...


#### json file을 DataFrame 객체로 저장하기

In [6]:
import pandas as pd

song_df = pd.read_json('data/songs.json')
print(type(song_df))
song_df.head()

<class 'pandas.core.frame.DataFrame'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
0,GANADARA (Feat. 아이유),박재범,GANADARA,2022.03.11,R&B/Soul,45545,https://www.melon.com/song/detail.htm?songId=3...,길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번...
1,INVU,태연 (TAEYEON),INVU - The 3rd Album,2022.02.14,댄스,81626,https://www.melon.com/song/detail.htm?songId=3...,Falling in love너에겐 난 Option시작부터 다른 너와 나깨지는 Hea...
2,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",138022,https://www.melon.com/song/detail.htm?songId=3...,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
3,듣고 싶을까,MSG워너비(M.O.M),듣고 싶을까,2022.02.26,발라드,34781,https://www.melon.com/song/detail.htm?songId=3...,우리 함께 듣던 그 노랠 듣고 싶을까듣고 나서 잠시 날 생각은 할까아주 혹시라도 넌...
4,취중고백,김민석 (멜로망스),취중고백,2021.12.19,발라드,89918,https://www.melon.com/song/detail.htm?songId=3...,뭐하고 있었니 늦었지만잠시 나올래너의 집 골목에 있는놀이터에 앉아 있어친구들 만나서...


In [7]:
song_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 8 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   곡명      100 non-null    object
 1   가수      100 non-null    object
 2   앨범      100 non-null    object
 3   발매일     100 non-null    object
 4   장르      100 non-null    object
 5   좋아요     100 non-null    int64 
 6   url     100 non-null    object
 7   가사      100 non-null    object
dtypes: int64(1), object(7)
memory usage: 6.4+ KB


In [8]:
song_df['가수'].value_counts().head(10)

임영웅                    10
아이유                     7
방탄소년단                   5
BE'O (비오)               4
태연 (TAEYEON)            4
멜로망스                    3
aespa                   3
먼데이 키즈 (Monday Kiz)     2
이무진                     2
MSG워너비(M.O.M)           2
Name: 가수, dtype: int64

In [9]:
song_df['장르'].value_counts()

발라드               28
댄스                18
랩/힙합              15
발라드, 국내드라마        10
POP                7
성인가요/트로트           7
록/메탈               5
R&B/Soul, 인디음악     3
R&B/Soul           3
록/메탈, 국내드라마        2
발라드, 인디음악          1
랩/힙합, 국내드라마        1
Name: 장르, dtype: int64

In [10]:
song_df['가수'].unique()

array(['박재범', '태연 (TAEYEON)', '임영웅', 'MSG워너비(M.O.M)', '김민석 (멜로망스)',
       '멜로망스', 'STAYC(스테이씨)', '(여자)아이들', 'GAYLE', '케이시 (Kassy)',
       'IVE (아이브)', 'YENA (최예나)', '휘인 (Whee In)', 'GOT the beat',
       'sokodomo', '경서예지', '이무진', '폴킴', "BE'O (비오)", 'The Kid LAROI',
       '탑현', 'aespa', '아이유', '원슈타인', '방탄소년단', '주시크 (Joosiq)', '이예준',
       '비투비', '베이식 (Basick)', '디핵 (D-Hack)', '노을', '10CM', 'Coldplay',
       '마크툽 (MAKTUB)', '호미들', 'V', '비비 (BIBI)', 'Ed Sheeran', '성시경',
       '헤이즈 (Heize)', 'AKMU (악뮤)', '경서', '한동근', 'Justin Bieber', '이승윤',
       '브레이브걸스', '먼데이 키즈 (Monday Kiz)', '에픽하이 (EPIK HIGH)', '정동하',
       '오마이걸 (OH MY GIRL)', 'Kelly Clarkson', '박봄 (Park Bom)', '적재',
       '태일 (TAEIL)', '송이한', 'Mudd the student', '산들', '개코',
       '창모 (CHANGMO)', '아넌딜라이트(Anandelight)', 'Jawsh 685', '김태리'],
      dtype=object)

In [11]:
#방탄소년단 노래만 선택
song_df.loc[song_df['가수'] == '방탄소년단','곡명':'좋아요']

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요
36,Butter,방탄소년단,Butter,2021.05.21,댄스,265569
37,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24,댄스,429907
42,Permission to Dance,방탄소년단,Butter / Permission to Dance,2021.07.09,댄스,197753
53,봄날,방탄소년단,YOU NEVER WALK ALONE,2017.02.13,랩/힙합,555625
78,작은 것들을 위한 시 (Boy With Luv) (Feat. Halsey),방탄소년단,MAP OF THE SOUL : PERSONA,2019.04.12,댄스,432445


In [12]:
#장르가 발라드 인 노래 선택
song_df.loc[song_df['장르'] == '발라드'].head()

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
3,듣고 싶을까,MSG워너비(M.O.M),듣고 싶을까,2022.02.26,발라드,34781,https://www.melon.com/song/detail.htm?songId=3...,우리 함께 듣던 그 노랠 듣고 싶을까듣고 나서 잠시 날 생각은 할까아주 혹시라도 넌...
4,취중고백,김민석 (멜로망스),취중고백,2021.12.19,발라드,89918,https://www.melon.com/song/detail.htm?songId=3...,뭐하고 있었니 늦었지만잠시 나올래너의 집 골목에 있는놀이터에 앉아 있어친구들 만나서...
9,언제나 사랑해,케이시 (Kassy),조영수 리메이크 프로젝트 Part.2,2022.02.07,발라드,32855,https://www.melon.com/song/detail.htm?songId=3...,둘이 손잡고 걸을 때마주 보며 또 웃을 때사랑한다 말하지 않아도 알아널 만나러 가는...
12,"너, 너 (N번째 연애 X 휘인 (Whee In))",휘인 (Whee In),"너, 너 (N번째 연애 X 휘인 (Whee In))",2022.02.13,발라드,25740,https://www.melon.com/song/detail.htm?songId=3...,하루 종일 집에 누워서전화기만 보고 있잖아내 머릿속은네 생각들로만 짜여져 있어날 찾...
15,다정히 내 이름을 부르면,경서예지,다정히 내 이름을 부르면 (경서예지 x 전건호),2021.05.19,발라드,117034,https://www.melon.com/song/detail.htm?songId=3...,끝없이 별빛이 내리던 밤기분 좋은 바람이두 빰을 스치고새벽 바다 한곳을 보는아름다운...


In [13]:
#최근 발매일 순서대로
song_df.sort_values(by='발매일',ascending=False).head(10)

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
7,TOMBOY,(여자)아이들,I NEVER DIE,2022.03.14,록/메탈,21096,https://www.melon.com/song/detail.htm?songId=3...,Look at you 넌 못 감당해 날Ya took off hook기분은 Coke ...
95,이렇게 둘이,창모 (CHANGMO),이렇게 둘이,2022.03.14,랩/힙합,6538,https://www.melon.com/song/detail.htm?songId=3...,이렇게 둘이이틀 더 안을 수 있다면정말 좋았을 텐데인생은 그리 안 돌아가 ah난 바...
72,Thank You,브레이브걸스,THANK YOU,2022.03.14,댄스,5948,https://www.melon.com/song/detail.htm?songId=3...,그대란 존재가 내겐 너무 큰 선물Oh I feel your love baby 받아줘...
99,With,김태리,스물다섯 스물하나 OST Part 7,2022.03.13,"록/메탈, 국내드라마",13863,https://www.melon.com/song/detail.htm?songId=3...,언제부터 그랬던 건가요상처투성이의 옷을 입고여린 어깨 위로 힘겨울 만큼큼지막한 짐을...
69,사랑인걸,한동근,사랑인걸,2022.03.13,발라드,4147,https://www.melon.com/song/detail.htm?songId=3...,하루가 가는 소릴 들어너 없는 세상 속에달이 저물고 해가 뜨는 서러움한날도 한시도 ...
84,꽃 (With 김민석 of 멜로망스),박봄 (Park Bom),꽃,2022.03.11,발라드,7142,https://www.melon.com/song/detail.htm?songId=3...,숨을 쉬는 너무나도당연한 것들 마저도 힘이 들고잠이 드는 하루에 끝이 오는그 순간마...
0,GANADARA (Feat. 아이유),박재범,GANADARA,2022.03.11,R&B/Soul,45545,https://www.melon.com/song/detail.htm?songId=3...,길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번...
40,내 생에 아름다운,이예준,내 생에 아름다운,2022.03.06,발라드,10672,https://www.melon.com/song/detail.htm?songId=3...,Don't walk away I'm falling downDon't walk awa...
85,"손을 잡는다거나, 같이 걷는다거나",적재,Trip:Tape #01,2022.02.27,발라드,13467,https://www.melon.com/song/detail.htm?songId=3...,하고 싶은 말을 하나씩써 내려가다가문득 보고 싶은 맘이창밖에 막 차오를 때너의 밤이...
18,어제처럼,폴킴,어제처럼,2022.02.27,발라드,20026,https://www.melon.com/song/detail.htm?songId=3...,Trust the warmth insideCan you feel my love al...


In [14]:
#앨범이 OST 인 노래는?
print(type(song_df['앨범']))
print(type(song_df['앨범'].str))
#print(song_df['앨범'].str.contains('OST'))
song_df.loc[song_df['앨범'].str.contains('OST')]

<class 'pandas.core.series.Series'>
<class 'pandas.core.strings.accessor.StringMethods'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
2,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",138022,https://www.melon.com/song/detail.htm?songId=3...,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
5,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022.02.18,"발라드, 국내드라마",22295,https://www.melon.com/song/detail.htm?songId=3...,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...
35,존재만으로,원슈타인,스물다섯 스물하나 OST Part 4,2022.02.26,"랩/힙합, 국내드라마",21361,https://www.melon.com/song/detail.htm?songId=3...,Miss you한동안 난 멍하니 지내시간은 바쁜 듯이 흘러바람이 매몰차게 스쳐 가네...
52,서랍,10CM,그 해 우리는 OST Part.1,2021.12.07,"발라드, 국내드라마",48126,https://www.melon.com/song/detail.htm?songId=3...,어린 햇살 아래서뛰어놀곤 했었던가쁜 숨결굽이진 골목 지나길을 따라가보면같은 기억어른...
57,Christmas Tree,V,그 해 우리는 OST Part.5,2021.12.24,"발라드, 국내드라마",84661,https://www.melon.com/song/detail.htm?songId=3...,In this momentI see youIt always comes aroundA...
58,우리가 헤어져야 했던 이유,비비 (BIBI),그 해 우리는 OST Part.2,2021.12.13,"발라드, 국내드라마",50910,https://www.melon.com/song/detail.htm?songId=3...,Maybe If IWoke up in the morningHearing your v...
62,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014.02.12,"발라드, 국내드라마",195551,https://www.melon.com/song/detail.htm?songId=4...,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
64,내 손을 잡아,아이유,최고의 사랑 OST Part.4,2011.05.25,"발라드, 국내드라마",183141,https://www.melon.com/song/detail.htm?songId=3...,느낌이 오잖아 떨리고 있잖아언제까지 눈치만 볼 거니네 맘을 말해봐 딴청 피우지 말란...
66,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018.03.20,"발라드, 국내드라마",388092,https://www.melon.com/song/detail.htm?songId=3...,네가 없이 웃을 수 있을까생각만 해도 눈물이나힘든 시간 날 지켜준 사람이제는 내가 ...
71,언덕나무,이승윤,그 해 우리는 OST Part.7,2022.01.04,"발라드, 국내드라마",45757,https://www.melon.com/song/detail.htm?songId=3...,높은 언덕 나무처럼너의 기억은 내게쉬었다가는 편한 그늘이었어어느덧 내가어른이 다 되...


In [15]:
#좋아요 건수가 평균보다 높은 노래의 곡명,가수,좋아요 열을 선택하고 좋아요건수가 높은 순서대로 정렬하고 인덱스는 reset 하기
print(song_df['좋아요'].max())
print(song_df['좋아요'].std())
like_mean_value = song_df['좋아요'].mean()
song_df.loc[song_df['좋아요'] > like_mean_value,['곡명','가수','좋아요','url']].sort_values(by='좋아요',ascending=False).reset_index(drop=True)

555625
107415.72602836095


Unnamed: 0,곡명,가수,좋아요,url
0,봄날,방탄소년단,555625,https://www.melon.com/song/detail.htm?songId=3...
1,작은 것들을 위한 시 (Boy With Luv) (Feat. Halsey),방탄소년단,432445,https://www.melon.com/song/detail.htm?songId=3...
2,Dynamite,방탄소년단,429907,https://www.melon.com/song/detail.htm?songId=3...
3,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,388092,https://www.melon.com/song/detail.htm?songId=3...
4,"어떻게 이별까지 사랑하겠어, 널 사랑하는 거지",AKMU (악뮤),376213,https://www.melon.com/song/detail.htm?songId=3...
5,Blueming,아이유,330964,https://www.melon.com/song/detail.htm?songId=3...
6,Celebrity,아이유,314577,https://www.melon.com/song/detail.htm?songId=3...
7,롤린 (Rollin'),브레이브걸스,291546,https://www.melon.com/song/detail.htm?songId=3...
8,Butter,방탄소년단,265569,https://www.melon.com/song/detail.htm?songId=3...
9,신호등,이무진,261620,https://www.melon.com/song/detail.htm?songId=3...


### SqlAlchemy와 Pymysql을 사용하여 DataFrame을 RDB의 테이블로 저장하기

In [16]:
import pymysql
import sqlalchemy

#pymysql과 sqlalchemy 연동
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

try:
    # dialect+driver://username:password@host:port/database
    engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db', encoding='utf-8')
    print(type(engine), engine)
    conn = engine.connect()
    print(type(conn), conn)
    
    #song_df(DataFrame객체)를 songs 테이블로 저장하기 to_sql() 함수 사용
    song_df.to_sql(name='songs', con=engine, if_exists='replace', index=False)
finally:
    conn.close()
    engine.dispose()

<class 'sqlalchemy.engine.base.Engine'> Engine(mysql+pymysql://python:***@localhost:3306/python_db)
<class 'sqlalchemy.engine.base.Connection'> <sqlalchemy.engine.base.Connection object at 0x00000172611BD5B0>


### DataFrame을 Table로 저장
* 컬럼명을 영문으로 변경
* 인덱스를 1부터 시작하도록 변경하고 데이터프레임객체의 인덱스가 테이블의 PK(primary key)가 되도록 설정
* 테이블의 데이터 타입을 변경 (발매일을 DATE 타입으로 변경)

In [17]:
#기존 DataFrame 객체의 복사본을 만들기
table_df = song_df.copy()
table_df.head(3)

Unnamed: 0,곡명,가수,앨범,발매일,장르,좋아요,url,가사
0,GANADARA (Feat. 아이유),박재범,GANADARA,2022.03.11,R&B/Soul,45545,https://www.melon.com/song/detail.htm?songId=3...,길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번...
1,INVU,태연 (TAEYEON),INVU - The 3rd Album,2022.02.14,댄스,81626,https://www.melon.com/song/detail.htm?songId=3...,Falling in love너에겐 난 Option시작부터 다른 너와 나깨지는 Hea...
2,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",138022,https://www.melon.com/song/detail.htm?songId=3...,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...


In [18]:
table_df.columns = ['title','singer','album','release_date','genre','likes','url','lyric']
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,likes,url,lyric
0,GANADARA (Feat. 아이유),박재범,GANADARA,2022.03.11,R&B/Soul,45545,https://www.melon.com/song/detail.htm?songId=3...,길거리를 걷다 보면사랑 노래만 흘러나와나는 왜 저런 게 낯설까난 한국말까지 서툴러번...
1,INVU,태연 (TAEYEON),INVU - The 3rd Album,2022.02.14,댄스,81626,https://www.melon.com/song/detail.htm?songId=3...,Falling in love너에겐 난 Option시작부터 다른 너와 나깨지는 Hea...


In [19]:
import numpy as np

#index 변경
table_df.index = np.arange(1, len(table_df)+1)
table_df.index

Int64Index([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,
             14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,
             27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,
             40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,  52,
             53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,  65,
             66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,  78,
             79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,  91,
             92,  93,  94,  95,  96,  97,  98,  99, 100],
           dtype='int64')

In [None]:
import pymysql
import sqlalchemy

#pymysql과 sqlalchemy 연동
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

try:
    # dialect+driver://username:password@host:port/database
    engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db', encoding='utf-8')
    conn = engine.connect()
    
    #['title','singer','album','release_date','genre','likes','lyric']
    #table_df(DataFrame객체)를 songs100 테이블로 저장하기 to_sql() 함수 사용
    table_df.to_sql(name='songs100', con=engine, if_exists='replace', index=True,\
                    index_label='id',
                    dtype={
                        'id':sqlalchemy.types.INTEGER(),
                        'title':sqlalchemy.types.VARCHAR(200),
                        'singer':sqlalchemy.types.VARCHAR(200),
                        'album':sqlalchemy.types.VARCHAR(200),
                        'release_date':sqlalchemy.types.DATE,
                        'genre':sqlalchemy.types.VARCHAR(200),
                        'likes':sqlalchemy.types.BigInteger,
                        'lyric':sqlalchemy.types.VARCHAR(3000)
                    })
finally:
    conn.close()
    engine.dispose()