### Melon 100 차트 스크래핑
* 100곡 노래의 제목, ID를 추출
* Song ID로 상세 페이지를 100번 요청해서 상세정보를 추출
* 100곡의 노래 상세정보를 Json file에 저장
* Json file의 정보를 읽어서 Pandas의 DataFrame에 저장 후 표 데이터 생성
* 표 데이터를 Maria DB에 저장하기

In [1]:
# Melon Chart 100 데이터 추출
import requests 
import re
from bs4 import BeautifulSoup
from urllib.parse import urljoin # url join하는 모듈

url = 'https://www.melon.com/chart/index.htm'
req_header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'
}

res = requests.get(url, headers=req_header)

# 응답코드 200(ok) 정상이면 
if res.ok:
    # reponses 응답객체에서 텍스트를 추출
    html = res.text
    # 추출한 텍스트를 파싱하기 위해 BeautifulSoup 객체 생성
    # BeautifulSoup 객체의 역할 - html 문서 파싱
    soup = BeautifulSoup(html, 'html.parser')
    
    # div #list_tr 태그 선택 / print(len(soup.select('div#tb_list'))) # 1
    # div #list_tr > tr 태그 / print(len(soup.select('div#tb_list tr'))) # 101
    # div #list_tr > tr 태그 > wrap_song_info 클래스 / print(len(soup.select('div#tb_list tr div.wrap_song_info'))) # 200
    # div #list_tr > tr 태그 > wrap_song_info 클래스 > a 태그 / print(len(soup.select('div#tb_list tr div.wrap_song_info a'))) # 423
    # div #list_tr > tr 태그 > wrap_song_info 클래스 > a 태그 > href에 playsong 문자 포함 / print(len(soup.select('div#tb_list tr div.wrap_song_info a[href*=playSong]'))) # 100 *은 다음 문자를 포함하는 정규식표현
    # print(len(soup.select(".wrap_song_info a[href*=playSong]"))) # 100

    atag_list = soup.select('div#tb_list tr div.wrap_song_info a[href*=playSong]')
    song_list = []

    for idx, atag in enumerate(atag_list, 1):
        song_dict = {}
        title = atag.text
        href = atag['href']
        matched = re.search(r'(\d+)\);', href) # 정규표현식 패턴으로 숫자검색
        song_id = matched.group(1)
        detail_link = f'https://www.melon.com/song/detail.htm?songid={song_id}'
        
        song_dict['title'] = title
        song_dict['link'] = detail_link
        
        song_list.append(song_dict)
        #print(matched.group(0), matched.group(1))
        #print('{}. {}, {}'.format(idx, title, detail_link))
else:
        print('Error 코드 ', res.status_code)

print("complete")


complete


### Song ID로 상세 페이지를 100번 요청해서 상세정보 추출

In [2]:
import requests 
import re
from bs4 import BeautifulSoup

req_header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'
}

song_detail_list = []

for song in song_list:
    song_detail_dict = {}
    
    detail_res = requests.get(song['link'], headers=req_header)
    
    if detail_res.ok:
        html = detail_res.text
        soup = BeautifulSoup(html, 'html.parser')
        # 노래 제목
        song_detail_dict['곡명'] = song['title']
        # 가수
        song_detail_dict['가수'] = soup.select('a[href*="goArtistDetail"] span')[0].text
        # 앨범
        song_detail_dict['앨범'] = soup.select('div.meta dd')[0].text
        # 발매일
        song_detail_dict['발매일'] = soup.select('div.meta dd')[1].text
        # 장르
        song_detail_dict['장르'] = soup.select('div.meta dd')[2].text
        # 가사
        lyric = soup.select('div#d_video_summary')[0].text
        regexp = re.compile(r'[\r\n\t]')
        song_detail_dict['가사'] = regexp.sub(" ", lyric.strip())
        # 개별 song 정보를 담고 있는 dict를 list에 저장
        song_detail_list.append(song_detail_dict)
        
print("complete")


complete


### Song 정보를 담고 있는 List를 Json file로 저장

In [3]:
import json

with open('data/songs.json', 'w', encoding='utf8') as file:
    json.dump(song_detail_list, file)

### Json File 읽기

In [4]:
import json

with open('data/songs.json', 'r', encoding='utf8') as file:
    contents = file.read()
    song_json = json.loads(contents)
    
print(len(song_json))
print(type(song_json))

100
<class 'list'>


### Json File 읽어서 Pandas의 DataFrame 객체에 저장

In [5]:
import pandas as pd

# DataFrame 객체 생성
song_df = pd.DataFrame(columns=['곡명', '가수', '앨범', '발매일', '장르', '가사'])

for song in song_json:
    series_obj = pd.Series(song)
    song_df = song_df.append(series_obj, ignore_index=True)
    
song_df.tail()

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
95,HIP,마마무 (Mamamoo),reality in BLACK,2019.11.14,댄스,All I wanna be is 멋짐내 마음대로 골라 kick it머리 어깨 무릎 ...
96,숲의 아이 (Bon voyage),유아 (오마이걸),Bon Voyage,2020.09.07,댄스,어느 날 난 조금 낯선 곳에 눈을 떴지온몸엔 부드러운 털이 자라나고머리엔 반짝이는 ...
97,To Die For,Sam Smith,To Die For,2020.02.14,POP,It is if everyone dies aloneDoes that scare yo...
98,여름 안에서 by 싹쓰리 (Feat. 황광희),"싹쓰리 (유두래곤, 린다G, 비룡)",여름 안에서 by 싹쓰리,2020.07.11,댄스,언제나 꿈꿔 온 순간이여기 지금 내게 시작되고 있어그렇게 너를 사랑했던내 마음을 넌...
99,PLAY (Feat. 창모),청하,PLAY,2020.07.06,댄스,너무 위험한 이 느낌은 babyI wonder how you feel아찔 계속된 이...


In [6]:
print('shape :', song_df.shape)
print('columns :', song_df.columns)
print('index :', song_df.index)
print('values :', song_df.values[0:5]) # 2차원 배열

shape : (100, 6)
columns : Index(['곡명', '가수', '앨범', '발매일', '장르', '가사'], dtype='object')
index : RangeIndex(start=0, stop=100, step=1)
values : [["DON'T TOUCH ME" '환불원정대' "DON'T TOUCH ME" '2020.10.10' '댄스'
  "Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm a lady 못 말리네 oh불편한 말들이 또 선을 넘어난 또 보란 듯 해내서 보여줘 버려나도 사랑을 원해나도 평화가 편해하지만 모두가 you know자꾸 건드리네 don't touch mebut 내 멋대로 해blah blah blah so whatI don't care yeah yeah내 맘대로 해자꾸 건드리네 don't touch me괜찮아 걱정 마 So good 난 즐거워몇 살을 먹는대도 절대로 난 안 꿀리는 걸따라 하고 싶지 않아wanna be original남의 눈치 보지 않아자꾸 건드리네 don't touch meUhh Tell me who's hotter NadaYou dealing with afour headed monsta어디 와서 싸구려를 팔아참지 않아 you don't want no problems맘대로 맘대로 hey누가 뭐래도 나대로 hey내가 문제라면 답 없지You can look and starebut don't touch me불편한 말들이 또 선을 넘어난 또 보란 듯 해내서 보여줘 버려나도 사랑을 원해나도 평화가 편해하지만 모두가 you know자꾸 건드리네 don't touch mebut 내 멋대로 해blah blah blah so whatI don't care yeah yeah내 맘대로 해자꾸 건드리네 don't touch me괜찮아 걱정 마 So good 난 즐거워몇 살을 먹는대도 절대로 난 안 꿀리는 걸따라 하고 싶지 않아wanna be original남의 눈치 보지 않아자꾸 건드리

In [7]:
song_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   곡명      100 non-null    object
 1   가수      100 non-null    object
 2   앨범      100 non-null    object
 3   발매일     100 non-null    object
 4   장르      100 non-null    object
 5   가사      100 non-null    object
dtypes: object(6)
memory usage: 4.8+ KB


In [8]:
# 가수 컬럼값만 선택
song_df['가수']

0                   환불원정대
1                   방탄소년단
2               BLACKPINK
3                      산들
4                   Crush
             ...         
95          마마무 (Mamamoo)
96              유아 (오마이걸)
97              Sam Smith
98    싹쓰리 (유두래곤, 린다G, 비룡)
99                     청하
Name: 가수, Length: 100, dtype: object

In [9]:
# 가수별로 row counting
song_df['가수'].value_counts()

BLACKPINK              5
방탄소년단                  5
아이유                    5
Crush                  5
싹쓰리 (유두래곤, 린다G, 비룡)    3
                      ..
Ariana Grande          1
HYNN (박혜원)             1
환불원정대                  1
송하예                    1
임영웅                    1
Name: 가수, Length: 71, dtype: int64

In [10]:
# 장르별 row counting
song_df['장르'].value_counts()

댄스                 25
발라드                22
POP                13
랩/힙합               11
발라드, 국내드라마          9
R&B/Soul            4
록/메탈                3
랩/힙합, 인디음악          3
R&B/Soul, 인디음악      2
인디음악, 포크/블루스        2
록/메탈, 국내드라마         2
R&B/Soul, 국내드라마     1
성인가요                1
재즈, 애시드/퓨전/팝        1
발라드, 인디음악           1
Name: 장르, dtype: int64

In [11]:
# unique 한 장르명 가져오기
song_df['장르'].unique()

array(['댄스', '발라드', 'R&B/Soul', '인디음악, 포크/블루스', 'POP', '랩/힙합', '록/메탈',
       '발라드, 국내드라마', '랩/힙합, 인디음악', '록/메탈, 국내드라마', 'R&B/Soul, 인디음악',
       '발라드, 인디음악', '성인가요', 'R&B/Soul, 국내드라마', '재즈, 애시드/퓨전/팝'],
      dtype=object)

In [12]:
# 방탄소년단의 노래를 모두 선택 후 개수 카운트
bts_count = song_df['가수'] == '방탄소년단'
bts_count.value_counts()

False    95
True      5
Name: 가수, dtype: int64

### 특정 행이나 열을 선택
* loc[행, 열], iloc[] 사용
* 1) Slicing을 사용하여 구간을 선택
* 2) 특정행과 열을 선택
* 3)조건식을 만족하는 행을 선택

In [13]:
# loc[] - location의 약자
# 특정행이나 특정열을 선택할 때 사용.
# loc[행 선택 기준, 열 선택 기준] / loc = 마지막 인덱스 포함
# 인덱스가 0부터 5까지의 행과 모든 열을 선택
song_df.loc[0:5,:]

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
1,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24,댄스,Cos ah ahI’m in the stars tonightSo watch me b...
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
3,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020.07.20,발라드,언제부턴가 불쑥내 습관이 돼버린 너혹시나 이런 맘이어쩌면 부담일까널 주저했어언제부턴...
4,놓아줘 (with 태연),Crush,with HER,2020.10.20,R&B/Soul,똑같은 하루아무 표정 없는 날들지켜보는 것도 버거워여기까지인 것 같다고닿을 수 없단...
5,When We Disco (Duet with 선미),박진영,When We Disco,2020.08.12,댄스,마법 같았지 When we disco when we disco그래서 잊지를 못해 아...


In [14]:
# Slicing으로 index가 0부터 8까지 1개씩 스킵해서 출력
song_df.loc[0:8:2, :]

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
4,놓아줘 (with 태연),Crush,with HER,2020.10.20,R&B/Soul,똑같은 하루아무 표정 없는 날들지켜보는 것도 버거워여기까지인 것 같다고닿을 수 없단...
6,힘든 건 사랑이 아니다,임창정,힘든 건 사랑이 아니다,2020.10.19,발라드,내가 널 떠났어야 했는데 왜 떠나야 하는지도 아는데 어떤 아무 말도 아무것도 줄 게...
8,Savage Love (Laxed - Siren Beat) (BTS Remix),Jawsh 685,Savage Love (Laxed - Siren Beat) [BTS Remix],2020.10.02,POP,Savage loveDid somebody did somebodyBreak your...


In [15]:
# 여러개의 특정 행과 모든열을 선택
song_df.loc[[0, 3, 7, 8], :]

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
3,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020.07.20,발라드,언제부턴가 불쑥내 습관이 돼버린 너혹시나 이런 맘이어쩌면 부담일까널 주저했어언제부턴...
7,오래된 노래,스탠딩 에그,오래된 노래,2012.09.04,"인디음악, 포크/블루스",오래 전에 함께 듣던 노래가발걸음을 다시 멈춰서게 해이 거리에서너를 느낄 수 있어널...
8,Savage Love (Laxed - Siren Beat) (BTS Remix),Jawsh 685,Savage Love (Laxed - Siren Beat) [BTS Remix],2020.10.02,POP,Savage loveDid somebody did somebodyBreak your...


In [16]:
# 조건식을 만족하는 행과 모든 열을 선택
query = song_df['가수'] == '방탄소년단'
bp = song_df['가수'] == 'BLACKPINK'
song_df.loc[bp, :]

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
12,How You Like That,BLACKPINK,How You Like That,2020.06.26,랩/힙합,보란 듯이 무너졌어바닥을 뚫고 저 지하까지옷 끝자락 잡겠다고저 높이 두 손을 뻗어봐...
37,Ice Cream (with Selena Gomez),BLACKPINK,Ice Cream (with Selena Gomez),2020.08.28,댄스,Come a little closercause you looking thirstyI...
54,Pretty Savage,BLACKPINK,THE ALBUM,2020.10.02,랩/힙합,비슷한 것 같지 우린 뼛속까지 다름아이 창피하다가도 멍석 깔면 바름Born skin...
69,Bet You Wanna (Feat. Cardi B),BLACKPINK,THE ALBUM,2020.10.02,댄스,BLACKPINKCardiTell me where you wanna goI’ll m...


In [17]:
# 모든행과 특정열을 1개 선택
# 컬럼이 1개라 시리즈로 출력
song_df.loc[:, '곡명']

0                DON'T TOUCH ME
1                      Dynamite
2                Lovesick Girls
3         취기를 빌려 (취향저격 그녀 X 산들)
4                 놓아줘 (with 태연)
                ...            
95                          HIP
96           숲의 아이 (Bon voyage)
97                   To Die For
98    여름 안에서 by 싹쓰리 (Feat. 황광희)
99              PLAY (Feat. 창모)
Name: 곡명, Length: 100, dtype: object

In [18]:
# 모든행과 특정열을 여러개 선택
# 컬럼이 여러개라 데이터 프레임으로 출력
song_df.loc[:, ['가수', '곡명', '장르']].head(3)

Unnamed: 0,가수,곡명,장르
0,환불원정대,DON'T TOUCH ME,댄스
1,방탄소년단,Dynamite,댄스
2,BLACKPINK,Lovesick Girls,댄스


In [19]:
# 장르가 댄스인 가수, 곡명, 장르, 발매일을 선택
genre = song_df['장르'] == '댄스'
song_df.loc[genre, ['가수', '곡명', '장르', '발매일']].sort_values(by='발매일', ascending=False).reset_index(drop=True)

Unnamed: 0,가수,곡명,장르,발매일
0,마마무 (Mamamoo),딩가딩가 (Dingga),댄스,2020.10.20
1,이수현,ALIEN,댄스,2020.10.16
2,환불원정대,DON'T TOUCH ME,댄스,2020.10.10
3,BLACKPINK,Lovesick Girls,댄스,2020.10.02
4,BLACKPINK,Bet You Wanna (Feat. Cardi B),댄스,2020.10.02
5,유아 (오마이걸),숲의 아이 (Bon voyage),댄스,2020.09.07
6,BLACKPINK,Ice Cream (with Selena Gomez),댄스,2020.08.28
7,방탄소년단,Dynamite,댄스,2020.08.24
8,ITZY (있지),Not Shy,댄스,2020.08.17
9,박진영,When We Disco (Duet with 선미),댄스,2020.08.12


In [20]:
# 모든행과 Slicing을 사용하여 가수부터 발매일까지
song_df.loc[:, '가수':'발매일'].head(3)

Unnamed: 0,가수,앨범,발매일
0,환불원정대,DON'T TOUCH ME,2020.10.10
1,방탄소년단,Dynamite (DayTime Version),2020.08.24
2,BLACKPINK,THE ALBUM,2020.10.02


In [21]:
# iloc[] 사용
# 행의 인덱스가 0부터 5까지, 열의 인덱스가 0:4 / iloc = 마지막 인덱스 미포함
song_df.iloc[0:5, 0:4]

Unnamed: 0,곡명,가수,앨범,발매일
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10
1,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02
3,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020.07.20
4,놓아줘 (with 태연),Crush,with HER,2020.10.20


### 100곡의 Song 정보가 포함된 데이터프레임 객체를 DB에 저장
* pymysql 과 sqlalchemy 를 사용

In [29]:
# 기존 DataFrame 객체 복사
table_df = song_df.copy()
table_df.head()

Unnamed: 0,곡명,가수,앨범,발매일,장르,가사
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
1,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24,댄스,Cos ah ahI’m in the stars tonightSo watch me b...
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
3,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020.07.20,발라드,언제부턴가 불쑥내 습관이 돼버린 너혹시나 이런 맘이어쩌면 부담일까널 주저했어언제부턴...
4,놓아줘 (with 태연),Crush,with HER,2020.10.20,R&B/Soul,똑같은 하루아무 표정 없는 날들지켜보는 것도 버거워여기까지인 것 같다고닿을 수 없단...


In [31]:
table_df.columns = ['title', 'singer', 'album', 'release_date', 'genre', 'lyric']
table_df.head()

Unnamed: 0,title,singer,album,release_date,genre,lyric
0,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
1,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24,댄스,Cos ah ahI’m in the stars tonightSo watch me b...
2,Lovesick Girls,BLACKPINK,THE ALBUM,2020.10.02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
3,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020.07.20,발라드,언제부턴가 불쑥내 습관이 돼버린 너혹시나 이런 맘이어쩌면 부담일까널 주저했어언제부턴...
4,놓아줘 (with 태연),Crush,with HER,2020.10.20,R&B/Soul,똑같은 하루아무 표정 없는 날들지켜보는 것도 버거워여기까지인 것 같다고닿을 수 없단...


In [34]:
# index가 1부터 시작되도록 변경

import numpy as np

table_df.index = np.arange(1, len(table_df)+1)
table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,lyric
1,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020.10.10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
2,Dynamite,방탄소년단,Dynamite (DayTime Version),2020.08.24,댄스,Cos ah ahI’m in the stars tonightSo watch me b...


### 컬럼명과 DataType을 변경해서 Table로 저장하기

In [35]:
import pymysql
import sqlalchemy
# pymysql 과 sqlalchemy 를 연동
pymysql.install_as_MySQLdb() # pymysql 과 sqlalchemy 연동 함수
from sqlalchemy import create_engine

# 연결할 수 있는 engine 객체 생성
engine = create_engine('mysql+mysqldb://python:python@localhost:3307/python_db', encoding='utf-8')

# Engine을 사용하여 DB에 연결
con = engine.connect()
print(con)

# DataFrame의 to_sql() 함수로 dataframe 객체를 Table로 지정
table_df.to_sql(
    name='melon_100', 
    con=engine, 
    if_exists='replace', 
    index=True,
    index_label='id',
    dtype={
        'id':sqlalchemy.types.INTEGER(),
        'title':sqlalchemy.types.VARCHAR(100),
        'singer':sqlalchemy.types.VARCHAR(100),
        'album':sqlalchemy.types.VARCHAR(100),
        'release_date':sqlalchemy.DATE(),
        'genre':sqlalchemy.types.VARCHAR(100),
        'lyric':sqlalchemy.types.VARCHAR(2500)
    })



<sqlalchemy.engine.base.Connection object at 0x000002593EAF74C0>


### Table을 DataFrame 객체로 변환하기

In [36]:
import pymysql
import sqlalchemy
# pymysql 과 sqlalchemy 를 연동
pymysql.install_as_MySQLdb() # pymysql 과 sqlalchemy 연동 함수
from sqlalchemy import create_engine

try:
    # 연결할 수 있는 engine 객체 생성
    engine = create_engine('mysql+mysqldb://python:python@localhost:3307/python_db', encoding='utf-8')

    # Engine을 사용하여 DB에 연결
    con = engine.connect()
    melon_100_df = pd.read_sql_table('melon_100', con)
    
except Exception as e:
    print(e)
finally:
    # DB 연결 종료
    con.close()

melon_100_df.head()

Unnamed: 0,id,title,singer,album,release_date,genre,lyric
0,1,DON'T TOUCH ME,환불원정대,DON'T TOUCH ME,2020-10-10,댄스,Trouble 이래 다 그래세 보인대 어쩔래난 멋 부리네 더 꾸미네yeah I'm ...
1,2,Dynamite,방탄소년단,Dynamite (DayTime Version),2020-08-24,댄스,Cos ah ahI’m in the stars tonightSo watch me b...
2,3,Lovesick Girls,BLACKPINK,THE ALBUM,2020-10-02,댄스,영원한 밤창문 없는 방에 우릴 가둔 loveWhat can we say매번 아파도 ...
3,4,취기를 빌려 (취향저격 그녀 X 산들),산들,취기를 빌려 (취향저격 그녀 X 산들),2020-07-20,발라드,언제부턴가 불쑥내 습관이 돼버린 너혹시나 이런 맘이어쩌면 부담일까널 주저했어언제부턴...
4,5,놓아줘 (with 태연),Crush,with HER,2020-10-20,R&B/Soul,똑같은 하루아무 표정 없는 날들지켜보는 것도 버거워여기까지인 것 같다고닿을 수 없단...


In [40]:
import pymysql
import sqlalchemy
# pymysql 과 sqlalchemy 를 연동
pymysql.install_as_MySQLdb() # pymysql 과 sqlalchemy 연동 함수
from sqlalchemy import create_engine
    
def search_album(keyword):
    sql = """select * from melon_100 where album like %s"""
    
    try:
        # 연결할 수 있는 engine 객체 생성
        engine = create_engine('mysql+mysqldb://python:python@localhost:3307/python_db', encoding='utf-8')

        # Engine을 사용하여 DB에 연결
        con = engine.connect()
        melon_100_df = pd.read_sql_table('melon_100', con)
        
        # query 실행한 결과를 DataFrame 객체로 변환하기
        album_df = pd.read_sql_query(sql, con=con, params=('%' + keyword + '%', ))

    except Exception as e:
        print(e)
    finally:
        # DB 연결 종료
        con.close()
    
    return album_df

result = search_album('OST')
result.head()

Unnamed: 0,id,title,singer,album,release_date,genre,lyric
0,17,아로하,조정석,슬기로운 의사생활 OST Part 3,2020-03-27,"발라드, 국내드라마",어두운 불빛아래 촛불 하나와인 잔에 담긴 약속하나항상 너의 곁에서 널 지켜줄거야날 ...
1,31,흔들리는 꽃들 속에서 네 샴푸향이 느껴진거야,장범준,멜로가 체질 OST Part 3,2019-08-23,"록/메탈, 국내드라마",흔들리는 꽃들 속에서네 샴푸향이 느껴진거야스쳐지나간건가 뒤돌아보지만그냥 사람들만 보...
2,33,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,`키스 먼저 할까요?` OST Part.3,2018-03-20,"발라드, 국내드라마",네가 없이 웃을 수 있을까생각만 해도 눈물이나힘든 시간 날 지켜준 사람이제는 내가 ...
3,35,사랑하게 될 줄 알았어,전미도,슬기로운 의사생활 OST Part 11,2020-05-22,"발라드, 국내드라마",널 처음 사진으로 본 그날구십구년 일월 삼십일일그날 이후 지금 이 순간까지나 하나만...
4,45,Don't Start Now,Dua Lipa,Future Nostalgia,2019-11-01,POP,If you don’t wanna see me Did a full 180 crazy...


In [45]:
# 가수 이름

import pymysql
import sqlalchemy
# pymysql 과 sqlalchemy 를 연동
pymysql.install_as_MySQLdb() # pymysql 과 sqlalchemy 연동 함수
from sqlalchemy import create_engine
    
def search_song_title(singer_kw, title_kw):
    sql = """select * from melon_100 where singer like %s or title like %s"""
    
    try:
        # 연결할 수 있는 engine 객체 생성
        engine = create_engine('mysql+mysqldb://python:python@localhost:3307/python_db', encoding='utf-8')

        # Engine을 사용하여 DB에 연결
        con = engine.connect()
        melon_100_df = pd.read_sql_table('melon_100', con)
        
        # query 실행한 결과를 DataFrame 객체로 변환하기
        song_title_df = pd.read_sql_query(sql, con=con, params=('%' + singer_kw + '%', '%' + title_kw + '%'))

    except Exception as e:
        print(e)
    finally:
        # DB 연결 종료
        con.close()
    
    return song_title_df

result = search_song_title('아', '사')
result.head()

Unnamed: 0,id,title,singer,album,release_date,genre,lyric
0,7,힘든 건 사랑이 아니다,임창정,힘든 건 사랑이 아니다,2020-10-19,발라드,내가 널 떠났어야 했는데 왜 떠나야 하는지도 아는데 어떤 아무 말도 아무것도 줄 게...
1,14,에잇(Prod.&Feat. SUGA of BTS),아이유,에잇,2020-05-06,록/메탈,So are you happy nowFinally happy now are you뭐...
2,24,Blueming,아이유,Love poem,2019-11-18,록/메탈,‘뭐해?‘라는 두 글자에‘네가 보고 싶어’ 나의 속마음을 담아 우이모티콘 하나하나 ...
3,25,"어떻게 이별까지 사랑하겠어, 널 사랑하는 거지",AKMU (악동뮤지션),항해,2019-09-25,발라드,일부러 몇 발자국 물러나내가 없이 혼자 걷는 널 바라본다옆자리 허전한 너의 풍경흑백...
4,29,사랑은 지날수록 더욱 선명하게 남아,전상근,한 걸음 : 흔적,2020-06-07,발라드,편해지고 변해가고자연스러운 그런 과정시도 때도 없이 다투면서불안해진 마음더는 멀어지...
