### BeautifulSoup 
* select() 함수 사용
* melon 100 chart 데이터 파싱

In [None]:
import re
import requests
from bs4 import BeautifulSoup
# pprint는 구조화 된 데이터(리스트, 딕셔너리 등)를 이쁘게 출력하려고 사용
# 대신 객체는 하나만 들어가야 함
from pprint import pprint 

url = 'https://www.melon.com/chart/index.htm'

headers = {
    # 얘는 안주면 안됨 꼭 줘야함!!!
    # f12 개발자 모드에서 Network 탭을 누르고 
    # 새로고침 후 맨 위의 파란색 Document를 누르고
    # Headers 택의 맨 밑에 User-Agent가 있음
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}
# headers를 넣는 이유: 사람이 접속했는지 봇이 접속했는지 구분하려고 함
# headers를 넣지 않으면 봇으로 인식되어 차단당하거나 빈 페이지를 받게 됨
res = requests.get(url, headers=headers)

if res.ok:
    # res.text는 위의 url의 html 문서를 들여쓰기 없이 한 줄로 뽑아냄
    # 그래서 사용하는 것이 BeautifulSoup
    # 원래는 res.text.find("<a href=") 처럼 아주 복잡하게 써야되는데
    # BeautifulSoup를 쓰면 select/select_one/find/find_all 등으로 간편하게 검색 가능
    soup = BeautifulSoup(res.text, 'html.parser') # res.text로 받은 html텍스트를 태그 단위로 파싱(정리)해서 저장
    # pprint(soup)
    pprint(len(soup.select("a[href*='playSong']"))) # 100이 뜸
    atag_list = soup.select("a[href*='playSong']") # a 태그이면서 href 속성에 'playSong'이 포함 된 태그들만 골라서 리스트 형태로 저장
    # 이 각각의 값들은 딕셔너리처럼 다룰 수 있음음
    # a_tag_list에는 이런 값들이 100개저장되어 있음
        # <a href="javascript:melon.play.playSong('1000002721',38589554);" 
        #    title="TOO BAD (feat. Anderson .Paak) 재생">
        # TOO BAD (feat. Anderson .Paak)
        # </a>

    
    # [{}, {}] 
    song_list = [] # 100곡의 song을 저장하는 리스트
    for idx, atag in enumerate(atag_list, 1): # enumerate는 리스트 값을 뽑아주고 인덱스 값도 뽑아줌, 1은 인덱스 값에 1씩 더한다는 말
        # print(f"순서 = {idx} {atag}")
        # print(f"{atag}") #<a href="javascript:melon.play.playSong('1000002721',38589554);" title="TOO BAD (feat. Anderson .Paak) 재생">TOO BAD (feat. Anderson .Paak)</a>
        # print(f"순서 = {idx}") # 순서 = 1
        song_dict = {} # 1곡의 song 정보를 저장할 dict
        
        title = atag.text # song 제목
        # print(title)
        song_dict['title'] = title # song_dict의 키를 'title'로, 바로 위의 title을 값으로
        # print(song_dict)
        
        
        
        href = atag['href'] # song_id 추출 // BeautifulSoup는 딕셔너리 처럼 바로 속성 값을 꺼내올 수 있음
        # print(href)
        
        
        #여기까지 혼자 공부 함################################################################################################3
        
        
        # 정규표현식 패턴을 주고 대상되는 문자열 주기
        matched = re.search(r'(\d+)\)', href)
        # print(matched) # <re.Match object; span=(44, 53), match='38589554)'>
        if matched:
            # print(matched.group(0), matched.group(1)) # 38589554) 38589554
            song_id = matched.group(1) # group(0) 38589554) // group(1) 38589554
        song_dict['id'] = song_id # 키를'id'로, 값을 song_id로 넣음
        # 노래 상세정보 url
        song_url = f'https://www.melon.com/song/detail.htm?songId={song_id}'
        song_dict['url'] = song_url # 키를 'url'로, 값을 song_url로 넣음음
        
        song_list.append(song_dict) # 1곡의 노래를 저장한 song_dict 딕셔너리를 song_list 리스트에 넣음
    # song_list 확인
    print("확인하기")
    print("len(song_list)과 song_list[:3]")
    # pprint(len(song_list), song_list[:3]) # 이렇게 두개의 객체를 넣는건 오류가 생겨서 밑처럼 하나씩 넣어야 됨
    pprint(len(song_list))
    pprint(song_list[:3])
else: 
    print(f'Error Code = {res.status_code}')



100
확인하기
len(song_list)과 song_list[:3]
100
[{'id': '38589554',
  'title': 'TOO BAD (feat. Anderson .Paak)',
  'url': 'https://www.melon.com/song/detail.htm?songId=38589554'},
 {'id': '38429074',
  'title': '모르시나요(PROD.로코베리)',
  'url': 'https://www.melon.com/song/detail.htm?songId=38429074'},
 {'id': '38629386',
  'title': 'like JENNIE',
  'url': 'https://www.melon.com/song/detail.htm?songId=38629386'}]


### 곡상세 정보 추출하기

In [105]:
import re
import requests
from bs4 import BeautifulSoup

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
}

# Song 100곡의 상세정보 목록을 저장할 list 선언
song_lyric_list = []
print('=====> 100곡 파싱 시작 <=====')
for idx, song in enumerate(song_list, 1):
    # print(idx, song) # 1 {'title': 'TOO BAD (feat. Anderson .Paak)', 'id': '38589554', 'url': 'https://www.melon.com/song/detail.htm?songId=38589554'}
    print(f"==> {idx} {song['title']} <==")
    # Song 1곡의 상세정보 목록을 저장할 dict 선언
    song_lyric_dict = dict()

    res = requests.get(song['url'], headers=headers)
    if res.ok:
        soup = BeautifulSoup(res.text, 'html.parser')
        song_lyric_dict['곡명'] = song['title'] # 노래 제목
        
        singer_span = soup.select_one("a[href*='goArtistDetail'] span") # <span>G-DRAGON</span>
        song_lyric_dict['가수'] = singer_span.text # span 태그 안 text 반환

        # song_dd는 ResultSet 타입, song_dd[0]는 Tag 타입임
        song_dd = soup.select("div.meta dd") 
        if song_dd: # 이렇게 안에 값이 있는지 없는지 물어봐야 안전함
            song_lyric_dict['앨범'] = song_dd[0].text
            song_lyric_dict['발매일'] = song_dd[1].text
            song_lyric_dict['장르'] = song_dd[2].text
        
        # Song 상세정보 링크
        song_lyric_dict['detail_url'] = song['url']
        
        # 좋아요 건수
            # 좋아요 건수(JSON 데이터임 ->Network 탭의 Fetch/XHR에서 하나하나 Open In New Tab으로 찾아봐야 됨)
            # 왜 좋아요 데이터가 그냥 파싱이 안되고 
            # json 데이터를 일일이 개발자 탭/Network/FetchXHR에서 
            # Open in new tab에서 찾아서 가져와야 되는지 알아보고 여쭤보기
        song_id = song['id']
        
        ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'
        res = requests.get(ajax_url, headers=headers)
        if res.ok:
            # print(res.json()) # {'contsLike': [{'CONTSID': 38589554, 'LIKEYN': 'N', 'SUMMCNT': 124463}], 'httpDomain': 'http://www.melon.com', 'httpsDomain': 'https://www.melon.com', 'staticDomain': 'https://static.melon.co.kr'}
            # print(res.json()['contsLike']) # [{'CONTSID': 38589554, 'LIKEYN': 'N', 'SUMMCNT': 124465}]
            # print(res.json()['contsLike'][0]) # {'CONTSID': 38589554, 'LIKEYN': 'N', 'SUMMCNT': 124465}
            # print(res.json()['contsLike'][0]['SUMMCNT']) # 124465
            song_lyric_dict['좋아요'] = res.json()['contsLike'][0]['SUMMCNT']
            
            # 현재 song_lyric_dict에는 곡명, 가수, 앨범, 발매일, 장르, detail_url, 좋아요가 있음
            
            # 노래 가사 넣기
            # 클래스가 아니라 아이디라 띄어쓰기가 아니라 #으로 받음
            lyric_div = soup.select('div#d_video_summary')
            # print(lyric_div)
            if lyric_div: # 거의 있음
                lyric = lyric_div[0].text
            else: # 없는 경우도 있어서
                lyric = '' # 빈 문자열 넣음
            # print(lyric) # /n, /r, /t을 포함한 가사 출력
            # song_lyric_dict['가사'] = lyric
            
            # lyric에는 특수문자가 있어서 정규표현식으로 없애야 됨
            # /n, /r, /t 특수문자를 찾는 Pattern 객체 생성
            pattern = re.compile(r'[/n/r/t]')
            # print(type(pattern)) # <class 're.Pattern'> 출력
            # print(pattern) # re.compile('[/n/r/t]')
            
        song_lyric_dict['가사'] = pattern.sub('', lyric)
        song_lyric_list.append(song_lyric_dict)

        # print("------------------------------")
        # print("song_lyric_dict")
        # print(song_lyric_dict)
        # print("------------------------------")
    else: 
        print(f"Error Code: {res.status_code}")

print(len(song_lyric_list))
pprint(song_lyric_list)
print('=====> 100곡 파싱 끝 <=====')
# 좋아요 건수 가져오기 ajax_url = f'https://www.melon.com/commonlike/getSongLike.json?contsIds={song_id}'



=====> 100곡 파싱 시작 <=====
==> 1 TOO BAD (feat. Anderson .Paak) <==
==> 2 모르시나요(PROD.로코베리) <==
==> 3 like JENNIE <==
==> 4 Drowning <==
==> 5 HOME SWEET HOME (feat. 태양, 대성) <==
==> 6 나는 반딧불 <==
==> 7 REBEL HEART <==
==> 8 Whiplash <==
==> 9 오늘만 I LOVE YOU <==
==> 10 APT. <==
==> 11 HOT <==
==> 12 HAPPY <==
==> 13 ATTITUDE <==
==> 14 toxic till the end <==
==> 15 내게 사랑이 뭐냐고 물어본다면 <==
==> 16 I DO ME <==
==> 17 PO￦ER <==
==> 18 Flower <==
==> 19 TAKE ME <==
==> 20 미치게 그리워서 <==
==> 21 소나기 <==
==> 22 Dash <==
==> 23 한 페이지가 될 수 있게 <==
==> 24 천상연 <==
==> 25 Welcome to the Show <==
==> 26 Supernova <==
==> 27 사랑은 늘 도망가 <==
==> 28 예뻤어 <==
==> 29 청춘만화 <==
==> 30 DRIP <==
==> 31 Die With A Smile <==
==> 32 RIZZ <==
==> 33 어떻게 이별까지 사랑하겠어, 널 사랑하는 거지 <==
==> 34 Island <==
==> 35 슬픈 초대장 <==
==> 36 Love wins all <==
==> 37 우리들의 블루스 <==
==> 38 UP (KARINA Solo) <==
==> 39 Chroma Drift <==
==> 40 온기 <==
==> 41 청혼하지 않을 이유를 못 찾았어 <==
==> 42 12:32 (A to T) <==
==> 43 그대만 있다면 (여름날 우리 X 너드커넥션 (Nerd Connection))

#### song_lyric_lists를 DataFrame으로 저장하기

In [None]:
# [{'가수';'BTS','앨범':''},{}]


(100, 8)


Unnamed: 0,곡명,가수,앨범,발매일,장르,url,좋아요,가사
0,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,179089,"You say, It’s changedShow must go on, Behave오랜..."
0,REBEL HEART,IVE (아이브),IVE EMPATHY,2025.01.13,댄스,https://www.melon.com/song/detail.htm?songId=3...,58009,시작은 항상 다 이룬 것처럼엔딩은 마치 승리한 것처럼겁내지 않고 마음을 쏟을래 내 ...
0,나는 반딧불,황가람,나는 반딧불,2024.10.21,발라드,https://www.melon.com/song/detail.htm?songId=3...,100574,나는 내가 빛나는 별인 줄 알았어요한 번도 의심한 적 없었죠몰랐어요 난 내가 벌레라...


#### song_lyric_lists를 Json 파일로 저장
##### 이건 복사 붙여넣기함 그래도 중요
* json 파일로 저장해야 DataFrame으로 저장하기 용이함

In [None]:
import json

with open('data/songs100.json','w',encoding='utf-8') as file:
    json.dump(song_lyric_list, file)
# data/song100.json 파일을 json viewer 검색해서 보기

### Json File을 DataFrame (표데이터) 객체로 저장하기
#### pandas 사용

In [110]:
import pandas as pd

song_df = pd.read_json('data/songs100.json')

print(type(song_df))
song_df.head(3) # 기본적으로 5건의 데이터를 뿌려줌

<class 'pandas.core.frame.DataFrame'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
0,TOO BAD (feat. Anderson .Paak),G-DRAGON,Übermensch,2025.02.25,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,124465,"\n\t\t\t\t\t\t\t‘G’, ‘A.P’“Le me kill ’em like..."
1,모르시나요(PROD.로코베리),조째즈,모르시나요,2025.01.07,발라드,https://www.melon.com/song/detail.htm?songId=3...,58371,\n\t\t\t\t\t\t\t찬바람 불어오니그대 생각에 눈물짓네인사 없이 떠나시던 ...
2,like JENNIE,제니 (JENNIE),Ruby,2025.03.07,댄스,https://www.melon.com/song/detail.htm?songId=3...,54388,"\n\t\t\t\t\t\t\tCome o, i’s go be f hadSpecial..."


In [None]:
song_df.tail(3) # 기본적으로 마지막 5곡을 뿌려줌줌

Unnamed: 0,곡명,가수,앨범,발매일,장르,detail_url,좋아요,가사
97,earthquake,지수 (JISOO),AMORTAGE,2025.02.14,댄스,https://www.melon.com/song/detail.htm?songId=3...,27292,\n\t\t\t\t\t\t\tI his me like a eahquake더 빠르게 ...
98,벚꽃 엔딩,버스커 버스커,버스커 버스커 1집,2012.03.29,록/메탈,https://www.melon.com/song/detail.htm?songId=3...,317788,\n\t\t\t\t\t\t\t그대여 그대여 그대여 그대여 그대여 오늘은 우리 같이...
99,To. X,태연 (TAEYEON),To. X - The 5th Mini Album,2023.11.27,R&B/Soul,https://www.melon.com/song/detail.htm?songId=3...,172010,\n\t\t\t\t\t\t\t처음 본 널 기억해We skipped he small ...


In [None]:
# 가수 별 Row(컬럼) Counting
print(type(song_df['가수'])) # <class 'pandas.core.series.Series'>
# 한 줄은 pandas.core.series.Series임
# 두 줄 이상부터는 데이터 프레임

# song_df['가수'].value_counts()
song_df['가수'].value_counts().head()

<class 'pandas.core.series.Series'>


가수
임영웅         13
G-DRAGON     6
PLAVE        5
Name: count, dtype: int64

In [1]:
# 장르 별 Row Counting


In [None]:
# 특정 가수의 노래 정보 출력하기


Unnamed: 0,곡명,가수,앨범,발매일,장르,url,좋아요,가사
0,에피소드,이무진,에피소드,2023.12.13,록/메탈,https://www.melon.com/song/detail.htm?songId=3...,118369,나는 말야버릇이 하나있어 그건 매일 잠에 들 시간마다잘 모아둔 기억 조각들 중잡히는...
1,눈이 오잖아(Feat.헤이즈),이무진,눈이 오잖아(Feat.헤이즈),2021.12.03,발라드,https://www.melon.com/song/detail.htm?songId=3...,154942,한 달 좀 덜 된 기억들주머니에 넣은 채걷고 있어 몇 시간을혹시 몰라 네가 좋아했던...
2,청춘만화,이무진,만화 (滿花),2024.10.07,록/메탈,https://www.melon.com/song/detail.htm?songId=3...,34339,우린 멋진 나이야좀 어리긴 하지만하고픈 일이나 가고픈 길해야 할 일들까지 많으니까우...
3,청혼하지 않을 이유를 못 찾았어,이무진,청혼하지 않을 이유를 못 찾았어,2024.04.02,발라드,https://www.melon.com/song/detail.htm?songId=3...,46317,"너에게 안 믿길 만큼 받은 게 참 많아요우선은 너 하나, 그리고 우리란 말사실 더할..."


In [None]:
# unique 한 가수명을 리스트 형태로 출력하기


52


array(['G-DRAGON', 'IVE (아이브)', '황가람', 'aespa', '로제 (ROSÉ)', 'PLAVE',
       'WOODZ', 'BOYNEXTDOOR', 'DAY6 (데이식스)', '재쓰비 (JAESSBEE)',
       'BABYMONSTER', '로이킴', '이클립스 (ECLIPSE)', '임영웅', 'QWER', '이창섭',
       '순순희(지환)', 'AKMU (악뮤)', '제니 (JENNIE)', '아이유', 'NewJeans', '성시경',
       'TWS (투어스)', '너드커넥션 (Nerd Connection)', '(여자)아이들', '임재현', '프로미스나인',
       '이영지', '이무진', '박재정', 'Crush', '아일릿(ILLIT)', '폴킴', '순순희', 'RIIZE',
       'EXO', '경서예지', '부석순 (SEVENTEEN)', 'Lady Gaga', '범진',
       'KISS OF LIFE', '잔나비', '멜로망스', '정국', '김민석', '윤하 (YOUNHA)',
       '태연 (TAEYEON)', '지코 (ZICO)', '우디 (Woody)', 'BIGBANG (빅뱅)', '방탄소년단',
       'YENA (최예나)'], dtype=object)

In [None]:
#앨범이 OST 인 노래는?


<class 'pandas.core.series.Series'>
<class 'pandas.core.strings.accessor.StringMethods'>


Unnamed: 0,곡명,가수,앨범,발매일,장르,url,좋아요,가사
0,소나기,이클립스 (ECLIPSE),선재 업고 튀어 OST Part 1,2024.04.08,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,172038,그치지 않기를 바랬죠처음 그대 내게로 오던 그날에잠시 동안 적시는그런 비가 아니길간...
1,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021.10.11,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,223712,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
2,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014.02.12,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=4...,305502,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
3,미안해 미워해 사랑해,Crush,눈물의 여왕 OST Part.4,2024.03.24,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,103103,It's the same day이렇게 너를다시 불러보는 잊고 있던 마음들과이제야 내...
4,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018.03.20,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,436552,네가 없이 웃을 수 있을까생각만 해도 눈물이나힘든 시간 날 지켜준 사람이제는 내가 ...
5,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022.02.18,"발라드, 국내드라마",https://www.melon.com/song/detail.htm?songId=3...,219969,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...


### SqlAlchemy와 Pymysql을 사용하여 DataFrame을 RDB의 테이블로 저장하기

In [5]:
!pip show pymysql

Name: PyMySQL
Version: 1.1.1
Summary: Pure Python MySQL Driver
Home-page: 
Author: 
Author-email: Inada Naoki <songofacandy@gmail.com>, Yutaka Matsubara <yutaka.matsubara@gmail.com>
License: MIT License
Location: C:\Users\vega2\anaconda3\Lib\site-packages
Requires: 
Required-by: 


### DataFrame을 Table로 저장하기

<class 'sqlalchemy.engine.base.Engine'> Engine(mysql+pymysql://python:***@localhost:3306/python_db?charset=utf8mb4)
<class 'sqlalchemy.engine.base.Connection'> <sqlalchemy.engine.base.Connection object at 0x00000202BB891400>


### 복사한 DataFrame을 Table로 저장
* 컬럼명을 영문으로 변경
* 인덱스를 1부터 시작하도록 변경하고 DataFrame 객체의 인덱스가 테이블의 PK(primary key)가 되도록 설정
* 컬럼의 데이터 타입을 변경 (발매일을 DATE 타입으로 변경)

In [None]:
# 기존의 DataFrame의 복사본을 만들기 
# table_df = song_df.copy()
# table_df.head(3)

Unnamed: 0,곡명,가수,앨범,발매일,장르,url,좋아요,가사
0,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,179089,"You say, It’s changedShow must go on, Behave오랜..."
1,REBEL HEART,IVE (아이브),IVE EMPATHY,2025.01.13,댄스,https://www.melon.com/song/detail.htm?songId=3...,58009,시작은 항상 다 이룬 것처럼엔딩은 마치 승리한 것처럼겁내지 않고 마음을 쏟을래 내 ...
2,나는 반딧불,황가람,나는 반딧불,2024.10.21,발라드,https://www.melon.com/song/detail.htm?songId=3...,100574,나는 내가 빛나는 별인 줄 알았어요한 번도 의심한 적 없었죠몰랐어요 난 내가 벌레라...


In [None]:
# table_df.columns = ['title','singer','album','release_date','genre','url','likes','lyric']
# table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
0,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,179089,"You say, It’s changedShow must go on, Behave오랜..."
1,REBEL HEART,IVE (아이브),IVE EMPATHY,2025.01.13,댄스,https://www.melon.com/song/detail.htm?songId=3...,58009,시작은 항상 다 이룬 것처럼엔딩은 마치 승리한 것처럼겁내지 않고 마음을 쏟을래 내 ...


In [None]:
#index 값의 1 부터 시작하도록 설정
# import numpy as np

#index 변경
# table_df.index = np.arange(1, len(table_df)+1)
# table_df.index

Index([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,  14,
        15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,  27,  28,
        29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,  40,  41,  42,
        43,  44,  45,  46,  47,  48,  49,  50,  51,  52,  53,  54,  55,  56,
        57,  58,  59,  60,  61,  62,  63,  64,  65,  66,  67,  68,  69,  70,
        71,  72,  73,  74,  75,  76,  77,  78,  79,  80,  81,  82,  83,  84,
        85,  86,  87,  88,  89,  90,  91,  92,  93,  94,  95,  96,  97,  98,
        99, 100],
      dtype='int32')

In [None]:
# table_df.head(2)

Unnamed: 0,title,singer,album,release_date,genre,url,likes,lyric
1,"HOME SWEET HOME (feat. 태양, 대성)",G-DRAGON,"HOME SWEET HOME (feat. 태양, 대성)",2024.11.22,랩/힙합,https://www.melon.com/song/detail.htm?songId=3...,179089,"You say, It’s changedShow must go on, Behave오랜..."
2,REBEL HEART,IVE (아이브),IVE EMPATHY,2025.01.13,댄스,https://www.melon.com/song/detail.htm?songId=3...,58009,시작은 항상 다 이룬 것처럼엔딩은 마치 승리한 것처럼겁내지 않고 마음을 쏟을래 내 ...


In [None]:
# url 컬럼 삭제하기 axis=1은 column, axis=0 은 Row
# table_df.drop('url', axis=1, inplace=True)

In [None]:
#table_df.columns

Index(['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric'], dtype='object')

#### DataFrame 객체 ==> Table 로 변환
* ['title', 'singer', 'album', 'release_date', 'genre', 'likes', 'lyric']
* table_df(DataFrame객체)를 songs100 테이블로 저장하기 to_sql() 함수 사용


In [None]:
# import pymysql
# import sqlalchemy

# pymysql.install_as_MySQLdb()
# from sqlalchemy import create_engine

# engine = None
# conn = None
# try:
    # engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')
    # conn = engine.connect()    

#     table_df.to_sql(name='songs100', con=engine, if_exists='replace', index=True,\
#                     index_label='id',
#                     dtype={
#                         'id':sqlalchemy.types.INTEGER(),
#                         'title':sqlalchemy.types.VARCHAR(200),
#                         'singer':sqlalchemy.types.VARCHAR(200),
#                         'album':sqlalchemy.types.VARCHAR(200),
#                         'release_date':sqlalchemy.types.DATE,
#                         'genre':sqlalchemy.types.VARCHAR(200),
#                         'likes':sqlalchemy.types.BigInteger,
#                         'lyric':sqlalchemy.types.VARCHAR(5000)
#                     })
#     print('songs100 테이블 생성됨')
# finally:
#     if conn is not None: 
#         conn.close()
#     if engine is not None:
#         engine.dispose()

songs100 테이블 생성됨


#### SQL 쿼리 결과를 DataFrame 객체로 저장하는 함수선언하기
* read_sql_query() sql문을 실행한 결과를 DataFrame 객체로 반환해주는 함수

In [None]:
# def search_album(keyword):
#     sql = """select * from songs100 where album like %s;"""

#     import pandas as pd
#     import pymysql
#     import sqlalchemy

#     pymysql.install_as_MySQLdb()
#     from sqlalchemy import create_engine
    
#     engine = None
#     conn = None
#     try:
#         engine = create_engine('mysql+pymysql://python:python@localhost:3306/python_db?charset=utf8mb4')
#         conn = engine.connect()

#         album_df = pd.read_sql_query(sql, con=conn, params=('%' + keyword + '%',))
#         print(album_df.shape)
#         return album_df
#     finally:
#         print('finally')
#         if conn is not None: 
#             conn.close()
#         if engine is not None:
#             engine.dispose()

In [None]:
# search_album('OST')

(6, 8)
finally


Unnamed: 0,id,title,singer,album,release_date,genre,likes,lyric
0,19,소나기,이클립스 (ECLIPSE),선재 업고 튀어 OST Part 1,2024-04-08,"발라드, 국내드라마",172038,그치지 않기를 바랬죠처음 그대 내게로 오던 그날에잠시 동안 적시는그런 비가 아니길간...
1,21,사랑은 늘 도망가,임영웅,신사와 아가씨 OST Part.2,2021-10-11,"발라드, 국내드라마",223712,눈물이 난다 이 길을 걸으면그 사람 손길이 자꾸 생각이 난다붙잡지 못하고 가슴만 떨...
2,41,너의 모든 순간,성시경,별에서 온 그대 OST Part.7,2014-02-12,"발라드, 국내드라마",305502,이윽고 내가 한눈에너를 알아봤을 때모든 건 분명 달라지고 있었어내 세상은 널 알기 ...
3,59,미안해 미워해 사랑해,Crush,눈물의 여왕 OST Part.4,2024-03-24,"발라드, 국내드라마",103103,It's the same day이렇게 너를다시 불러보는 잊고 있던 마음들과이제야 내...
4,62,"모든 날, 모든 순간 (Every day, Every Moment)",폴킴,'키스 먼저 할까요?' OST Part.3,2018-03-20,"발라드, 국내드라마",436552,네가 없이 웃을 수 있을까생각만 해도 눈물이나힘든 시간 날 지켜준 사람이제는 내가 ...
5,80,사랑인가 봐,멜로망스,사랑인가 봐 (사내맞선 OST 스페셜 트랙),2022-02-18,"발라드, 국내드라마",219969,너와 함께 하고 싶은 일들을상상하는 게요즘 내 일상이 되고너의 즐거워하는 모습을 보...
