In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
from tqdm import tqdm

In [2]:
url = 'https://www.letras.mus.br/beyonce/'
url_curta = 'https://www.letras.mus.br'

# Faz a requisição HTTP para a página
response = requests.get(url)

In [3]:
# Verifica se a requisição foi bem-sucedida
if response.status_code == 200:
    # Extrai o conteúdo HTML da resposta
    html = response.text

    # Cria um objeto BeautifulSoup para fazer o parsing do HTML
    soup = BeautifulSoup(html, 'html.parser')

    # Encontra todos os elementos 'a' que contêm as letras de músicas
    letras_links = soup.find_all('a', class_='song-name')

    # Cria listas para armazenar os títulos das músicas e suas respectivas letras
    titulos_musicas = []
    letras_musicas = []

    # Percorre os links das letras de músicas
    for link in tqdm(letras_links):
        # Obtém o URL da letra
        letra_url = link['href']
        letra_url = "{}{}".format(url_curta, letra_url)
        # Faz uma nova requisição HTTP para a página da letra
        letra_response = requests.get(letra_url)
        
        # Verifica se a requisição foi bem-sucedida
        if letra_response.status_code == 200:
            # Extrai o conteúdo HTML da resposta da letra
            letra_html = letra_response.text
            
            # Cria um novo objeto BeautifulSoup para fazer o parsing do HTML da letra
            letra_soup = BeautifulSoup(letra_html, 'html.parser')
            
            # Encontra o elemento 'div' que contém a letra da música
            letra_div = letra_soup.find('div', class_='cnt-letra')
            
            # Extrai o texto da letra da música
            letra = letra_div.get_text("\n")
            
            # Obtém o título da música
            titulo = link.text.strip()
            
            # Adiciona o título e a letra às respectivas listas
            titulos_musicas.append(titulo)
            letras_musicas.append(letra)
            
        else:
            print(f'Erro ao recuperar a letra da música: {letra_url}')
    
    # Cria um dataframe do pandas com os títulos e letras das músicas
    df_letras_musicas = pd.DataFrame({'Título': titulos_musicas, 'Letra': letras_musicas})
    
    # Salva o dataframe em um arquivo CSV
    df_letras_musicas.to_csv('letras_musicas.csv', index=False)
    
    print('As letras das músicas foram salvas com sucesso no arquivo "letras_musicas.csv".')
else:
    print(f'Erro ao recuperar a página: {url}')

100%|██████████| 413/413 [01:14<00:00,  5.56it/s]

As letras das músicas foram salvas com sucesso no arquivo "letras_musicas.csv".





In [4]:
df_letras_musicas

Unnamed: 0,Título,Letra
0,'03 Bonnie & Clyde (feat. Jay-Z),"\nUhh, uhh, uhh\nYou ready, B?\nLet's go get ..."
1,1+1,\nIf I ain't got nothing\nI got you\nIf I ain...
2,6 Inch (feat. The Weeknd),\n[Beyoncé]\nSix inch heels\nShe walked in th...
3,632-5792,\n(Hello) hello\nHow are you (oh)\nI just got...
4,7/11,"\nShoulders sideways, smack it, smack it in t..."
...,...,...
408,Yoncé [Homecoming Live],\nSee me up in the club with fifty-eleven gir...
409,Yoncé/ Partition,"\nLemme hear you say\nHey, Ms. Carter! (Hey, ..."
410,You Don't Love Me,\nNo no no\nYou don't love me\nAnd i know now...
411,"You Don’t Love Me (No, No, No) [Homecoming Live]","\n[Sean Paul]\nDutty, we'll, dutty, we'll\nDu..."


In [5]:
df_letras_musicas.sample(20)

Unnamed: 0,Título,Letra
101,Disappear,\nIf I begged and if I cried\nWould it change...
14,AMERICA HAS A PROBLEM,"\nAmerica, America has a problem\nHeard you g..."
36,Bello Embustero,"\nAy, ay, ay\n(Beyoncé, Beyoncé)\n(Beyoncé, B..."
119,End Of Time,"\nCome take my hand, I won't let you go\nI'll..."
319,Shining (Thank You) [Homecoming Live],"\nPlease give it up for my incredible, incred..."
98,Deja Vu/ Jazz,\nBass (uh)\nHi hat (uh)\n808 (uh)\nJay? (uh-...
18,Angel (feat. Kelly Rowland),\nThis is for my fans (uhu uhu)\nThis is for ...
24,Baby Boy (Junior's World Mixshow),"\nAah, ooh\nBeyoncé:\nBaby boy, you stay on m..."
218,Lay Up Under Me,\nDon't you worry 'bout a club\nJust come and...
32,Be With You,\nOoh baby\nI love the way you make me feel\n...


In [6]:
teste = df_letras_musicas["Letra"][102]

In [7]:
print(teste)

 
I'm a diva (hey!)
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a d-
Na, na, na, diva is a female version of a hustla (uh, huh)
Of a hustla, of a, of a hustla (uh, huh)
Na, na, na, diva is a female version of a hustla (uh, huh)
Of a hustla, of a, of a hustla (uh, huh)
Stop the track, lemme state facts
I've told you: Gimme a minute and I'll be right back
Fifty million 'round the world and they say that I couldn't get it
I've been got so sick and filthy with benjis, I can't spend it
How you gon' be talking shit?
You act like I just got up in it
Been the number one diva in this game for a minute
I know you read the paper, the one that they call a queen
Every radio round the world know me 'cause that's where I be (first!)
I'm a diva (hey!)
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva
I'm a, I'm a, a diva (hey!)
I'm a, I'm a, a diva
I'm 