# Análisis de sentimientos de White Album

En esta ocasión, nos tocó hacer un análisis de sentimientos del famoso álbum "The Beatles" de la banda británica con el mismo nombre.
Bajo las tensiones de unos beatles ya forjando distintos caminos, la aparición de Yoko Ono y la influencia de la cultura hindú nace el conocido "White Album", mostrándo el lado más creativo y vanguardista de cada Beatle por separado con la química instrumental que los caracteriza.

En el presente proyecto, se empezará desde la extracción de datos hasta la muestra gráfica e identificación de las palabras.

## Web Scraping: Canción por Canción

El álbum consta de 30 canciones compuestas por cada miembro de la banda: John, Paul, George y Ringo.
Para hacer el web scraping, utilizaremos la famosa web [Genius](www.genius.com).
Lo primero que haremos es establecer conexión con la página para obtener el HTML.

!(https://upload.wikimedia.org/wikipedia/en/f/f2/White_album_front2.jpg)

In [3]:
import pandas as pd
import requests
from bs4 import BeautifulSoup

url = 'https://genius.com/albums/The-beatles/The-beatles-white-album'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')


Luego de establecer la conexión, obtenemos los enlaces de cada canción.

In [4]:
links = soup.find_all('a',class_ = "u-display_block", href=True)
enlaces = []
for link in links:
    enlaces.append(link['href'])

In [5]:
enlaces

['https://genius.com/The-beatles-back-in-the-ussr-lyrics',
 'https://genius.com/The-beatles-dear-prudence-lyrics',
 'https://genius.com/The-beatles-glass-onion-lyrics',
 'https://genius.com/The-beatles-ob-la-di-ob-la-da-lyrics',
 'https://genius.com/The-beatles-wild-honey-pie-lyrics',
 'https://genius.com/The-beatles-the-continuing-story-of-bungalow-bill-lyrics',
 'https://genius.com/The-beatles-while-my-guitar-gently-weeps-lyrics',
 'https://genius.com/The-beatles-happiness-is-a-warm-gun-lyrics',
 'https://genius.com/The-beatles-martha-my-dear-lyrics',
 'https://genius.com/The-beatles-im-so-tired-lyrics',
 'https://genius.com/The-beatles-blackbird-lyrics',
 'https://genius.com/The-beatles-piggies-lyrics',
 'https://genius.com/The-beatles-rocky-raccoon-lyrics',
 'https://genius.com/The-beatles-dont-pass-me-by-lyrics',
 'https://genius.com/The-beatles-why-dont-we-do-it-in-the-road-lyrics',
 'https://genius.com/The-beatles-i-will-lyrics',
 'https://genius.com/The-beatles-julia-lyrics',
 

Después de tener todos los enlaces, definiremos la función `lyrics()`, la cual hará un web scraping de cada enlace obtenido anteriormente para extraer las letras de cada canción.

In [25]:
import re
import string

def lyrics(urls):
    df = []
    ls = []
    titles = []
    for url in urls:
        response = requests.get(url)
        soup = BeautifulSoup(response.text, 'html.parser')
        text = soup.find_all('div', attrs= {"class":"Lyrics__Container-sc-1ynbvzw-1 kUgSbL"})
        title = soup.find('span',attrs={'class':'SongHeaderdesktop__HiddenMask-sc-1effuo1-11 iMpFIj'}).get_text()
        lyric = []
        for t in text:
            y = t.get_text(' ').lower()
            lyric.append(re.sub(r'\[.*?\]', '', y))
        lyric_s = [ly.replace('\u200b', '').translate(str.maketrans('', '', string.punctuation)).replace('  ',' ').strip() for ly in lyric]
        df.append(lyric_s)
        titles.append(title)
    for a in df:
        ls.append(''.join(a))
    data = pd.DataFrame({'Título':titles, 'Letra':ls})
     
    return data
        

In [26]:
resultados = lyrics(enlaces) # Almacenamos los resultados

In [34]:
resultados.to_csv('lyrics_white_album.csv')