# 🎵 **Memoria del Proyecto: Análisis de Letras de Canciones**

Este documento describe la estructura y funcionamiento del proyecto, proporcionando referencias a los códigos utilizados, fuentes de datos y dependencias necesarias.

## 📖 **1. Introducción**

Este proyecto combina el análisis avanzado de letras de canciones con un sistema de personalización musical basado en inteligencia artificial y fórmulas matemáticas, permitiendo a los usuarios explorar y ajustar sus preferencias musicales de manera interactiva.

### 🎯 **Objetivos Principales**

1. **Sistema de Recomendación de Canciones Personalizado**: Utiliza valores numéricos derivados del análisis de metadatos musicales para generar recomendaciones basadas en los gustos del usuario en **Spotify**. De esta forma, se adapta dinámicamente a las preferencias y comportamientos del oyente, ofreciendo sugerencias que van más allá de las listas predefinidas o los algoritmos genéricos.

2. **Análisis de Frases en Letras de Canciones**: Se aplica **NLP** (Procesamiento del Lenguaje Natural) para detectar patrones, emociones y similitudes en las letras. Este análisis permite descubrir conexiones temáticas, estilísticas y emocionales que enriquecen la interpretación de la música, abriendo nuevas perspectivas sobre el contenido lírico.

### 🎧 **Objetivo Final para el Usuario**

Potenciar la experiencia musical a través de una doble aproximación analítica y personalizada. Esto se traduce en que el usuario no solo pueda descubrir nuevas canciones y artistas afines a sus gustos, sino también obtener una comprensión más profunda de las letras y emociones presentes en la música que disfruta. Al integrar el análisis de contenido lírico con un sistema de recomendaciones basado en datos y algoritmos inteligentes, el proyecto busca transformar la manera en que se interactúa con la música, facilitando una conexión más íntima y significativa entre el oyente y sus piezas favoritas.

## **📂 2. Estructura del Proyecto**  

El proyecto está organizado en diferentes carpetas y archivos, cada uno con una función específica.  
🔗 [Enlace Drive con los datasets y modelos finales](https://drive.google.com/drive/folders/1kZvgAkLrh15AG09APj5Dg9T-evNxTEgp?usp=sharing)_  

---

## **🔹 Backend** _(Procesamiento y Análisis de Datos)_  
🔗 [Repositorio Backend](https://github.com/JCMiriam/mood_tune_back) _(Actualizar con el enlace real)_  

📂 **api/** _(Endpoints y manejo de datos)_  
- 🚀 `server.py` → Servidor backend en **Flask/FastAPI** para gestionar peticiones del frontend.  
- 🔄 `routes.py` → Definición de endpoints para procesar datos y generar recomendaciones.  
- 📂 `models/` → Carpeta con modelos entrenados para análisis de letras y recomendación.  

---

## **🔹 Frontend** _(Interfaz de Usuario)_  
🔗 [Repositorio Frontend](https://github.com/JCMiriam/mood_tune_front) _(Actualizar con el enlace real)_  

📂 **frontend/** _(Interfaz gráfica y experiencia de usuario)_  
- 🎨 `index.html` → Página principal del proyecto.  
- 🎨 `styles.css` → Archivo de estilos para la interfaz.  
- 🖥️ `app.js` → Lógica y funcionalidades interactivas del frontend.  
- 🔗 `api_requests.js` → Conexión con el backend para obtener datos.  
- 🎛️ `config.js` → Configuración de API y personalización de usuario.  

---

## **📂 functions/**  
Contiene el código fuente principal y las funciones necesarias para la extracción, procesamiento y análisis de datos.  

### 📂 **functions/** _(Funciones principales)_  

### 📌 **1 - get_data_from_songs/** _(Obtención de datos musicales)_
Este carpeta tiene los pasos que hemos seguido para hacer la recolección de nuestros datos con los distintos recursos de los cuales se han sacado.
- 📜 `00_00_eda.ipynb` → Exploración inicial de los datos / limpieza.  
- 📜 `1 - buscar-recording_id.ipynb` → Búsqueda de identificadores de canciones en Brainz para pedir las características musicales de canciones.  
- 📜 `2 - obtener-datos-de-canciones.ipynb` → Extracción de información de canciones en Brainz.  
- 📜 `3 - request_Spoty.py` → Conexión con la API de Spotify, búsqueda de datos de canciones.  
- 📜 `4 - lastfm.py` → Obtención de datos de canciones desde Last.fm.  
- 📜 `5 - separarjuntardatosids.ipynb` → Separación y unión de datos con el datasets de listas de spotify
- 📜 `6 - ScrapeoLyrics_faltantes.ipynb` → Obtención de letras de canciones faltantes.  
- 📜 `7 - Detectar idioma y traducir.ipynb` → Detección de idioma y traducción automática poder hacer el modelado de las canciones que no son en inglés.
- 📜 `8 - Añadir_registros_de_un_dataset_a_otro.ipynb` → Fusión de bases de datos con el dataset de playlists de spotify

### 📌 **2 - Arreglos y Procesamientos/** _(Limpieza y preparación de datos)_  
- 🛠️ `Correccionesdatos.ipynb` → Ajustes en los datos crudos.    
- 🛠️ `detectar_idiomas.py` → Algoritmo de detección de idioma.  
- 🛠️ `modelo_errores_para_emb.ipynb` → Corrección de errores en embeddings.  
- 🛠️ `modelo_recalcular_embeddings_Fallos.ipynb` → Reprocesamiento de embeddings incorrectos.

### 📌 **3 - Recomendador de Características Musicales/** _(Análisis de audio)_  
_(Aquí irían archivos relacionados con el análisis de características musicales, si hay más detalles, podemos agregarlos)_  

### 📌 **4 - Recomendador de Letras de Canciones/** _(Basado en NLP y análisis de letras)_  
- 🤖 `Pruebas_Modelos.ipynb` → Pruebas de diferentes modelos de NLP.
- 🤖 `Roberta_Final.ipynb` → Implementación final del modelo Roberta.
- 🤖 `Roberta_pruebas.ipynb` → Pruebas y ajustes del modelo Roberta.
- ⚠️ `modelos_perdido.ipynb` → **Estructura corrupta para visualización por encima de las salidas de modelos**.

### 📌 **5 - Desarrollo del proyecto/** 
- 📜 `1 - backend` → Funcionamiento e instalación del backend para el despliegue local  
- 📜 `1 - frontend` → Funcionamiento e instalación del frontend para el despliegue local 
- 📜 `2 - despliegue y limitaciones` → Extracción de información de canciones en Brainz.  
- 📜 `3 - request_Spoty.py` → Conexión con la API de Spotify, búsqueda de datos de canciones.  
---

## 📂 **Otros archivos:**  
- 📜 `README.md` → Documentación general del proyecto.  
- 📜 `requirements.txt` → Lista de dependencias necesarias.  
- 📜 `config.json` → Configuración de claves y parámetros API.  
- 📜 `no/` → _(Carpeta auxiliar, con algunos de los codigos descartados o usado por separado)_.  


- PROXIMOS OBJETIVOS
- ALCANCE FUTURO
- LIMITACIONES
- ...




## **3. Fuentes de Datos y otros recursos utilizados**
Los datos utilizados en este proyecto provienen de diversas fuentes, incluyendo:

- **Spotify API**: Para obtener  de canciones y artistas.
- **Last FM API**: Para obtener  de canciones.
- **Brainz API**: Para la extracción de letras de canciones.
- **Lyrics.com y lyricsfreaks entre otros**: Scrapeo de letras faltantes
- **Kaggle Datasets**:
  - [Lyrics Dataset (~130,000 canciones)](https://www.kaggle.com/datasets/johnsmith88/lyrics-dataset)
  - [Genius Song Lyrics Dataset (~5 millones de canciones)](https://www.kaggle.com/datasets/nikhilnayak123/5-million-song-lyrics-dataset)
  - [Million Playlist Dataset de Spotify](https://www.kaggle.com/datasets/spotify/1-million-playlist-dataset)

### - **Otros recursos**:

- **Trello**: [Trello_dsmlproject](https://trello.com/b/eqvLwQmD/dsmlproject)
- **TuneInBear**: Para el scrapeo.



## **5. Ejemplo de Uso**
Para ejecutar el proyecto, sigue estos pasos:

1. **Instalar dependencias**:
   ```bash
   pip install -r requirements.txt
   ```

2. **Ejecutar la extracción de datos**:
   ```bash
   python src/functions/obtener-datos-de-canciones.py
   ```

3. **Ejecutar el recomendador de canciones personalizado**:
   ```python
   from recomendador_spotify import recomendar_canciones
   recomendar_canciones(usuario_spotify="tu_usuario")
   ```

4. **Cargar y analizar datos en Jupyter Notebook**:
   ```python
   from functions import analizar_lyrics
   analizar_lyrics("ruta/al/archivo.csv")
   ```




## **6. Dependencias**
El proyecto requiere las siguientes librerías:

```bash
pip install pandas numpy matplotlib seaborn transformers torch spotipy sklearn
```

- **pandas**: Manejo de datos en DataFrames.
- **numpy**: Cálculos numéricos.
- **matplotlib y seaborn**: Visualización de datos.
- **transformers y torch**: Modelos de NLP.
- **spotipy**: Conexión con la API de Spotify.
- **sklearn**: Algoritmos de recomendación y métricas de similitud.
