Skip to content
No description, website, or topics provided.
HTML R
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
Martin-Ruggeri
emiliano-monteverdi
juampivallejo
lokiju96
nicolasvidelac
pasaperez
.gitignore
README.md
logs-test.R

README.md

am2019-spotify

Consignas para el trabajo final de la cátedra Aprendizaje automático UTN Mendoza aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

1- Git

1 - Cree una cuenta en GitHub, le servirá más adelante para la entrega.

2 - Instale Git en su máquina

3 - Realice un fork de este repositorio. Trabaje sobre su repositorio actualizándolo usando git add, git commit y git push. Para más información sobre como trabajar con Git + R o una introducción gentil a Git, ver el libro Happy Git with R

4 - Orden sobre como trabajar.

  • Cree una carpeta con cuyo nombre siga el siguiente formato nombreDeUsuarioDeGitHub , ejemplo anadiedrichs
  • Mueva el script 0-get-data-2.R a esa carpeta.
  • Recuerde: creará todos sus scripts, notebooks, etc en dicha carpeta con nombre nombreDeUsuarioDeGitHub

2- Descarga de datos

Para obtener los datos deberás seguir estos 3 sencillos pasos:

  • Hacer una App de Spotify Developer aquí (puedes seguir las imágenes en estas instrucciones en inglés):

    • Crea una cuenta si no tienes una
    • Crea una app con el nombre que quieras. Recuerda este nombre, es el app-id que vamos a utilizar luego. Escoge Website entre las opciones y declara que la app NO ES COMERCIAL (en nuestro caso, no lo es).
    • Copia tu client ID y tu client Secret.
    • Haz clic en "Edit settings" y cambia Redirect URLs a http://localhost:1410/ .
  • En el código de 0-get-data-2.R, cambia en la línea donde se definen la variable keys los valores de app_id, client_id y client_secret por tus datos (línea 17. contando los saltos de línea).

  • Instala los paquetes tidyverse, Rspotify y httpuv si no los tienes.

  • Corre el código 0-get-data-2.R. Dependiendo de tu conexión, tardará en ejecutarse unos 4 minutos.

3- Análisis descriptivo exploratorio

  • Realice un análisis descriptivo exploratorio (EDA en inglés) sobre los datos.

  • Use un archivo formato Rmarkdown extensión .Rmd para crear un notebook o cuaderno de notas para el análisis de los datos.

  • Puede encontrar ejemplos de como realizarlo en este capítulo de r4ds.

  • Debe realizar al menos tres gráficos distintos (por ejemplo usando ggplot2).

¿Qué se espera de este punto?

  • Indicar para cada variable su tipo de dato, si presentan valores perdidos.
  • Presentar las variables/features del problema, explicando qué representan, explicar el significado de las features de las canciones en este apartado.
  • Mostrar correlaciones entre variables numéricas (corplot)
  • Mostrar la distribución de los valores de las variables (por ejemplo: histograma, diagrama de cajas, densidad)
  • Gráfico de pares de variables o feature plot (pairs)

BONUS: realizar más de tres (3) gráficos con ggplot2.

4- Clustering

Emplee un algoritmo de clustering sobre las features de las canciones.

Explique las elecciones para su diseño en su experimentación (pre-procesamiento, , creación de nuevas features, algoritmo, features a utilizar, etc).

BONUS: usar más de un algoritmo de clustering.

5 - Conclusiones y evaluación de resultados

  • Analice los resultados de los puntos anteriores.
  • Escriba conclusiones generales del trabajo.

6 - Entrega

Mediante pull request a este repo. DEADLINE TODO

6 - Referencias

Enlace Descripción
🔗 Datos de miércoles con Rspotify
🔗 Traducción (en proceso) al español de "R for Data Science"
🔗 Happy Git with R
🔗 Blog del paquete Rspotify
🔗 Dplyr, manipulacion datos, Hoja machete
🔗 Purrr, toolkit programación funcional, funciones sobre arreglos/data.frames

Enlaces extras

Enlace Descripción
🔗 El libro "R for Data Science" en inglés
🔗 Libro: Fundamentals of data visualization
🔗 Libro: Advanced R
🔗 Libro: R Graphics Cookbook, 2nd edition
🔗 Libro: Efficient R programming
You can’t perform that action at this time.