Este proyecto se corresponde con una competición en Kaggle de Ciencia de Datos. Concretamente con la predicción del precio de las viviendas de acuerdo a una serie de características.
Campeonato Ciencia de datos Kaggle
En mi caso participé con el Alias Iván Rodríguez (UGR) quedando finalmente en la posición 751 de 4.194 participantes en total, con un score de 0,12010 .
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/leaderboard
Como se puede ver el repositorio está compuesto por un directorio llamado DATASET que contiene los datos de partida (Train y Test), un documento PDF llamado Práctica3 que contiene una descripción del proceso que se ha llevado a cabo para la competición, y por último tenemos una serie de directorios con la fecha, cada uno contiene un script en Python con el que se ejecutó a los diferentes algoritmos y un fichero CSV que contiene los datos calculados por el script para subirlos a Kaggle y que nos devuelva el score obtenido.
Este proyecto está enfocado para el aprendizaje de técnicas de Inteligencia de Negocio haciendo uso de Python y diferentes librerías que tienen integrados los algoritmos a usar.
https://es.wikipedia.org/wiki/Gradient_boosting
https://en.wikipedia.org/wiki/Elastic_net_regularization
https://en.wikipedia.org/wiki/Artificial_neural_network
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
https://es.wikipedia.org/wiki/Random_forest