Skip to content
Microsoft Kaggle Competition
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
ETL actualizacion de los ficheros npy Mar 8, 2019
Notebooks Implementacion CatBoost Mar 13, 2019
aws Update some stuff Mar 9, 2019
bbdd
doc Red Neuronal. No funciona todavía, algo pasa con las dimensiones. Ocu… Mar 11, 2019
gist
model Implementacion CatBoost Mar 13, 2019
.gitignore Inicio del modelo de XGBoost y prueba de FFM Mar 3, 2019
README.md Preparing repo for public Apr 22, 2019
__init__.py
generador_schema_pandas.py Actualizacion fechas, kmeans y adicion de los groupBys. datos V4 Mar 7, 2019
requirements.txt Add catboost to requirements Mar 13, 2019
tablon.sh Preparing repo for public Apr 22, 2019
tablon_amazon.sh Preparing repo for public Apr 22, 2019
tablon_modelos.sh Preparing repo for public Apr 22, 2019

README.md

Microsoft Kaggle Competition

Descripción.

Este es el repositorio de código de Mapsa Team para la competición de Kaggle de Microsoft.

Se obtuvo la novena posición en el leaderboard privado.

Informacion del repositorio

Realizado por:

Nombre Email
Rodrigo Gomez Rodriguez rodgomrod@gmail.com
Carlos Sevilla Barceló c.sevilla.barcelo@gmail.com

Para obtener los datos, hay que lanzar tablon.sh o tablon_amazon.sh, teniendo previamente los datos de la competición en la carpeta data.

Los modelos están en la carpeta model. Todos requieren que los datos de train y test estén generados.

El término Tablón se refiere al script que genera el dataset de train y test.

Estructura del repositorio:

  • AWS: Scripts para lanzar el tablón en AWS.
  • bbdd: Scripts para instalar postgre y mongosql. No se usaron finalmente durante la competición
  • doc: Distintos .txt con información de las variables, que proporciona Kaggle.
  • ETL: Aquí están los scripts que utiliza el tablón para generar los datos
  • gist: Diferentes scripts importantes que se han utilizado a lo largo de la competición que deben guardarse.
  • model: Scripts que lanzan los modelos utilizados durante la competición. Están adaptados para que reciban los hyperparametros del modelo desde la consola.
  • Notebooks: Diferentes notebooks usados durante la competición. No están pensados para su lectura, debido a que no están todos bien documentados.
You can’t perform that action at this time.