In [1]:
import pandas as pd
import numpy as np

In [2]:
# This will allow you to see all column names & rows when you are doing .head(). None of the column name will be truncated.
# source: https://stackoverflow.com/questions/49188960/how-to-show-all-of-columns-name-on-pandas-dataframe

pd.set_option('display.max_columns', None)
# pd.set_option('display.max_rows', None)

In [3]:
# source: https://gist.github.com/rozanecm/38f2901c592bdffc40726cb0473318cf
# Function which plays a beep of given duration and frequency.
# Useful for when executing things that need a while to finish, to get notified.
import os
def beep(duration = 1, freq = 1500):
    """ play tone of duration in seconds and freq in Hz. """
    os.system('play --no-show-progress --null --channels 1 synth %s sine %f' % (duration, freq))

In [4]:
train = pd.read_csv('../data/train.csv', dtype={'tipodepropiedad':'category', 'ciudad':'category', 'provincia':'category', 'id':'int32', 'antiguedad':'float16', 'habitaciones':'float16', 'garages':'float16', 'banos':'float16', 'metroscubiertos':'float16', 'metrostotales':'float16', 'idzona':'float16', 'lat':'float16', 'lng':'float16', 'gimnasio':'bool', 'usosmultiples':'bool', 'piscina':'bool', 'escuelascercanas':'bool', 'centroscomercialescercanos':'bool'}, parse_dates=['fecha'])
test = pd.read_csv('../data/test.csv', dtype={'tipodepropiedad':'category', 'ciudad':'category', 'provincia':'category', 'id':'int32', 'antiguedad':'float16', 'habitaciones':'float16', 'garages':'float16', 'banos':'float16', 'metroscubiertos':'float16', 'metrostotales':'float16', 'idzona':'float16', 'lat':'float16', 'lng':'float16', 'gimnasio':'bool', 'usosmultiples':'bool', 'piscina':'bool', 'escuelascercanas':'bool', 'centroscomercialescercanos':'bool'}, parse_dates=['fecha'])

Juntemos ambos datasets, ya que en definitiva no tiene sentido la distincion train/test, ya que la mismo ha sido creada con otra variable objetivo en mente.

In [5]:
joined = train.drop('precio',axis=1).append(test, sort=False)

In [6]:
joined['ciudad'] = joined['ciudad'].astype('category')

joined['tipodepropiedad'] = joined['tipodepropiedad'].astype('category')

In [7]:
joined.dtypes

id                                     int32
titulo                                object
descripcion                           object
tipodepropiedad                     category
direccion                             object
ciudad                              category
provincia                           category
antiguedad                           float16
habitaciones                         float16
garages                              float16
banos                                float16
metroscubiertos                      float16
metrostotales                        float16
idzona                               float16
lat                                  float16
lng                                  float16
fecha                         datetime64[ns]
gimnasio                                bool
usosmultiples                           bool
piscina                                 bool
escuelascercanas                        bool
centroscomercialescercanos              bool
dtype: obj

In [8]:
del train
del test

# Que variables hay que completar?

In [9]:
(joined.isna().sum()/joined.shape[0]*100).sort_values()

id                             0.000000
piscina                        0.000000
usosmultiples                  0.000000
gimnasio                       0.000000
fecha                          0.000000
escuelascercanas               0.000000
centroscomercialescercanos     0.000000
tipodepropiedad                0.017667
provincia                      0.065667
ciudad                         0.151667
descripcion                    0.673333
titulo                         2.255000
metroscubiertos                7.233000
habitaciones                   9.366333
banos                         10.925000
idzona                        11.933333
garages                       15.696000
antiguedad                    18.089667
metrostotales                 21.374000
direccion                     22.087667
lat                           51.394333
lng                           51.394333
dtype: float64

In [10]:
# Define a seed, so all algorithms that accept a seed, take the same, for consistency reasons,
# so everything can be replicated without problems random state
seed=42

# tipodepropiedad

In [11]:
target_variable = 'tipodepropiedad'

En primer lugar creamos una variable que indica si el dato estuvo originalmente presente o no.

In [12]:
joined['tiene_tipodepropiedad'] = joined['tipodepropiedad'].notna()

In [13]:
train_tipodepropiedad = joined.loc[joined['tiene_tipodepropiedad']]

test_tipodepropiedad = joined.loc[~joined['tiene_tipodepropiedad']]

In [29]:
list(train_tipodepropiedad[target_variable].unique())

['Apartamento',
 'Casa en condominio',
 'Casa',
 'Terreno',
 'Terreno comercial',
 'Local Comercial',
 'Quinta Vacacional',
 'Oficina comercial',
 'Edificio',
 'Casa uso de suelo',
 'Local en centro comercial',
 'Bodega comercial',
 'Otros',
 'Villa',
 'Duplex',
 'Inmuebles productivos urbanos',
 'Departamento Compartido',
 'Nave industrial',
 'Rancho',
 'Terreno industrial',
 'Huerta',
 'Lote',
 'Hospedaje',
 'Garage']

In [31]:
pd.set_option('display.max_colwidth', -1)

In [46]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 230046,target_variable] = 'Casa'

In [47]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 68458,target_variable] = 'Apartamento'

In [48]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 48797,target_variable] = 'Casa'

In [49]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 111329,target_variable] = 'Casa'

In [50]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 231968,target_variable] = 'Casa'

In [55]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 1517,target_variable] = 'Casa'

In [54]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 78161,target_variable] = 'Terreno'

In [57]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 170109,target_variable] = 'Local Comercial'

In [59]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 49448,target_variable] = 'Apartamento'

In [61]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 273036,target_variable] = 'Casa'

In [63]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 24043,target_variable] = 'Local Comercial'

In [65]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 162314,target_variable] = 'Quinta Vacacional'

In [67]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 11234,target_variable] = 'Casa'

In [69]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 34286,target_variable] = 'Casa en condominio'

In [71]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 286805,target_variable] = 'Casa'

In [73]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 188386,target_variable] = 'Casa'

In [75]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 271322,target_variable] = 'Local Comercial'

In [77]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 244122,target_variable] = 'Casa en condominio'

In [79]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 208435,target_variable] = 'Casa'

In [81]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 268952,target_variable] = 'Terreno'

In [83]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 287353,target_variable] = 'Oficina comercial'

In [85]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 208660,target_variable] = 'Casa'

In [90]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 247550,target_variable] = 'Casa en condominio'

In [92]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 121158,target_variable] = 'Casa'

In [94]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 87335,target_variable] = 'Casa'

In [96]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 116902,target_variable] = 'Terreno comercial'

In [98]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 217445,target_variable] = 'Casa'

In [100]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 155495,target_variable] = 'Casa'

In [102]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 38804,target_variable] = 'Casa'

In [104]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 158166,target_variable] = 'Casa'

In [106]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 147449,target_variable] = 'Terreno'

In [108]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 170284,target_variable] = 'Local Comercial'

In [110]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 82387,target_variable] = 'Casa'

In [112]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 249147,target_variable] = 'Terreno'

In [114]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 56531,target_variable] = 'Casa'

In [116]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 238121,target_variable] = 'Local Comercial'

In [118]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 223385,target_variable] = 'Terreno'

In [120]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 11970,target_variable] = 'Casa'

In [122]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 132580,target_variable] = 'Local Comercial'

In [124]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 293611,target_variable] = 'Terreno'

In [131]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 122418,target_variable] = 'Casa'

In [133]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 261646,target_variable] = 'Casa'

In [135]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 268706,target_variable] = 'Terreno'

In [137]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 212213,target_variable] = 'Local Comercial'

In [139]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 155905,target_variable] = 'Casa'

In [141]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 94767,target_variable] = 'Casa'

In [143]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 177475,target_variable] = 'Casa en condominio'

In [145]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 283008,target_variable] = 'Local Comercial'

In [147]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 31177,target_variable] = 'Local Comercial'

In [149]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 290726,target_variable] = 'Quinta Vacacional'

In [151]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 288517,target_variable] = 'Casa'

In [153]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 274853,target_variable] = 'Casa'

In [155]:
test_tipodepropiedad.loc[test_tipodepropiedad['id'] == 22332,target_variable] = 'Casa'

In [156]:
test_tipodepropiedad[['id','titulo','descripcion',target_variable]]

Unnamed: 0,id,titulo,descripcion,tipodepropiedad
5307,230046,casas en venta,"en juriquilla. detras de la uvm, tres recamaras, sala ,comedor, cisterna,construcciã¯â¿â½n con tabique rojo.",Casa
8273,68458,"departamento en la playa, chicxulub","<p>13 departamentos vacacionales con acabados de lujo y amenidades\n</p><p>de primer nivel.\n</p><p>\n</p><p>acqua siete es el primer desarrollo de residencias verticales frente al mar que combina la serena belleza natural de las playas de chicxulub, con la conveniencia de una ubicación extraordinaria en la que todos los servicios están al alcance de la mano. \n</p><p>condominios amplios con insuperables vistas y dotados de lujosas amenidades a 15 minutos del norte de mérida, un lugar que querrás volver y disfrutar todos los días del año. \n</p><p>acqua siete está hecho para disfrutarse todo el año. no importa el día, ni la hora del año, usted y su familia siempre podrá disfrutar de su departamento y de las áreas comunes gracias a un equipo de mantenimiento y servicio activo todo el año. \n</p><p>equipamiento: \n</p><p>el proyecto arquitectónico fue concebido para sorprender y distinguirse pero también para procurar la creación de una exclusiva comunidad de residentes que compartan su pasión por el mar, la playa y todo lo que la costa yucateca tiene para ofrecer. \n</p><p>proponemos 2 plantas arquitectónicas para elegir de acorde a los requerimientos de distribución, pero también a los gustos de los residentes. en todas ellas se busca maximizar y abrir al exterior al paisaje marino que lo rodea.\n</p><p>el complejo contara con: \n</p><p> 13 condominios y 2 pent house en una torre de 8 niveles\n</p><p> elevadores\n</p><p> control de acceso de vigilancia todos los días del año \n</p><p> estacionamiento \n</p><p> bodegas\n</p><p> albercas con chapoteadero \n</p><p> solárium \n</p><p> jardines \n</p><p> palapa bar \n</p><p>todos los condominios contaran con: \n</p><p> sala, comedor , cocina con vista al mar gracias a su diseño tipo open plan \n</p><p> terraza techada \n</p><p> baño de visitas\n</p><p> bodega \n</p><p> tres recamaras con baño y closet \n</p><p> cuarto de servicio con baño \n</p><p> área de lavado \n</p><p> estacionamiento para dos vehículos \n</p><p>pent house con roof garden: \n</p><p>penthouse m2 totales de los cuales son 86.22 m2 de roof garden y 237 m2 de área interior \n</p><p>penthouse m2 totales de los cuales son 80.22 m2 de roof garden y 260 m2 de área interior.\n</p><p>\n</p><p>*precios más iva\n</p><p></p><p>otras características:</p><p>número de elevadores: 2, espacios para autos: 2, </p>",Apartamento
13957,48797,casas de campo en venta real del potosi,"casa en real del potosã?â­, cuenta con: 1 casa de dos plantas, recibidor, sala, comedor, cocina, medio baã?â±o. p.a. hall de tv, 3 recã?â¡maras la ppal. con baã?â±o y vestidor las otras comparte baã?â±o. tambiã?â©n cuenta con un departamento con sala - comedor 2 recã?â¡maras con closet y un baã?â±o completo con tina. cochera techada para 4 autos. tambiã?â©n cuenta con salã?â³n de juegos, con baã?â±o completo. cuarto de servicio, terraza de fiestas, cuarto de herramientas, otra pequeã?â±a casita con baã?â±o, un pequeã?â±o chapoteadero, ã?â¡rboles frutales, dos entradas por diferentes calles, muy cerca de la casa club.",Casa
15598,111329,casas en venta villa magna,"espectacular casa en esquina con vista a la ciudad en villa magna. en la primera planta cuenta con doble altura sala, comedor, medio baã?â±o, cocina integral con granito muy amplia, jardã?â­n, cochera techada para dos autos, y entrada independiente al jardã?â­n. en la segunda planta cuenta con hall de tv. 3 recã?â¡maras con baã?â±os y closets barandal con vidrio templado y acero inoxidable asã?â­ como 2 terracitas en cuartos y en la tercera planta un roof garden que abarca toda la dimensiã?â³n de la casa con asador una vista impresionante y un cuarto con baã?â±o completo, entrada independiente para ã?â¡rea de lavado. ã?â¡ã?â¡ã?â¡conoceme te encantara!!!\n\nterreno 220 m2 / construcciã?â³n 350 m2",Casa
15763,231968,casas de campo en venta santa maria del rio,"agua, luz, fosa septica, aljibe de 18m3, 4 rec, 2 baã?â??os, sala, comedor, cocina, cava, lamacen, cto de lavado",Casa
16949,1517,venta de casa en boca del río,"casa con terreno con excelente ubicacion, zona de gran plusvalia y crecimiento, a una cuadra del boulevard miguel aleman, sobre avenida principal, ideal para construir desarrollos, condominios u oficina. casa muy fresca lista para habitarse, ladosombra, cuenta con sala, comedor, cocina, 2 baños completos, 2 recamaras, terraza y jardin trasero. informes asesor gabriela campos",Casa
17512,78161,terrenos en venta san luis,,Terreno
20067,170109,comercio - blvd. interlomas,"excelente local comercial ubicado en la planta baja del centro comercial interlomas a unos metros del restaurante matisse, cuenta con un tapanco de aproximadamente 10 metros, area de recepcion y tres privados, 2 cajones de estacionamiento.\nmantenimiento de pesos",Local Comercial
25310,49448,departamento villas wayak modelo xel- há 2 nivel,"<p>disfrute una majestuosa vista al mar desde uno de nuestros cómodos departamentos, que te ofrecen a ti y a tu familia amplios espacios y una ubicación privilegiada.\n</p><p>\n</p><p>12 amplios departamentos.\n</p><p>4 penthouse con solarium.\n</p><p>elija el estilo de departamento que se ajuste a su gusto:\n</p><p>\n</p><p>departamento suite\n</p><p>departamento estudio\n</p><p>penthouse\n</p><p>villas wayak ofrece a sus residentes lujosas instalaciones recreativas y de esparcimiento familiar para disfrutar de un estilo de vida privilegiado.\n</p><p>\n</p><p>nuestras áreas han sido creadas para todos los gustos y necesidades, desde diversión hasta encontrar un espacio único para relajarse dentro de un entorno natural.</p><p>otras características:</p><p>número de elevadores: 1, vigilancia: si, </p>",Apartamento
26290,273036,casas en venta minas del real,"patio trasero, reja de malla",Casa


# metroscubiertos

In [13]:
target_variable = 'metroscubiertos'

En primer lugar creamos una variable que indica si el dato estuvo originalmente presente o no.

In [8]:
train['tiene_metroscubiertos'] = train['metroscubiertos'].notna()
test['tiene_metroscubiertos'] = test['metroscubiertos'].notna()

In [10]:
train[['antiguedad','tiene_antiguedad']].sample(5)

Unnamed: 0,antiguedad,tiene_antiguedad
55505,19.0,True
102768,10.0,True
77276,,False
97701,,False
160342,10.0,True


In [11]:
train_tiene_antiguedad = train.loc[train['tiene_antiguedad']]

train_no_tiene_antiguedad = train.loc[~train['tiene_antiguedad']]

test_tiene_antiguedad = test.loc[test['tiene_antiguedad']]

test_no_tiene_antiguedad = test.loc[~test['tiene_antiguedad']]

In [12]:
from sklearn.model_selection import GridSearchCV
import lightgbm as lgb

gbm = lgb.LGBMRegressor(silent=False)

param_dist = {"max_depth": [25,50, 75],
              "learning_rate" : [0.01,0.05,0.1],
              "num_leaves": [300,900,1200],
              "n_estimators": [50,100,200]
             }

grid_search = GridSearchCV(gbm, n_jobs=-1, param_grid=param_dist, cv = 3, scoring="neg_mean_absolute_error", verbose=5)
print("performing grid search...")
grid_search.fit(train_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                train_tiene_antiguedad[target_variable])

print("best estimator:", grid_search.best_estimator_)

print("training train gbm...")
grid_search.best_estimator_.fit(train_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                train_tiene_antiguedad[target_variable], sample_weight=None, init_score=None, eval_set=None, eval_names=None,
                                eval_sample_weight=None, eval_init_score=None, eval_metric='mae', early_stopping_rounds=None,
                                verbose=False, feature_name='auto', categorical_feature=['tipodepropiedad', 'ciudad','provincia'], callbacks=None)

print("predicting new train values...")
# prediciendo valores posta...
predictions_train = grid_search.best_estimator_.predict(train_no_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                                        num_iteration=gbm_optimized.best_iteration_)

print("training test gbm...")
grid_search.best_estimator_.fit(test_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                test_tiene_antiguedad[target_variable], sample_weight=None, init_score=None, eval_set=None, eval_names=None,
                                eval_sample_weight=None, eval_init_score=None, eval_metric='mae', early_stopping_rounds=None,
                                verbose=False, feature_name='auto', categorical_feature=['tipodepropiedad', 'ciudad','provincia'], callbacks=None)

print("predicting new test values...")
# prediciendo valores posta...
predictions_test = grid_search.best_estimator_.predict(test_no_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                                       num_iteration=gbm_optimized.best_iteration_)

performing grid search...
Fitting 3 folds for each of 81 candidates, totalling 243 fits


[Parallel(n_jobs=-1)]: Using backend LokyBackend with 4 concurrent workers.
[Parallel(n_jobs=-1)]: Done  10 tasks      | elapsed:   55.1s


KeyboardInterrupt: 

# Antiguedad

In [7]:
target_variable = 'antiguedad'

En primer lugar creamos una variable que indica si el dato estuvo originalmente presente o no.

In [8]:
train['tiene_antiguedad'] = train['antiguedad'].notna()
test['tiene_antiguedad'] = test['antiguedad'].notna()

In [10]:
train[['antiguedad','tiene_antiguedad']].sample(5)

Unnamed: 0,antiguedad,tiene_antiguedad
55505,19.0,True
102768,10.0,True
77276,,False
97701,,False
160342,10.0,True


In [11]:
train_tiene_antiguedad = train.loc[train['tiene_antiguedad']]

train_no_tiene_antiguedad = train.loc[~train['tiene_antiguedad']]

test_tiene_antiguedad = test.loc[test['tiene_antiguedad']]

test_no_tiene_antiguedad = test.loc[~test['tiene_antiguedad']]

In [12]:
from sklearn.model_selection import GridSearchCV
import lightgbm as lgb

gbm = lgb.LGBMRegressor(silent=False)

param_dist = {"max_depth": [25,50, 75],
              "learning_rate" : [0.01,0.05,0.1],
              "num_leaves": [300,900,1200],
              "n_estimators": [50,100,200]
             }

grid_search = GridSearchCV(gbm, n_jobs=-1, param_grid=param_dist, cv = 3, scoring="neg_mean_absolute_error", verbose=5)
print("performing grid search...")
grid_search.fit(train_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                train_tiene_antiguedad[target_variable])

print("best estimator:", grid_search.best_estimator_)

print("training train gbm...")
grid_search.best_estimator_.fit(train_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                train_tiene_antiguedad[target_variable], sample_weight=None, init_score=None, eval_set=None, eval_names=None,
                                eval_sample_weight=None, eval_init_score=None, eval_metric='mae', early_stopping_rounds=None,
                                verbose=False, feature_name='auto', categorical_feature=['tipodepropiedad', 'ciudad','provincia'], callbacks=None)

print("predicting new train values...")
# prediciendo valores posta...
predictions_train = grid_search.best_estimator_.predict(train_no_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                                        num_iteration=gbm_optimized.best_iteration_)

print("training test gbm...")
grid_search.best_estimator_.fit(test_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                test_tiene_antiguedad[target_variable], sample_weight=None, init_score=None, eval_set=None, eval_names=None,
                                eval_sample_weight=None, eval_init_score=None, eval_metric='mae', early_stopping_rounds=None,
                                verbose=False, feature_name='auto', categorical_feature=['tipodepropiedad', 'ciudad','provincia'], callbacks=None)

print("predicting new test values...")
# prediciendo valores posta...
predictions_test = grid_search.best_estimator_.predict(test_no_tiene_antiguedad.drop(['id','fecha','titulo', 'descripcion', 'direccion','precio',target_variable],axis=1),
                                                       num_iteration=gbm_optimized.best_iteration_)

performing grid search...
Fitting 3 folds for each of 81 candidates, totalling 243 fits


[Parallel(n_jobs=-1)]: Using backend LokyBackend with 4 concurrent workers.
[Parallel(n_jobs=-1)]: Done  10 tasks      | elapsed:   55.1s


KeyboardInterrupt: 

In [None]:
beep()