In [1]:
import pandas as pd
import numpy as np
import sys
import os
sys.path.append('..')

import warnings
import matplotlib.pyplot as plt
import plotly.express as px
import numpy as np
import pandas as pd
pd.options.mode.chained_assignment = None
import seaborn as sns

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import RidgeCV
from sklearn.model_selection import train_test_split, cross_validate
from sklearn.metrics import mean_squared_error

In [7]:
import os
pathdata = './../../../datasets/'
pathresults = 'results'
if not os.path.exists(pathresults):
    os.makedirs(pathresults)

In [8]:
# Función para predecir el valor del DSR en las especies de lenteja evaluadas por su resistencia a la roya en el futuro.

def predict_future(regressor, scaler, df_future, models):

    predictions_future = {}   
    
    # Voy guardando los índices para, después de entrenar todos los modelos, quedarme con el valor medio
    future_index = df_future.index.values

    # Del total del dataset voy seleccionando la bio_1 (temperatura media anual) y la bio_12 (precipitacion) de cada uno de los modelos
    for m in models:
        futuro_model = df_future[['DECLONGITUDE','DECLATITUDE',m, m+'_B12', 'srad_12', 'srad_annual', 't_bulk_dens', 't_sand', 't_soilwater_cap', 't_teb']]
        futuro_model = futuro_model.rename(columns={m: 'CURRENT_BIO1', m+'B12': 'CURRENT_BIO12'})

        futuro_test_pred_scaled = scaler.transform(futuro_model)

        # Todas las predicciones las voy guardando en un diccionario en el que la clave es el nombre del modelo_escenario
        predictions_future[m] = regressor.predict(futuro_test_pred_scaled)

    return future_index, predictions_future


In [9]:
# Función para predecir el valor del DSR en las especies de lenteja silvestres en el presente.

def silvestres_predict_present(regressor, scaler, df_present):
        
    # Voy guardando los índices para, después de entrenar todos los modelos, quedarme con el valor medio
    silvestres_present_index = df_present.index.values
    
    lentejas_silvestres_scaled = scaler.transform(df_present)
    predictions_silvestres_presente = regressor.predict(lentejas_silvestres_scaled)

    return silvestres_present_index, predictions_silvestres_presente

## MODELOS Y ESCENARIO A EVALUAR

In [10]:
models = ['BCC_126', 'BCC_370', 'BCC_585', 'CNRM_126', 'CNRM_370','CNRM_585', 'IPSL_126', 'IPSL_370', 'IPSL_585']

## **LENTEJAS EVALUADAS POR SU RESISTENCIA A LA ROYA**

## Load Data Lentejas Roya: Temperatura y Precipitación

In [11]:
roya_raw = pd.read_csv(pathdata+"DatosPrecip/ROYA_Completa_fut_pres.txt",decimal=',',sep= '\t')

# Me quedo solo con las columnas de latitud, longitud, predicciones de bio_1 y bio_12 para el presente y el futuro
cols_to_drop = list(roya_raw.columns[0:5]) + list(roya_raw.columns[[7, 8, 9, 10]])
roya_raw = roya_raw.drop(cols_to_drop, axis = 1)

# Renombro y transformo a float las columnas para mantener el mismo formato en todos los datasets
roya_raw = roya_raw.rename(columns={'Longitude': 'DECLONGITUDE', 'Latitude': 'DECLATITUDE'})
roya_raw = roya_raw.applymap(lambda x: float(x))

roya_raw[['BBC_126', 'BBC_370', 'BBC_585', 'CNRM_126', 'CNRM_370','CNRM_585', 'IPSL_126', 'IPSL_370', 'IPSL_585']] = roya_raw[['BBC_126', 'BBC_370', 'BBC_585', 'CNRM_126', 'CNRM_370','CNRM_585', 'IPSL_126', 'IPSL_370', 'IPSL_585']].applymap(lambda x: x*10)
roya_raw.drop_duplicates(inplace = True)

roya_raw.head(1)

Unnamed: 0,DECLATITUDE,DECLONGITUDE,BBC_126,BBC_370,BBC_585,CNRM_126,CNRM_370,CNRM_585,IPSL_126,IPSL_370,...,BCC_370_B12,BCC_585_B12,IPSL_126_B12,IPSL_370_B12,IPSL_585_B12,CNRM_126_B12,CNRM_370_B12,CNRM_585_B12,CURRENT_BIO1,CURRENT_BIO12
0,37.491944,-2.773611,152.875004,155.166664,157.624998,154.458332,153.374996,154.958334,155.333328,155.749998,...,402.0,389.0,375.0,377.0,366.0,393.0,386.0,380.0,142.839996,443.359985


In [12]:
print(roya_raw.shape)

(247, 22)


## Load Data Lentejas Roya: radiación, condiciones del suelo y DSR

In [13]:
# Cargamos el dataset con todas las variables de radiación, condiciones del suelo, DSR y coordenadas para las lentejas
# evaluadas por su resistencia la roya en el presente.

roya = pd.read_csv(pathdata+"DatosPresente/fichtraining_ROYA_CAMPO_nondup.csv",decimal=',',sep=';',)
roya = roya[['srad_12', 'srad_annual', 't_bulk_dens', 't_sand', 't_soilwater_cap', 't_teb', 'DECLONGITUDE','DECLATITUDE','ROYA_CAMPO_AVERAGE_DSR']]

roya.head(1)

Unnamed: 0,srad_12,srad_annual,t_bulk_dens,t_sand,t_soilwater_cap,t_teb,DECLONGITUDE,DECLATITUDE,ROYA_CAMPO_AVERAGE_DSR
0,5194,14868.75,1451.699951,37.0,23.700001,28.799999,5.133333,43.916667,0.0


In [14]:
print(roya.shape)

(255, 9)


## Dataset Lentejas Roya Presente

In [15]:
# Unimos las condiciones de radiación y el suelo, con el valor de temperatura y precipitación para el presente.

roya_presente = pd.merge(roya_raw[['DECLONGITUDE','DECLATITUDE','CURRENT_BIO1', 'CURRENT_BIO12']],roya, how='inner', on = ['DECLONGITUDE','DECLATITUDE'])
roya_presente.drop_duplicates(subset = ['DECLONGITUDE','DECLATITUDE'], inplace = True)
roya_presente.head()

Unnamed: 0,DECLONGITUDE,DECLATITUDE,CURRENT_BIO1,CURRENT_BIO12,srad_12,srad_annual,t_bulk_dens,t_sand,t_soilwater_cap,t_teb,ROYA_CAMPO_AVERAGE_DSR
0,-2.773611,37.491944,142.839996,443.359985,7587,17020.333984,1501.800049,34.0,21.549999,19.799999,58.293233
1,-5.27,37.786944,178.600006,605.280029,7271,16987.083984,1526.949951,36.880001,22.775,23.476,61.787905
2,-17.758611,28.797222,191.125,370.3125,10670,18398.333984,1358.599976,47.0,26.575001,10.0,70.940348
3,-3.956667,37.768889,165.479996,563.799988,7406,16711.083984,1518.650024,33.959999,23.549999,26.976,77.256578
4,-4.855556,42.221667,116.400002,489.720001,4885,14776.583008,1515.974976,19.0,21.0,46.599998,72.408651


In [16]:
print(roya_presente.shape)

(247, 11)


## Dataset Lentejas Roya Futuro

In [17]:
# Unimos las condiciones de radiación y el suelo, con el valor de temperatura y precipitación para el presente.

roya_futuro = pd.merge(roya_raw[roya_raw.columns[0:20]],roya, how='inner', on = ['DECLONGITUDE','DECLATITUDE'])
roya_futuro = roya_futuro.rename(columns={'BBC_126': 'BCC_126', 'BBC_370': 'BCC_370', 'BBC_585': 'BCC_585'})
roya_futuro.drop_duplicates(subset = ['DECLONGITUDE','DECLATITUDE'], inplace = True)
roya_futuro.head()

Unnamed: 0,DECLATITUDE,DECLONGITUDE,BCC_126,BCC_370,BCC_585,CNRM_126,CNRM_370,CNRM_585,IPSL_126,IPSL_370,...,CNRM_126_B12,CNRM_370_B12,CNRM_585_B12,srad_12,srad_annual,t_bulk_dens,t_sand,t_soilwater_cap,t_teb,ROYA_CAMPO_AVERAGE_DSR
0,37.491944,-2.773611,152.875004,155.166664,157.624998,154.458332,153.374996,154.958334,155.333328,155.749998,...,393.0,386.0,380.0,7587,17020.333984,1501.800049,34.0,21.549999,19.799999,58.293233
1,37.786944,-5.27,187.000008,189.083328,192.333336,188.500004,187.625008,188.999996,188.833332,189.16666,...,527.0,523.0,515.0,7271,16987.083984,1526.949951,36.880001,22.775,23.476,61.787905
2,28.797222,-17.758611,195.0,195.958328,197.875004,198.33334,198.624992,198.95834,197.333336,197.875004,...,328.0,320.0,315.0,10670,18398.333984,1358.599976,47.0,26.575001,10.0,70.940348
3,37.768889,-3.956667,175.750008,178.125,180.916672,177.208328,176.291676,177.91666,178.083344,178.416672,...,471.0,460.0,459.0,7406,16711.083984,1518.650024,33.959999,23.549999,26.976,77.256578
4,42.221667,-4.855556,128.208332,131.04167,134.041672,130.500002,129.291668,130.333338,131.916666,132.958336,...,468.0,455.0,460.0,4885,14776.583008,1515.974976,19.0,21.0,46.599998,72.408651


In [18]:
print(roya_futuro.shape)

(247, 27)


# LENTEJAS SILVESTRES

## Dataset Lentejas Silvestres Presente

In [19]:
lentejas_silvestres = pd.read_excel(pathdata+"DatosPresente/SupplementaryTable3_RubioTeso_etal_Martonne_bio12.xlsx")

# Renombro y transformo las columnas (la temperatura se debe multiplicar por 10 para estar en el mismo orden) para 
# mantener el mismo formato en todos los datasets
lentejas_silvestres = lentejas_silvestres.rename(columns={'Longitude_decimal': 'DECLONGITUDE', 'Latitude_decimal': 'DECLATITUDE', 'bio_12' : 'CURRENT_BIO12'})
lentejas_silvestres['CURRENT_BIO1'] = lentejas_silvestres.bio_1.apply(lambda x: x*10)
lentejas_silvestres.drop('bio_1', axis = 1, inplace = True)

lentejas_silvestres = lentejas_silvestres[['DECLONGITUDE','DECLATITUDE','CURRENT_BIO1','CURRENT_BIO12','srad_12', 'srad_annual', 't_bulk_dens', 't_sand', 't_soilwater_cap','t_teb']]
lentejas_silvestres.drop_duplicates(subset = ['DECLONGITUDE','DECLATITUDE'], inplace = True)
lentejas_silvestres.dropna(inplace = True)

lentejas_silvestres.head()

Unnamed: 0,DECLONGITUDE,DECLATITUDE,CURRENT_BIO1,CURRENT_BIO12,srad_12,srad_annual,t_bulk_dens,t_sand,t_soilwater_cap,t_teb
0,22.502781,38.523891,99.448338,800.0,0.5364,14913.33301,1422.625,28.0,23.950001,37.599998
1,33.7,44.65,107.978334,496.0,0.5352,13129.16699,1484.375,21.0,23.825001,22.9
2,33.716667,44.483333,94.020004,571.0,0.5124,13137.33301,1451.25,23.0,24.15,22.1
3,34.5825,41.72472,80.598335,676.0,0.4556,14525.75,1402.900024,38.0,23.65,27.1
4,37.2,37.1,140.310001,580.0,0.5284,17900.0,1502.800049,26.0,24.9,13.4


In [20]:
lentejas_silvestres.shape

(613, 10)

## Dataset Lentejas Silvestres Futuro

In [21]:
silv_futuro = pd.read_csv(pathdata+"DatosPrecip/Len_silvestres_futuro_B1_B12.txt",decimal=',',sep= '\t')

# Me quedo sólo con las columnas relativas a las predicciones de bio_1 y bio_12 de los escenarios futuros
silv_futuro = silv_futuro[['bbc_126', 'bbc_370', 'bbc_585',
       'CNRM_126', 'CNRM_370', 'CNRM_585', 'IPSL_126', 'IPSL_370', 'IPSL_585',
       'BBC_126_B12', 'BBC_370_B12', 'BBC_585_B12', 'IPSL_126_B12',
       'IPSL_370_B12', 'IPSL_585_B12', 'CNRM_126_B12', 'CNRM_370_B12',
       'CNRM_585_B12',"DECLATITUD", "DECLONGITU"]]

# Renombro y transformo a float columnas para mantener el mismo formato en todos los datasets
silv_futuro = silv_futuro.rename(columns={'DECLONGITU': 'DECLONGITUDE', 'DECLATITUD': 'DECLATITUDE','bbc_126': 'BCC_126', 'bbc_370': 'BCC_370', 'bbc_585': 'BCC_585','BBC_126_B12':'BCC_126_B12', 'BBC_370_B12':'BCC_370_B12', 'BBC_585_B12':'BCC_585_B12'})
silv_futuro = silv_futuro.applymap(lambda x: float(x))

# La temperatura se debe multiplicar por 10 para estar en el mismo orden en todos los datasets. Descarto posibles duplicados
# en cuanto a las coordenadas y valores nulos
silv_futuro[models] = silv_futuro[models].applymap(lambda x: x * 10)
silv_futuro.drop_duplicates(subset = ['DECLONGITUDE','DECLATITUDE'], inplace = True)
silv_futuro.dropna(inplace = True)

# Para poder disponer de las condiciones de radiación, suelo... Extraigo esos valores del dataset de lentejas silvestres
# en el presente mediante el merge
silvest_futuro = pd.merge(silv_futuro,lentejas_silvestres, how='inner', on = ['DECLONGITUDE','DECLATITUDE'])
silvest_futuro.head()

Unnamed: 0,BCC_126,BCC_370,BCC_585,CNRM_126,CNRM_370,CNRM_585,IPSL_126,IPSL_370,IPSL_585,BCC_126_B12,...,DECLATITUDE,DECLONGITUDE,CURRENT_BIO1,CURRENT_BIO12,srad_12,srad_annual,t_bulk_dens,t_sand,t_soilwater_cap,t_teb
0,119.000006,117.958336,119.875002,115.958338,114.624996,118.33333,115.958328,116.833334,113.458338,584.0,...,44.404167,33.825,108.059521,562.0,0.554286,12971.75,1420.675049,0.0,24.950001,0.0
1,179.874992,181.124992,182.5,181.333332,179.79166,182.666664,181.333332,182.124996,180.708332,657.0,...,40.063611,18.466389,167.15477,658.0,0.92,15401.5,1487.474976,27.0,22.875,13.4
2,147.125006,148.083334,150.249996,149.375,147.458334,150.375004,148.291664,148.95833,147.791662,703.0,...,38.0833,28.2,143.915005,688.0,0.6364,17663.41602,1498.675049,80.0,22.325001,10.4
3,161.875,163.708324,165.541668,163.54166,162.124996,164.624996,163.54166,164.291668,162.666664,584.0,...,40.6,17.15,149.216671,584.0,0.8388,15037.66699,1488.724976,42.0,24.775,14.0
4,126.25,128.75,131.875,127.791672,126.000004,128.874998,127.458334,129.250002,126.416664,1082.0,...,45.5,15.5706,110.120001,1041.0,0.5488,12406.5,1445.849976,79.0,23.6,11.0


In [22]:
silvest_futuro.shape

(603, 28)

## MODEL TRAIN

In [None]:
warnings.filterwarnings("ignore")

index_roya_present = np.array([])
pred_values_roya_present = np.array([])

index_roya_future = np.array([])
results_roya_future_models = pd.Series([])

index_silvestes_present = np.array([])
silvestres_values_present = np.array([])

index_silvestes_future = np.array([])
results_silvestre_future_models = pd.Series([])

importances_ridge = {}
for col in list(roya_presente):
    if col!= 'ROYA_CAMPO_AVERAGE_DSR':
        importances_ridge[col] = []

error_values_ridge = []        

nexper = 500
for i in range(0, nexper):

    # Para realizar la predicción, descartamos la variable objetivo (ROYA_CAMPO_AVERAGE_DSR)
    variables_to_ignore = ['ROYA_CAMPO_AVERAGE_DSR']
    selected_features = [element for element in list(roya_presente) if element not in variables_to_ignore]
    
    df_model = roya_presente[selected_features]
    
    std_scaler = StandardScaler()
    
    std_scaler_model = std_scaler.fit(df_model)
    df_model = std_scaler_model.transform(df_model)
    
    
    "Division Train Test"
    
    X = pd.DataFrame(data = df_model, columns = selected_features)
    y = roya_presente.ROYA_CAMPO_AVERAGE_DSR

    X_train, X_test, y_train, y_test = train_test_split(X, y, train_size= 0.7)

    #Vamos a iterar el modelo 500 veces para quedarnos con el valor del DSR medio en cada predicción. Vamos concatenando en un array los índices que se han seleccionado para la matriz de test
    index_roya_present = np.concatenate((index_roya_present, roya_presente.iloc[X_test.index.values].index.values), axis=None)

    # Hacemos el entrenamiento del modelo con las lentejas evaluadas por su resistencia a la roya en el presente
    "Ridge"
    clf = RidgeCV(alphas=np.linspace(0.001, 1, 1000)).fit(X, y)
    clf.fit(X_train, y_train)
    predictions_roya_presente = clf.predict(X_test)
    pred_values_roya_present = np.concatenate((pred_values_roya_present, predictions_roya_presente), axis=None)
    
    # Me quedo con la importancia de cada una de las variables para todas las iteraciones del modelo
    for k in range(0, len(selected_features)):
        importances_ridge[selected_features[k]].append(clf.coef_[k])
    
    
    rmse_ridge = np.sqrt(mean_squared_error(y_test, predictions_roya_presente))
    error_values_ridge.append(rmse_ridge)
    
##############################################################################################################################
############################################ PREDICT ROYA FUTURE #############################################################
##############################################################################################################################
    results_roya_future_models_concat = pd.Series([])

    # Llamamos a la función para predecir el DSR de las lentejas en el futuro
    future_index, results_roya_future = predict_future(clf, std_scaler_model, roya_futuro, models)
    
    # Voy almacenando en una lista todos los índices y las predicciones que me va devolviendo la función
    index_roya_future = np.concatenate((index_roya_future, future_index), axis=None)

    # En este caso, lo que me devuelve la función es un diccionario. Necesito que para cada clave me genere una columna
    # diferente en un dataframe. De esta forma tengo un dataframe en el que almaceno, para cada columna, las predicciones
    # de cada uno de los modelos
    for m in models:
        results_roya_future_models_concat = pd.concat([results_roya_future_models_concat, pd.Series(results_roya_future[m])], axis = 1)

    # Renombro las columnas con el nombre de los modelos y borro la primera columna que se había generado automáticamente
    # con valores nulos
    results_roya_future_models_concat.columns = ['to_drop'] + models
    results_roya_future_models_concat.drop('to_drop', axis = 1, inplace = True)

    # Ese dataframe con las predicciones de cada modelo lo voy concatenando en cada iteración para tener un dataframe
    # con todas las predicciones de todos los modelos para todas las iteraciones
    results_roya_future_models = pd.concat([results_roya_future_models, results_roya_future_models_concat])
    
    
##############################################################################################################################
############################################ PREDICT SILVESTRES PRESENT ######################################################
##############################################################################################################################

    # Llamamos a la función para predecir el DSR de las lentejas silvestres en el presente
    silvestres_present_index, results_silvestres_present = silvestres_predict_present(clf, std_scaler_model, lentejas_silvestres)
    
    # Voy almacenando en una lista todos los índices y las predicciones que me va devolviendo la función
    index_silvestes_present = np.concatenate((index_silvestes_present, silvestres_present_index), axis=None)
    silvestres_values_present = np.concatenate((silvestres_values_present, results_silvestres_present), axis=None)
    
##############################################################################################################################
############################################ PREDICT SILVESTRES FUTURE #######################################################
##############################################################################################################################
    
    results_silvestre_future_models_concat = pd.Series([])
    
    # Llamamos a la función para predecir el DSR de las lentejas en el futuro. El procedimiento es el mismo
    # que para el caso de las lentejas evaluadas por su resistencia a la roya
    silvestre_future_index, results_silvestres_futuro = predict_future(clf, std_scaler_model, silvest_futuro, models)
    index_silvestes_future = np.concatenate((index_silvestes_future, silvestre_future_index), axis=None)

    for m in models:
        results_silvestre_future_models_concat = pd.concat([results_silvestre_future_models_concat, pd.Series(results_silvestres_futuro[m])], axis = 1)
    
    results_silvestre_future_models_concat.columns = ['to_drop'] + models
    results_silvestre_future_models_concat.drop('to_drop', axis = 1, inplace = True)

    results_silvestre_future_models = pd.concat([results_silvestre_future_models, results_silvestre_future_models_concat])

## RMSE RIDGE

In [None]:
arr = [error_values_ridge]
box = plt.boxplot(arr,labels=['Ridge'])
plt.show()

print("Ridge RMSE mean",np.mean(error_values_ridge))

## Feature Importance

In [None]:
importances_ridge_avg = {}

for k,v in importances_ridge.items():
    v_abs = [np.abs(val) for val in v]
    importances_ridge_avg[str(k)] = np.mean(v_abs)

{k: v for k, v in sorted(importances_ridge_avg.items(), key=lambda item: item[1])}

In [None]:
df = pd.DataFrame(data=importances_ridge)
df = (df.T)
df.to_excel(pathresults+"/feature_importances.xlsx", index=False)

## Resultados Data Lenteja Roya Presente

In [None]:
# Generamos un DF con los resultados para cada una de las iteraciones
results_roya_present = pd.concat([pd.Series(index_roya_present), pd.Series(pred_values_roya_present)], axis = 1)
results_roya_present.columns = ['test_index', 'DSR_prediction']
results_roya_present.head()

# Con el objetivo de conocer a qué especies corresponden, asociamos el índice con las coordenadas correspondientes
results_roya_present_loc = pd.merge(results_roya_present, roya_presente[['DECLATITUDE','DECLONGITUDE']].reset_index(), how = 'left', left_on=['test_index'],right_on=['index'])
results_roya_present_loc.to_excel(pathresults+"/Roya_Presente_all_iter.xlsx", index=False)

In [None]:
# Calculamos la mediana de cada una de las predicciones para conocer el DSR promedio
avg_results_roya_present = results_roya_present.groupby('test_index').median()
avg_results_roya_present.head()

# Con el objetivo de conocer a qué especies corresponden, asociamos el índice con las coordenadas correspondientes
results_roya_presente_loc = avg_results_roya_present.join(roya_presente[['DECLATITUDE','DECLONGITUDE','ROYA_CAMPO_AVERAGE_DSR']])
results_roya_presente_loc.to_excel(pathresults+"/Roya_Presente_avg.xlsx", index=False)
results_roya_presente_loc.head()

In [None]:
fig = px.scatter_geo(results_roya_presente_loc, lat="DECLATITUDE", lon="DECLONGITUDE", color="DSR_prediction")
fig.show()

## Resultados Data Lentejas Roya Futuro

In [None]:
# Generamos un DF con los resultados para cada una de las iteraciones
results_roya_future_models.drop(0, axis = 1, inplace = True)
results_roya_future_models['test_index'] = index_roya_future
results_roya_future_models.head()

# Con el objetivo de conocer a qué especies corresponden, asociamos el índice con las coordenadas correspondientes
results_roya_future_loc = pd.merge(results_roya_future_models, roya_presente[['DECLATITUDE','DECLONGITUDE']].reset_index(), how = 'left', left_on=['test_index'],right_on=['index'])
results_roya_future_loc.to_excel(pathresults+"/Roya_Future_all_iter.xlsx", index=False)
results_roya_future_loc.head()

In [None]:
avg_results_roya_future = results_roya_future_models.groupby('test_index').median()
avg_results_roya_future.head()

results_roya_future_loc = avg_results_roya_future.join(roya_presente[['DECLATITUDE','DECLONGITUDE','ROYA_CAMPO_AVERAGE_DSR']])
results_roya_future_loc.to_excel(pathresults+"/Roya_Future_avg.xlsx", index=False)
results_roya_future_loc.head()

In [None]:
for m in models:

    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("----------------------------"+str(m)+"---------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")

    
    fig = px.scatter_geo(results_roya_future_loc, lat="DECLATITUDE", lon="DECLONGITUDE", color= results_roya_future_loc[m] - results_roya_future_loc['ROYA_CAMPO_AVERAGE_DSR'])
    fig.show()


## Resultados Lentejas Silvestres Presente

In [None]:
results_present_silvestres = pd.concat([pd.Series(index_silvestes_present), pd.Series(silvestres_values_present)], axis = 1)
results_present_silvestres.columns = ['test_index', 'DSR_prediction']

results_present_silvestres_loc = pd.merge(results_present_silvestres, lentejas_silvestres[['DECLATITUDE','DECLONGITUDE']].reset_index(), how = 'left', left_on=['test_index'],right_on=['index'])
results_present_silvestres_loc.to_excel(pathresults+"/Silvestres_Presente_alliter.xlsx", index=False)



In [None]:
avg_present_silvestres = results_present_silvestres.groupby('test_index').median()
avg_present_silvestres.head()

results_silv_present_loc = avg_present_silvestres.join(lentejas_silvestres[['DECLATITUDE','DECLONGITUDE']])
results_silv_present_loc.to_excel(pathresults+"/Silvestres_Presente_avg.xlsx", index=False)
results_silv_present_loc.head()

In [None]:
fig = px.scatter_geo(results_silv_present_loc, lat="DECLATITUDE", lon="DECLONGITUDE", color="DSR_prediction")
fig.show()

## Resultados Lentejas Silvestres Futuro

In [None]:
results_silvestre_future_models.drop(0, axis = 1, inplace = True)
results_silvestre_future_models['test_index'] = index_silvestes_future
results_silvestre_future_models.head()

results_silvestre_future_models_loc = pd.merge(results_silvestre_future_models, silvest_futuro[['DECLATITUDE','DECLONGITUDE']].reset_index(), how = 'left', left_on=['test_index'],right_on=['index'])
results_silvestre_future_models_loc.to_excel(pathresults+"/Silvestres_Future_alliter.xlsx", index=False)

In [None]:
avg_future_results_silvestre = results_silvestre_future_models.groupby('test_index').median()
avg_future_results_silvestre.head()

results_silv_future_loc = avg_future_results_silvestre.join(results_silv_present_loc)
results_silv_future_loc.to_excel(pathresults+"/Silvestres_Future_avg.xlsx", index=False)
results_silv_future_loc.head()

In [None]:
for m in models:

    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("----------------------------"+str(m)+"---------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    
    results_silv_future_loc.to_excel(pathresults+"/Silvestres_Futuro_"+m+".xlsx", index=False)
    fig = px.scatter_geo(results_silv_future_loc, lat="DECLATITUDE", lon="DECLONGITUDE", color= results_silv_future_loc[m])
    fig.show()


In [None]:
for m in models:

    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("----------------------------"+str(m)+"---------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    print("-------------------------------------------------------------------")
    
    results_silv_future_loc.to_excel(pathresults+"/Silvestres_Futuro_"+m+".xlsx", index=False)
    fig = px.scatter_geo(results_silv_future_loc, lat="DECLATITUDE", lon="DECLONGITUDE", color= results_silv_future_loc[m] - results_silv_future_loc['DSR_prediction'])
    fig.show()
