# ERROR LOGARÍTMICO CUADRÁTICO MEDIO RMSLE (Mean Squared Logarithmic Error)

## Formula del RMSLE

RMSLE se usa cuando y tiene una larga cola de distribución , o cuando nos interesa el ratio de los valores verdaderos y los valores que se han predecido.
1 (la constante ) es añadido para evitar divergencia cuando y es igual a 0.

## Mecanismo:

    Es solo un error cuadrático medio (MSE) calculado en escala logarítmica. De hecho, para calcularlo, tomamos un logaritmo de nuestras predicciones y los valores objetivo, y calculamos el error cuadrático medio (MSE) entre ellos.

    Los objetivos generalmente no son negativos pero pueden ser iguales a 0, y el logaritmo de 0 no está definido. Por tanto se agrega una constante a las predicciones y los objetivos antes de aplicar la operación logarítmica.Esta constante también se puede definir para que sea diferente a uno según el problema que queramos resolver.

    Esta métrica se usa generalmente en la misma situación que MSPE (Error de porcentaje cuadrático medio) y MAPE(Error porcentual absoluto medio), ya que también conlleva errores relativos más que errores absolutos.


## Funcionalidad:

    La expresión
    log(pi+1)−log(ai+1)

    tambien puede ser escrita así:
    log((pi+1)/(ai+1))

![aqui va la sintaxis](https://cdn-images-1.medium.com/max/800/1*VjNfaSRuj3FIMcKA0yJAGg.png)

    MSLE mide el ratio de los valores reales y predichos.

    MSLE es preferible cuando:

        * Los objetivos crecen exponencialmente (por ejemplo haciendo un conteo de población)
        * Nos interesa mas el porcentaje de errores que el valor absoluto de errores.
        * Hay un gran rango de valores en las variables objetivo y no queremos penalizar grandes diferencias cuando los valores predichos y reales son numeros grandes.
        * MSLE penaliza una infraestimación frente a una sobreestimación.
        
Vamos a imaginar 2 casos de predicciones,

    Caso-1: nuestro modelo tiene una prediccion de 30 cuando el numero actual es 40

    Caso-2: nuestro modelo tiene una prediccion de 300 cuando el numero actual es 400
        Con el error cuadrático medio el segundo resultado es puntuado como 10 veces mas que el primer resultado
        En cambio con el error logaritmico cuadrático medio los 2 resultados son puntuados igual.
        MSLE tiene en cuenta el ratio de cambio.

Si observamos el siguiente ejemplo:

    Caso-3 :

        Prediccion = 600, Actual = 1000 (la diferencia es de 400)

    RMSE = 400, RMSLogE = 0.5108

    Caso-4 :

        Prediccion = 1400 , Actual = 1000 (la diferencia es de 400)

    RMSE = 400, RMSLogE = 0.3365

    Cuando las diferencias son las mismas entre los valores predichos y reales:
        El error cuadrático medio las trata de la misma forma en ambos casos ,
        sin embargo el error logaritmico cuadrático medio penaliza la baja estimación mas que la sobreestimación.

    A menudo, penalizar una baja estimacion mas que una sobreestimacion es importante a la hora de predicciones sobre ventas y demandas de inventario.
    Sería preferible tener inventario extra a no ser capaz de proveer un producto tanto como se demanda.






- - - - - - - - - - - - -


URLs:

https://towardsdatascience.com/11-evaluation-metrics-data-scientists-should-be-familiar-with-lessons-from-a-high-rank-kagglers-8596f75e58a7#5185

https://hrngok.github.io/posts/metrics/

https://sitiobigdata.com/2019/05/27/modelos-de-machine-learning-metricas-de-regresion-mse-parte-2/

In [9]:
import numpy as np
from sklearn.metrics import mean_squared_log_error, mean_squared_error

y_true = [1.0, 1.5, 2.0, 2.5, 3.0]
y_pred = [0.9, 1.7, 3.0, 2.0, 2.7]

msle =(mean_squared_log_error(y_true,y_pred))
mse=(mean_squared_error(y_true,y_pred))
print("Error logaritmico cuadrático medio:")
print(msle)
print("Error cuadrático medio:")
print(mse)


Error logaritmico cuadrático medio:
0.024231082550315173
Error cuadrático medio:
0.27799999999999997
