Regresión no lineal multivariada
===

## Objetivos de aprendizaje
- Reconocer la metodología para implementar un perceptrón multicapa en un caso de regresión no lineal multivariada

## Definición del problema real

El archivo `data/MulticapaRegresionMulti.csv` contiene 200 registros para la variables $x_0$, $x_1$, ..., $x_9$ y $y$, los cuales fueron obtenidos en un experimento de laboratorio. Se desea construir un modelo de regresión que permita obtener los valores de $y$ para los siguientes datos de entrada:

      #     x0     x1     x2     x3     x4     x5     x6     x7     x8     x9       y
     ----------------------------------------------------------------------------------
      1  0.806  0.725  0.768  0.333  0.101  0.153  0.289  0.587  0.607  0.897  ______
      2  0.504  0.902  0.576  0.409  0.737  0.738  0.962  0.917  0.353  0.768  ______
      3  0.493  0.929  0.342  0.345  0.328  0.433  0.111  0.511  0.820  0.359  ______
      4  0.775  0.192  0.643  0.643  0.297  0.879  0.546  0.628  0.721  0.038  ______
      5  0.400  0.848  0.743  0.361  0.265  0.474  0.799  0.535  0.998  0.152  ______
      6  0.951  0.033  0.108  0.389  0.973  0.430  0.018  0.017  0.121  0.533  ______
      7  0.843  0.403  0.283  0.384  0.288  0.395  0.668  0.948  0.861  0.424  ______
      8  0.262  0.718  0.001  0.428  0.832  0.722  0.422  0.934  0.139  0.519  ______
      9  0.183  0.550  0.186  0.209  0.822  0.486  0.332  0.495  0.406  0.057  ______
     10  0.795  0.118  0.781  0.617  0.393  0.736  0.649  0.422  0.313  0.935  ______

El problema es dificil por las siguientes razones:

* Hay variables explicativas no relevantes.

* Algunas variables explicativas pueden tener una relación no lineal con la variable de salida.

* Se desconoce el tipo de relación entre las variables explicativas y la variable explicada.

## Definición del problema en términos de los datos

Se debe construir un modelo no lineal que permita aproximar la relación entre las variables explicativas y la variable explicada, tal que:

* Sea posible descartar las variables que no aportan información.


* Se pueda determinar si existe alguna transformación no lineal de las variables explicativas que permita mejorar la precisón del modelo o permita encontrar un modelo más parsimonioso. 


* Se pueda determinar adecuadamente la complejidad del modelo no lineal tal que se maximice la capacida de generalización.


## Metodología

### Tranformación de variables

Tal como se define en el caso lineal, existen modelos no lineales que pueden ser linealizados por alguna transformación de las variables (tanto la dependiente como las independientes). Entre ellas se encuentran:

* Logaritmo natural.


* Exponencial.


* Transformación logística.

$$z=\log \left( \frac{cx}{1-cx}  \right) \text{  con  }c = (1-10^-6)*10^{\text{-ceil}(\log_{10}(\max(x)))} $$


* Raíz cuadrada.


* Raíz cúbica.


* Box-Cox.

$$z=\frac{x^\lambda - 1}{\lambda} \text{para } \lambda \ne 0 \text{ y } \log(x) \text{ para } \lambda =0$$


* Turkey.

$$ \arcsin\left( \sqrt{\frac{x}{n}} \right), \quad \sqrt{x} + \sqrt{x+1}$$

Sin embargo, las transformaciones más apropiadas deben determinarse por ensayo y error.

### Selección de variables

Existen dos tipos de metodologías:

* Independientes del modelo: Se usa alguna técnica para seleccionar las entradas correctas antes de especificar la red neuronal. Por ejemplo, se estima un modelo de regresión lineal con interacciones seleccionando únicamente las variables estadísticamente relevantes. Las variables finalmente seleccionadas se usan para especificar la red neuronal.


* Dependientes del modelo: La selección de las entradas se realiza como parte de la especificación del modelo de redes neuronales

En los métodos de selección dependientes del modelo, se usa alguna medida que castiga la complejidad de la red neuronal artificial, como por ejemplo el criterio de información de Akaike o crossvalidation. Se supone que se conoce el número adecuado de neuronas en la capa oculta. Entre estas técnicas se encuentran:

* Seleccion forward. Se inicia sin variables de entrada y se adiciona una a la vez.


* Selección backward. Se inicia con todas las entradas y se elimina una a la vez.


* Selección stepwise. Combinación de los dos métodos anteriores.

Ningún método garantiza que se converga a las verdaderas entradas relevantes del modelo.

## Solución 

Para resolver el problema numérico, realice las siguientes actividades:

* Construya modelos lineales en que aplique distintas transformaciones a las variables. Determine cuales son las variables relevantes.


* Una vez seleccione las variables relevantes, determine la cantidad de neuronas apropiadas para la capa oculta.

---