<a href="https://www.bigdatauniversity.com"><img src = "https://ibm.box.com/shared/static/cw2c7r3o20w9zn8gkecaeyjhgw3xdgbj.png" width = 400, align = "center"></a>
# <center>Non Linear Regression Analysis</center>

Si los datos muestran una tendencia curvilínea, la regresión lineal no producirá resultados muy precisos en comparación con una regresión no lineal porque, como su nombre lo indica, la regresión lineal supone que los datos son lineales.
Aprendamos sobre regresiones no lineales y apliquemos un ejemplo en Python. En este cuaderno, ajustamos un modelo no lineal a los puntos de datos correspondientes al PIB de China de 1960 a 2014.

### Importing required libraries

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

Aunque la regresión lineal es muy buena para resolver muchos problemas, no se puede usar para todos los conjuntos de datos. Primero recuerde cómo la regresión lineal podría modelar un conjunto de datos. Modela una relación lineal entre una variable dependiente y y una variable independiente x. Tenía una ecuación simple, de grado 1, por ejemplo y = 2 * (x) + 3.

In [None]:
x = np.arange(-5.0, 5.0, 0.1)

## Puede ajustar la pendiente e interceptar para verificar los cambios en el gráfico
y = 2*(x) + 3
y_noise = 2 * np.random.normal(size=x.size)
ydata = y + y_noise
#plt.figure(figsize=(8,6))
plt.plot(x, ydata,  'bo')
plt.plot(x,y, 'r') 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

Las regresiones no lineales son una relación entre las variables independientes $ x $ y una variable dependiente $ y $ que resultan en datos modelados de función no lineal. Esencialmente, cualquier relación que no sea lineal puede denominarse no lineal, y generalmente está representada por el polinomio de $ k $ grados (potencia máxima de $ x $).

$$ \ y = a x^3 + b x^2 + c x + d \ $$

Las funciones no lineales pueden tener elementos como exponenciales, logaritmos, fracciones y otros. Por ejemplo: $$ y = \ log (x) $$

O incluso, más complicado como:
$$ y = \log(a x^3 + b x^2 + c x + d)$$

Echemos un vistazo a cubic function's graph.

In [None]:
x = np.arange(-5.0, 5.0, 0.1)

## Puede ajustar la pendiente e interceptar para verificar los cambios en el gráfico
y = 1*(x**3) + 1*(x**2) + 1*x + 3
y_noise = 20 * np.random.normal(size=x.size)
ydata = y + y_noise
plt.plot(x, ydata,  'bo')
plt.plot(x,y, 'r') 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

Como puede ver, esta función tiene $ x ^ 3 $ y $ x ^ 2 $ como variables independientes. Además, el gráfico de esta función no es una línea recta sobre el plano 2D. Entonces esta es una función no lineal.

Algunos otros tipos de funciones no lineales son:

### Quadratic

$$ Y = X^2 $$

In [None]:
x = np.arange(-5.0, 5.0, 0.1)

##You can adjust the slope and intercept to verify the changes in the graph

y = np.power(x,2)
y_noise = 2 * np.random.normal(size=x.size)
ydata = y + y_noise
plt.plot(x, ydata,  'bo')
plt.plot(x,y, 'r') 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

### Exponential

Una función exponencial con base c se define por $$ Y = a + b c ^ X $$ donde b ≠ 0, c> 0, c ≠ 1 yx es cualquier número real. La base, c, es constante y el exponente, x, es una variable.


In [None]:
X = np.arange(-5.0, 5.0, 0.1)

## Puede ajustar la pendiente e interceptar para verificar los cambios en el gráfico

Y= np.exp(X)

plt.plot(X,Y) 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

### Logarithmic

La respuesta $ y $ es el resultado de aplicar un mapa logarítmico desde la entrada $ x $ 's hasta la variable de salida $ y $. Es una de las formas más simples de __log()__: i.e. $$ y = \ log (x) $$

Tenga en cuenta que en lugar de $ x $, podemos usar $ X $, que puede ser una representación polinómica de los $ x $ 's. En forma general se escribiría como
\begin{equation}
y = \log(X)
\end{equation}

In [None]:
X = np.arange(-5.0, 5.0, 0.1)

Y = np.log(X)

plt.plot(X,Y) 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

### Sigmoidal/Logistic

$$ Y = a + \frac{b}{1+ c^{(X-d)}}$$

In [None]:
X = np.arange(-5.0, 5.0, 0.1)


Y = 1-4/(1+np.power(3, X-2))

plt.plot(X,Y) 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()

<a id="ref2"></a>
# Non-Linear Regression example

Por ejemplo, vamos a tratar de ajustar un modelo no lineal a los puntos de datos correspondientes al PIB de China de 1960 a 2014. Descargamos un conjunto de datos con dos columnas, la primera, un año entre 1960 y 2014, la segunda, El ingreso interno bruto anual correspondiente de China en dólares estadounidenses para ese año.

In [None]:
import numpy as np
import pandas as pd

#downloading dataset
!wget -nv -O china_gdp.csv https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/ML0101ENv3/labs/china_gdp.csv
    
df = pd.read_csv("china_gdp.csv")
df.head(10)

__¿Sabía que?__ Cuando se trata de Machine Learning, es probable que trabaje con grandes conjuntos de datos. Como empresa, ¿dónde puede alojar sus datos? IBM ofrece una oportunidad única para las empresas, con 10 Tb de IBM Cloud Object Storage: [Sign up now for free](http://cocl.us/ML0101EN-IBM-Offer-CC)

### Plotting the Dataset ###
Así es como se ven los puntos de datos. Parece una función logística o exponencial. El crecimiento comienza lentamente, luego de 2005 en adelante, el crecimiento es muy significativo. Y finalmente, se desacelera ligeramente en la década de 2010.

In [None]:
plt.figure(figsize=(8,5))
x_data, y_data = (df["Year"].values, df["Value"].values)
plt.plot(x_data, y_data, 'ro')
plt.ylabel('GDP')
plt.xlabel('Year')
plt.show()

### Choosing a model ###

Desde una mirada inicial a la trama, determinamos que la función logística podría ser una buena aproximación,
ya que tiene la propiedad de comenzar con un crecimiento lento, aumentar el crecimiento en el medio y luego disminuir nuevamente al final; como se ilustra a continuación:

In [None]:
X = np.arange(-5.0, 5.0, 0.1)
Y = 1.0 / (1.0 + np.exp(-X))

plt.plot(X,Y) 
plt.ylabel('Dependent Variable')
plt.xlabel('Indepdendent Variable')
plt.show()


La fórmula para la función logística es la siguiente:

$$ \hat{Y} = \frac1{1+e^{\beta_1(X-\beta_2)}}$$

$\beta_1$: Controls the curve's steepness,

$\beta_2$: Slides the curve on the x-axis.

### Construyendo el modelo ###
Ahora, construyamos nuestro modelo de regresión e inicialicemos sus parámetros.

In [None]:
def sigmoid(x, Beta_1, Beta_2):
     y = 1 / (1 + np.exp(-Beta_1*(x-Beta_2)))
     return y

Veamos una muestra de línea sigmoidea que podría encajar con los datos:

In [None]:
beta_1 = 0.10
beta_2 = 1990.0

#logistic function
Y_pred = sigmoid(x_data, beta_1 , beta_2)

#plot initial prediction against datapoints
plt.plot(x_data, Y_pred*15000000000000.)
plt.plot(x_data, y_data, 'ro')

Nuestra tarea aquí es encontrar los mejores parámetros para nuestro modelo. Primero normalicemos nuestras x e y:

In [None]:
# Lets normalize our data
xdata =x_data/max(x_data)
ydata =y_data/max(y_data)

#### ¿Cómo encontramos los mejores parámetros para nuestra línea de ajuste?
podemos usar __curve_fit__ que usa mínimos cuadrados no lineales para ajustar nuestra función sigmoidea a los datos. Valores óptimos para los parámetros para que la suma de los residuos al cuadrado de sigmoide (xdata, * popt) - ydata se minimice.

popt son nuestros parámetros optimizados.

In [None]:
from scipy.optimize import curve_fit
popt, pcov = curve_fit(sigmoid, xdata, ydata)
#print the final parameters
print(" beta_1 = %f, beta_2 = %f" % (popt[0], popt[1]))

Ahora trazamos nuestro resultado regresssion model.

In [None]:
x = np.linspace(1960, 2015, 55)
x = x/max(x)
plt.figure(figsize=(8,5))
y = sigmoid(x, *popt)
plt.plot(xdata, ydata, 'ro', label='data')
plt.plot(x,y, linewidth=3.0, label='fit')
plt.legend(loc='best')
plt.ylabel('GDP')
plt.xlabel('Year')
plt.show()

## Practica
¿Puedes calcular cuál es la precisión de nuestro modelo?

In [None]:
# write your code here




Double-click __here__ for the solution.

<!-- Your answer is below:
    
# split data into train/test
msk = np.random.rand(len(df)) < 0.8
train_x = xdata[msk]
test_x = xdata[~msk]
train_y = ydata[msk]
test_y = ydata[~msk]

# build the model using train set
popt, pcov = curve_fit(sigmoid, train_x, train_y)

# predict using test set
y_hat = sigmoid(test_x, *popt)

# evaluation
print("Mean absolute error: %.2f" % np.mean(np.absolute(y_hat - test_y)))
print("Residual sum of squares (MSE): %.2f" % np.mean((y_hat - test_y) ** 2))
from sklearn.metrics import r2_score
print("R2-score: %.2f" % r2_score(y_hat , test_y) )

-->

## Want to learn more?

IBM SPSS Modeler is a comprehensive analytics platform that has many machine learning algorithms. It has been designed to bring predictive intelligence to decisions made by individuals, by groups, by systems – by your enterprise as a whole. A free trial is available through this course, available here: [SPSS Modeler](http://cocl.us/ML0101EN-SPSSModeler).

Also, you can use Watson Studio to run these notebooks faster with bigger datasets. Watson Studio is IBM's leading cloud solution for data scientists, built by data scientists. With Jupyter notebooks, RStudio, Apache Spark and popular libraries pre-packaged in the cloud, Watson Studio enables data scientists to collaborate on their projects without having to install anything. Join the fast-growing community of Watson Studio users today with a free account at [Watson Studio](https://cocl.us/ML0101EN_DSX)

### Thanks for completing this lesson!

Notebook created by: <a href = "https://ca.linkedin.com/in/saeedaghabozorgi">Saeed Aghabozorgi</a>

<hr>
Copyright &copy; 2018 [Cognitive Class](https://cocl.us/DX0108EN_CC). This notebook and its source code are released under the terms of the [MIT License](https://bigdatauniversity.com/mit-license/).​