In [None]:
import numpy as np
import matplotlib.pyplot as plt


Funções Lineares<br>
Usaremos o termo equação linear para significar uma soma ponderada de entradas mais um deslocamento. Se houver apenas uma entrada $x$, então esta é uma linha reta:

\begin{equation}y=\beta+\omega x,\end{equation}

onde $\beta$ é a interseção do eixo y com a reta e $\omega$ é a inclinação da reta. Quando existem duas entradas $x_{1}$ e $x_{2}$, então isso se torna:

\begin{equation}y=\beta+\omega_1 x_1 + \omega_2 x_2.\end{equation}

Outras funções são, por definição, não-lineares.

In [None]:
# Defina uma função linear com apenas uma entrada, x
def linear_function_1D(x,beta,omega):
  # TODO -- substitua a linha de código abaixo pela fórmula para a equação linear 1D
  y = x

  return y

In [None]:
# Plotar a função linear 1D

# Definir um vetor de valores x de 0 a 10 com incrementos de 0.01
# https://numpy.org/doc/stable/reference/generated/numpy.arange.html
x = np.arange(0.0,10.0, 0.01)
# Calcular y usando a função que você preencheu acima
beta = 0.0; omega = 1.0

y = linear_function_1D(x,beta,omega)

# Plotar esta função
fig, ax = plt.subplots()
ax.plot(x,y,'r-')
ax.set_ylim([0,10]);ax.set_xlim([0,10])
ax.set_xlabel('x'); ax.set_ylabel('y')
plt.show

# TODO -- experimente mudar os valores de beta e omega
# para entender o que eles fazem. Tente fazer uma linha
# que cruza o eixo y em y=10 e o eixo x em x=5

Agora vamos investigar uma função linear 2D

In [None]:
# Código para desenhar a função 2D - leia para entender o que está acontecendo, mas você não precisa alterá-lo
def draw_2D_function(x1_mesh, x2_mesh, y):
    fig, ax = plt.subplots()
    fig.set_size_inches(7,7)
    pos = ax.contourf(x1_mesh, x2_mesh, y, levels=256 ,cmap = 'hot', vmin=-10,vmax=10.0)
    fig.colorbar(pos, ax=ax)
    ax.set_xlabel('x1');ax.set_ylabel('x2')
    levels = np.arange(-10,10,1.0)
    ax.contour(x1_mesh, x2_mesh, y, levels, cmap='winter')
    plt.show()

In [None]:
# Definir uma função linear com duas entradas, x1 e x2
def linear_function_2D(x1, x2, beta, omega1, omega2):
  # TODO -- substitua a linha de código abaixo pela fórmula para a equação linear 2D
  y = x1

  return y

In [None]:
# Plotar a função 2D

# Criar matriz 2D de pontos x e y
x1 = np.arange(0.0, 10.0, 0.1)
x2 = np.arange(0.0, 10.0, 0.1)
x1, x2 = np.meshgrid(x1, x2)  # https://www.geeksforgeeks.org/numpy-meshgrid-function/

# Calcular a função 2D para valores dados de omega1, omega2
beta = 0.0; omega1 = 1.0; omega2 = -0.5
y = linear_function_2D(x1, x2, beta, omega1, omega2)

# Desenhar a função.
# A cor representa o valor de y (mais brilhante = valor mais alto)
# Preto = -10 ou menos, Branco = +10 ou mais
# 0 = laranja médio
# As linhas são contornos onde o valor é igual
draw_2D_function(x1, x2, y)

# TODO
# Preveja como será este gráfico se você definir omega_1 como zero
# Mude o código e veja se você está certo.

# TODO
# Preveja como será este gráfico se você definir omega_2 como zero
# Mude o código e veja se você está certo.

# TODO
# Preveja como será este gráfico se você definir beta como -5
# Mude o código e veja se você está correto


Frequentemente, queremos calcular muitas funções lineares ao mesmo tempo. Por exemplo, podemos ter três entradas, $x_1$, $x_2$ e $x_3$, e queremos calcular duas funções lineares fornecendo $y_1$ e $y_2$. Claro, poderíamos fazer isso executando cada equação separadamente,

\begin{align}
y_1 &= \beta_1 + \omega_{11} x_1 + \omega_{12} x_2 + \omega_{13} x_3\\
y_2 &= \beta_2 + \omega_{21} x_1 + \omega_{22} x_2 + \omega_{23} x_3.
\end{align}

No entanto, podemos escrever de forma mais compacta com vetores e matrizes:

\begin{equation}
\begin{bmatrix} y_1\\ y_2 \end{bmatrix} = \begin{bmatrix}\beta_{1}\\\beta_{2}\end{bmatrix}+ \begin{bmatrix}\omega_{11}&\omega_{12}&\omega_{13}\\\omega_{21}&\omega_{22}&\omega_{23}\end{bmatrix}\begin{bmatrix}x_{1}\\x_{2}\\x_{3}\end{bmatrix},
\end{equation}
ou

\begin{equation}
\mathbf{y} = \boldsymbol\beta +\boldsymbol\Omega\mathbf{x}.
\end{equation}

para abreviar. Aqui, símbolos em negrito minúsculo são usados para vetores. Símbolos em negrito maiúsculo são usados para matrizes.

In [None]:
# Definir uma função linear com três entradas, x1, x2 e x_3
def linear_function_3D(x1, x2, x3, beta, omega1, omega2, omega3):
  # TODO -- substituir o código abaixo pela fórmula para uma única equação linear 3D
  y = x1

  return y

Vamos calcular duas equações lineares. Vamos usar tanto as equações individuais quanto a forma de vetor/matrizes, e verificar se fornecem o mesmo resultado.

In [None]:
# Definir os parâmetros
beta1 = 0.5; beta2 = 0.2
omega11 = -1.0; omega12 = 0.4; omega13 = -0.3
omega21 = 0.1; omega22 = 0.1; omega23 = 1.2

# Definir as entradas
x1 = 4; x2 = -1; x3 = 2

# Calcular usando as equações individuais
y1 = linear_function_3D(x1, x2, x3, beta1, omega11, omega12, omega13)
y2 = linear_function_3D(x1, x2, x3, beta2, omega21, omega22, omega23)
print("Equações individuais")
print('y1 = %3.3f\ny2 = %3.3f' % (y1, y2))

# Definir vetores e matrizes
beta_vec = np.array([[beta1], [beta2]])
omega_mat = np.array([[omega11, omega12, omega13], [omega21, omega22, omega23]])
x_vec = np.array([[x1], [x2], [x3]])

# Calcular com forma de vetores/matrizes
y_vec = beta_vec + np.matmul(omega_mat, x_vec)
print("Forma de matriz/vetor")
print('y1 = %3.3f\ny2 = %3.3f' % (y_vec[0], y_vec[1]))

# Perguntas

1. Uma única equação linear com três entradas (ou seja, **linear_function_3D()**) associa um valor y a cada ponto em um espaço 3D ($x_1$,$x_2$,$x_3$). É possível visualizar isso? Qual valor está na posição (0,0,0)?

2. Escreva o código (agora utilizando a biblioteca pytorch) para calcular três equações lineares com duas entradas ($x_1$, $x_2$) usando tanto as equações individuais quanto a forma de matriz (você pode inventar qualquer valor para as entradas $\beta_{i}$ e as inclinações $\omega_{ij}$).

# Funções Especiais

Ao longo do livro, estaremos utilizando algumas funções especiais (consulte o Apêndice B.1.3). As mais importantes destas são as funções logarítmica e exponencial. Vamos investigar suas propriedades.

Começaremos com a função exponencial $y=\exp[x]=e^x$, que mapeia a reta real $[-\infty,+\infty]$ para números não negativos $[0,+\infty]$.

In [None]:
# Desenhar a função exponencial

# Definir um vetor de valores x de -5 a 5 com incrementos de 0.01
x = np.arange(-5.0, 5.0, 0.01)
y = np.exp(x)

# Plotar esta função
fig, ax = plt.subplots()
ax.plot(x, y, 'r-')
ax.set_ylim([0, 100])
ax.set_xlim([-5, 5])
ax.set_xlabel('x')
ax.set_ylabel('exp[x]')
plt.show()

# Perguntas

1. Qual é o valor de $\exp[0]$?  
2. Qual é o valor de $\exp[1]$?
3. Qual é o valor de $\exp[-\infty]$?
4. Qual é o valor de $\exp[+\infty]$?
5. Uma função é convexa se pudermos desenhar uma linha reta entre quaisquer dois pontos na função, e a linha fica acima da função em todos os lugares entre esses dois pontos. Da mesma forma, uma função é côncava se uma linha reta entre quaisquer dois pontos fica abaixo da função em todos os lugares entre esses dois pontos. A função exponencial é convexa, côncava ou nenhuma das duas?

Agora vamos considerar a função logarítmica $y=\log[x]$. Ao longo do livro, sempre usamos logaritmos naturais (base $e$). A função logarítmica mapeia números não negativos $[0,\infty]$ para números reais $[-\infty,\infty]$. É o inverso da função exponencial. Então, quando calculamos $\log[x]$, estamos realmente perguntando "Qual é o número $y$ tal que $e^y=x$?"

In [None]:
# Desenhar a função logarítmica

# Definir um vetor de valores x de -5 a 5 com incrementos de 0.01
x = np.arange(0.01, 5.0, 0.01)
y = np.log(x)

# Plotar esta função
fig, ax = plt.subplots()
ax.plot(x, y, 'r-')
ax.set_ylim([-5, 5])
ax.set_xlim([0, 5])
ax.set_xlabel('x')
ax.set_ylabel('$\log[x]$')
plt.show()

# Perguntas

1. Qual é o valor de $\log[0]$?  
2. Qual é o valor de $\log[1]$?
3. Qual é o valor de $\log[e]$?
4. Qual é o valor de $\log[\exp[3]]$?
5. Qual é o valor de $\exp[\log[4]]$?
6. Qual é o valor de $\log[-1]$?
7. A função logarítmica é côncava ou convexa?