<a href="https://colab.research.google.com/github/gabrielrflopes/estudos/blob/main/iPyWidgets_Criando_intera%C3%A7%C3%B5es_com_os_plots.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Criando interações com gráficos usando o iPyWidgets

A visualização de dados pode ir muito além da apresentação estática dos gráficos. A biblioteca `iPyWidgets` permite criar controles interativos de parâmetros dos plots, auxiliando na compreensão do gráficos e na dinâmica das variáveis.

O `iPyWidgets` é interessante justamente por permitir manipular os dados de maneira simples e intuitiva. 

Como é dito na [documentação](https://ipywidgets.readthedocs.io/en/stable/), pesquisadores podem visualizar facilmente como as mudanças nos _inputs_ afetam diretamente em seus modelos e impactam os resultados. Da mesma forma, cientistas podem compartilhar interfaces interativas que ajudam na compreensão de teorias de forma mais imersiva e experimental.

Neste notebook, iremos explorar as diferentes abordagens que a biblioteca `iPyWidgets`permite, utilizando o `Numpy` para gerar dados randômicos e o `Matplotlib` para a visualização dos gráficos. Ao final, você terá exemplos de interações com gráficos de diversos tipos, como histograma, dispersão e de linha.

## Instalando o `iPyWidgets` e importando as bibliotecas

Inicialmente, iremos instalar o `iPyWidgets` no ambiente do Colaboratory. Para isso, vamos utilizar o `!pip install ipywidgets -q`. Em seguida, ao importar as bibliotecas, chamamos diretamente as funções `interact` e `interact_manual`, que são responsáveis pela visualização do gráfico juntamente com os controles interativos.

In [1]:
!pip install ipywidgets -q

In [2]:
from ipywidgets import interact, interact_manual
import ipywidgets
import numpy as np
import matplotlib.pyplot as plt

### Exemplo 1: Função linear com ruído

Já colocando a mão na massa, o primeiro exemplo é de uma função linear construída com dados randômicos a partir do `Numpy`. A ideia aqui será visualizar como o ruído influencia na dispersão dos dados à medida que ele aumenta. A estrutura básica da função é a seguinte:

$$ y = ax + ϵb  $$

em que o fator $ϵ$ representa o ruído que acompanha o coeficiente linear, $b$. Neste exemplo, $a = 2$ e _noise_ representa a variável do ruído.

Primeiramente, definimos os valores de x com uma distribuição randomizada de valores entre 0 e 5, e uma amostra de tamanho 100. Em seguida, definimos os valores que vão compor o fator do ruído, utilizando o `np.random.normal` que retorna uma distribuição normal de dados aleatórios.


In [3]:
# definindo os valores para x e para o ruído a partir de arrays numpy.
x = np.random.uniform(0, 5, size = 100)
noise = np.random.normal(size = 100)

def plot_fct(b = 1):

  y = 2*x + b*noise
  plt.scatter(x, y, color = 'g');

Definimos a função `plt_fct()` deixando o valor do coeficiente $b = 1$ por padrão. Dentro da função, escrevemos a relação entre a variável dependente $y$ e a variável independente $x$, juntamente com o produto do termo linear e o ruído.

Para criar a interação com o gráfico, vamos utilizar o `interact` passando como argumentos a função que foi criada e um intervalo para a variação do coeficiente linear $b$. À medida que variamos $b$, o peso do ruído será maior ou menor, causando mais dispersão ou menos. 

In [4]:
interact(plot_fct, b = (0, 5, 0.5))

interactive(children=(FloatSlider(value=1.0, description='b', max=5.0, step=0.5), Output()), _dom_classes=('wi…

<function __main__.plot_fct(b=1)>

### Exemplo 2: Dataset _`make_moons`_ do `Scikit Learn`

É possível trabalhar as interações com _datasets_, de modo a manipular o número de elementos na amostra, por exemplo. Neste exemplo, vamos utilizar o conjunto de dados _`make_moons`_ da biblioteca `Scikit Learn`.

In [5]:
from sklearn.datasets import make_moons

moons = make_moons(n_samples = 100, noise = 0.01)
x0, x1 = moons[0], moons[1]

Acima, definimos a variáve `moons` para guardar o _dataset_ com 100 amostras e um ruído de 0.01.  Em seguida, associamos a variável $x_{0}$ e $x_{1}$ às componentes `moons[0]` e `moons[1]`. 

Para visualizarmos do que se tratam essas componentes, vamos printar os 10 primeiros elementos contidos nas variáveis.

In [6]:
print(x0[0:10])

print('A variável x0 é do tipo', type(x0))

[[-0.14750948  0.98434022]
 [ 1.94941783  0.17861901]
 [ 0.64197069 -0.45244115]
 [-0.99351942  0.06876784]
 [-0.67042146  0.73322186]
 [ 1.97798409  0.26641476]
 [-0.00816244  0.37042338]
 [ 0.31843648 -0.22049539]
 [ 1.44587957 -0.39744282]
 [ 0.97373049  0.26210214]]
A variável x0 é do tipo <class 'numpy.ndarray'>


In [7]:
print(x1[0:10])

print('A variável x1 é do tipo', type(x1))

[0 1 1 0 0 1 1 1 1 0]
A variável x1 é do tipo <class 'numpy.ndarray'>


Note que ambas as variáveis são _arrays_ do `Numpy`, ou seja, estruturas de dados de uma dimensão ou mais. No caso de `x_{0}`, temos um array de duas colunas com valores randomizados, enquanto que para `x_{1}` temos uma estrutura unidimensional com zeros e uns. 

Para definir a função que será usada na interação vamos utilizar dessa construção, construindo um gráfico de dispersão em que a variável independente $x$ estará relacionada com a primeira coluna de `x_{0}` e a variável dependente $y$ com a segunda coluna de `x_{0}`. 

Os valores de `x_{1}` servirão como índice para distinguir as duas classes que formarão a imagem, por isso associamos essa variável ao argumento da cor.

In [8]:
def plot_moons(samples = 200, noise = 0.5):
  
  moons = make_moons(n_samples = samples, noise = noise)
  x0, x1 = moons[0], moons[1]

  plt.scatter(x = x0[:, 0], y = x0[:, 1], c = x1)

Para criar a interação, os dois argumentos que poderão ser manipulados serão o tamanho da amostra (`n_samples`) e o ruído (`noise`).

---



In [9]:
interact(plot_moons, samples = [100, 200, 500, 1000], noise = (0, 2, 0.025))

interactive(children=(Dropdown(description='samples', index=1, options=(100, 200, 500, 1000), value=200), Floa…

<function __main__.plot_moons(samples=200, noise=0.5)>

Uma coisa interessante do `iPyWidgets` quando utilizamos o `interact` é que ele reconhece o tipo de estrutura que estamos fornecendo como argumento e ajusta os controles para a melhor visualização. 

> Neste caso, como passamos uma lista para `samples`, ele identificou que o melhor controle seria um _dropdown menu_, enquanto que o ruído (uma tupla), pode ser controlado com um _slider_. 

### Exemplo 3: Comparação de funções harmônicas

Com o exemplo acima, vimos o potencial do `iPyWidgets` ao permitir a visualização da dinâmica de um _dataset_, manipulando parâmetros importantes de acordo com o contexto de dados que estamos lidando. 

Agora, veremos uma aplicação que pode ter um valor didático para cientistas e professores, ao explicar como evolui determinada função em comparação com outra.

A função seno e cosseno são funções harmônicas, ou seja, após um período $T = 2π$, elas retornam ao valor inicial que tinham. Não somente isso, mas as duas funções podem ser modificadas por um fator de amplitude ou pela fase em que se encontram. 

Nessa demonstração, será possível manipular a amplitude da função senoidal, além de sua fase, seguindo a equação:

$$ y(x, \phi) = Asin(x + ϕ)$$

em que A é a amplitude e $ϕ$ a fase. Além disso, a função cosseno poderá ser ligada ou desligada para comparações.

In [10]:
# definindo a função que plota o seno

def plot_sin(start = 0, end = 2, A = 1, phi = 0, grid = False, plot_cos = False):

  # utilizando o linspace do numpy, que retorna números espaçados de maneira uniforme por um determinado intervalo.
  x = np.linspace(start, end, (end-start) * 10) 
  y = np.sin(x + phi) * A

  plt.grid(grid)
  plt.plot(x, y)

  if plot_cos:
    y = np.cos(x)
    plt.plot(x, y,'g')

Com o `interact`, vamos passar os intervalos que poderão ser modificados para cada parâmetro. Note que a fase (`phi`) poderá ser modificada de 0 até $2\pi$.

In [11]:
interact(plot_sin, start = (0, 10, 1), end = (20, 50, 1), A = (0, 5, 0.1), phi = (0, 6.28, 0.05), grid = False)

interactive(children=(IntSlider(value=0, description='start', max=10), IntSlider(value=20, description='end', …

<function __main__.plot_sin(start=0, end=2, A=1, phi=0, grid=False, plot_cos=False)>

Neste exemplo, note que foi utilizado um `toggle` (ou caixa de marcação) para habilitar a função cosseno e o _grid_. O `interact` interpretou como sendo a melhor alternativa para o uso do `if` dentro da função e do booleano para o `grid` no argumento.

### Exemplo 4: Função harmônica amortecida

Trazendo agora um pouco mais de requinte teórico à demonstração, vamos interagir com uma função harmônica amortecida, ou seja, que decai sua amplitude com o tempo.

Uma função amortecida pode ser definida da seguinte forma:

$$y(x) = Ae^{-\frac{x}{x_{0}}}sen(x). $$

A função exponencial real negativa restringe a amplitude da função seno à medida que $x$ cresce. O fator $x_{0}$ ajuda a regular a velocidade com a qual esse amortecimento acontece: quanto maior for o valor de $x_{0}$, menor será a velocidade de decaimento da função seno.

O código para criar esse gráfico é semelhante ao anterior, apenas com a adição do parâmetro $x_{0}$ e da função `plot_exp`.

In [12]:
# criando uma interação de uma função harmônica amortecida

def plot_sin(start = 0, end = 2, grid = False, A = 1, x0 = 1, plot_exp = True):

  x = np.linspace(start, end, (end-start) * 10)
  y = np.sin(x)

  plt.grid(grid)
  plt.plot(x, y, alpha = 0.5)

  # criando a função exponencial
  if plot_exp:
    damp = A * np.exp(-x/x0)
    y = np.sin(x) * damp
    plt.plot(x, y, 'g')

    # Linhas exponenciais para guiar os olhos
    plt.plot(x, damp, 'r--')
    plt.plot(x, -damp, 'r--')

In [13]:
interact(plot_sin, start = (0, 10, 1), end = (20, 50, 1), A = (1, 10, 1), x0 =(1, 20, 0.5), grid = False)

interactive(children=(IntSlider(value=0, description='start', max=10), IntSlider(value=20, description='end', …

<function __main__.plot_sin(start=0, end=2, grid=False, A=1, x0=1, plot_exp=True)>

> Neste exemplo, fica claro como a função seno tende a zero para valores de $x$ muito grandes. Podemos também ver que, mesmo se colocarmos uma amplitude inicial muito alta no começo, a função seno ainda decairá rapidamente.

Do ponto de vista didático, este é uma ótima visualização dos efeitos do amortecimento, que pode ser utilizado em aulas de física e de cálculo com muita facilidade.

### Exemplo 5: Interagindo com histogramas

Os histogramas são favoritos na análise de dados contínuos que podem ser divididos em intervalos definidos. Esse tipo de gráfico ajuda na visualização da distribuição dos dados e pode ser muito útil na hora de analisar modelos de mineração de dados, no contexto de problemas de negócios.

A interação com um gráfico desse tipo pode ser útil para justamente testar parâmetros desses modelos, como número de elementos, a média e o desvio-padrão. 

Nesse exemplo, será construído um histograma para mostrar como a variação da média, do desvio-padrão, do tamanho da amostra e dos intervalos influencia na distribuição de dados aleatórios que seguem uma normal. Para isso, primeiro definimos a função `plot_hist` em que:

- `mu` - Média
- `sigma` - Desvio-padrão
- `n` - Tamanho da amostra
- `bins` - Intervalo dos dados

In [53]:
def plot_hist(mu = 0, sigma = 5, n = 100, bins = 10, color = 'blue'):

  plt.xlim(-20,20)
  x = np.random.normal(mu, sigma, n)
  plt.hist(x, bins = bins, color = color)

In [54]:
interact(plot_hist, mu = (-10, 10, 0.5), n = (10, 1000, 1), sigma = (0, 10, 1), bins = (1, 100, 1), color = ['red', 'green', 'blue'])

interactive(children=(FloatSlider(value=0.0, description='mu', max=10.0, min=-10.0, step=0.5), IntSlider(value…

<function __main__.plot_hist(mu=0, sigma=5, n=100, bins=10, color='blue')>

Apenas com essa visualização, é possível constatar alguns fatos sobre a distribuição normal representada nos histogramas:

- À medida que o desvio-padrão aumenta, maior é a dispersão dos dados com respeito à média;
- O aumento do tamanho da amostra aproxima o histograma da curva de sino característica da distribuição normal;
- Com uma amostra grande, os dados têm mais definição à medida que os intervalos aumentam.

Note também que foi passada uma lista de cores no argumento de `interact`e, novamente, ele interpretou que o melhor controle seria um _dropdown menu_.

Por último, o `interact_manual` abaixo permite que você defina primeiro os parâmetros da interação antes de visualizar o gráfico, bastando clicar em **`Run Interact`**.


In [16]:
interact_manual(plot_hist, mu = (-10, 10, 0.5), n = (10, 1000, 1), sigma = (0, 10, 1), bins = (1, 100, 1), color = ['red', 'green', 'blue'])

interactive(children=(FloatSlider(value=0.0, description='mu', max=10.0, min=-10.0, step=0.5), IntSlider(value…

<function __main__.plot_hist(mu=0, sigma=5, n=100, bins=10, color='blue')>

### Bônus: Função sigmoide

Por último, quero finalizar esse estudo com a função sigmoide, que mapeia qualquer valor de `input` num intervalo entre 0 e 1. A sigmoide tem uma curva em S característica, sendo um exemplo a função logística, definida por:

$$y(x) = \frac{1}{1 + e^{x}}$$

em que x é o valor de _input_ e $e$ é o logaritmo neperiano. 

Funções sigmoide são comumente utilizadas nas áreas de inteligência artificial e _machine learning_, para tarefas como classificação e predição. Elas podem ser usadas para transformar o _output_ de um modelo de regressão linear em um valor que pode ser interpretado como a densidade de probabilidade de um elemento pertencer a determinada classe.

Para criar a função que será usada na interação, definimos um espaço linear no `Numpy`para ser a variável $x$.

As variáveis `x_in` e `y_in` representam os valores de $x$ e $y$ que servirão como _input_. Note que o valor de `y_in`está definido como o resultado de uma função logística para cada valor de `x_in`. 

A ideia é criar uma curva sigmoide de guia para visualizar o ponto (`x_in`, `y_in`) que seguirá exatamente sobre essa curva. A interação se dará com a manipulação do valor do _input_ através de um _slider_.



In [55]:
import math

def plot_sigmoid(x_in = 0):

  x = np.linspace(-5, 5, 1000)
  y = 1 / (1 + np.exp(-x))
  y_in = 1 / (1 + math.exp(-x_in))

  plt.plot(x, y)
  plt.scatter(x_in, y_in, c = 'r')

  # desenhando as linhas tracejadas que identificam o par x_in e y_in à medida que modificamos o input
  plt.plot([x_in, x_in], [0, y_in], 'r--')
  plt.plot([-5, x_in], [y_in, y_in], 'r--')

  print('y_in =', y_in)

In [56]:
interact(plot_sigmoid, x_in = (-5, 5, 0.1))

interactive(children=(FloatSlider(value=0.0, description='x_in', max=5.0, min=-5.0), Output()), _dom_classes=(…

<function __main__.plot_sigmoid(x_in=0)>

## O poder da visualização de dados com interação

O poder da interação com os dados através do **`iPyWidgets`** não pode ser subestimado. Com o aumento da quantidade de dados sendo gerados diariamente, é crucial ter ferramentas que nos permite explorar e analisar os dados rapida e efetivamente, para conseguir _insights_ e tomar decisões informadas.

A biblioteca **`iPyWidgets`** possibilita uma maneira interativa e amigável de alcançar esses objetivos, permitindo que os usuários manipulem parâmetros e personalizem a aparência dos gráficos instantaneamente. Essa capacidade facilita a exploração dos dados para o aprendizado sobre a distribuição, o que seria muito mais difícil apenas com visualizações estáticas.

Além disso, a interatividade torna os gráficos mais engajadores e propiciam uma comunicação efetiva para problemas de negócios, apresentações de modelos e para o ensino. Com essa ferramenta em mãos, o potencial da visualização de dados pode ser destravada para muito além de dashboards estáticos e aprendizados monótonos, em direção à apresentações mais dinâmicas e esclarecedoras.