# Module 6 - Descritiva I

## 6.1 Tipos de variáveis e análise univariada e bivariada

### Tipos de variáveis

- Quantitativas discretas
- Quantitativas contínuas
- Qualitativas nominais
- Qualitativas ordinais

### Quantitativas

- Variáveis quantitativas representam quantidades. Faz sentido fazer 'contas' com elas, extrair médias, somar seus valores e etc.
- OBS: Se dividem em **Discretas** e **Contínuas**
---
- **Discretas**
    - Variáveis quantitativas Discretas têm seu domínio (conjunto de possíveis valores) enumerável. Comunente são contagens de algo
    - ex: 
        - Resultado de um dado
        - Número de peixes pescado
        - Nota em uma prova.
---
- **Contínuas**
    - Variáveis quantitativas Contínuas têm seu domínio (conjunto de possíveis valores) **não** enumerável. Em geral são medidas de um atributo físico ou subproduto de outras variáveis (médias, somas etc.) 
    - ex: 
        - Peso
        - Temperatura
        - Salário.


### Qualitativas

- São 'categorias', 'classificações' ou 'qualidades' de algo. Não faz sentido fazer contas com variáveis qualitativas que não sejam baseadas em contagens
---
- **Ordinais**
    - Qualitativas ordinais possuem uma 'ordem' implícita, como:
    - ex:
        - Tamanho: P, M ou G
        - Opinião: Concordo, Neutro, Discordo
        - Classe social: A, B, C, D e E
---
- **Nominais**
    - Qualitativas nominais são também categorias, mas sem ordem implícita.
    - ex:
        - Sabor: tamarindo, limão, groselha
        - Estado civil: casado, solteiro, desquitado etc
        - Tipo de jogo: plataforma, corrida, esporte etc


## 6.2 Matplotlib

### Introdução ao Matplotlib

Além de o matplotlib ser o pacote mais popular para construção de gráficos no Python, ele é a base dos métodos gráficos do pandas e também dos gráficos feitos pelo seaborne - que é uma biblioteca que fornece procedimentos práticos para a construção de gráficos mais sofisticados.

In [36]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# %matplotlib inline
%matplotlib notebook

In [37]:
data = [1,2,3,3,2,3,4,5]

plt.plot(data)

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fbc5d3490a0>]

In [38]:
# base do matplotlib desenha uma figura em branco
fig = plt.figure()

<IPython.core.display.Javascript object>

In [39]:
ax1 = fig.add_subplot(2,2,1)
ax2 = fig.add_subplot(2,2,2)
ax3 = fig.add_subplot(2,2,3)
ax4 = fig.add_subplot(2,2,4)

In [40]:
plt.plot(np.random.randn(50).cumsum(), 'k--')

[<matplotlib.lines.Line2D at 0x7fbc5d582250>]

In [41]:
ax1.hist(np.random.randn(100), bins=20, color='k', alpha=0.3)
_ = ax2.scatter(np.arange(30), np.arange(30) + 3 * np.random.randn(30))

In [42]:
plt.close('all')

In [43]:
fig, axes = plt.subplots(2,3)

<IPython.core.display.Javascript object>

In [44]:
axes.shape

(2, 3)

In [45]:
axes[0,0]

<AxesSubplot:>

In [46]:
fig, axes = plt.subplots(2, 2, sharex=True, sharey=True)

for i in range(2):
    for j in range(2):
        axes[i, j].hist(np.random.randn(500), bins=50, color='b', alpha=0.8)

# o método subplots_adjust ajusta o espaçamento entre os eixos
plt.subplots_adjust(wspace=0, hspace=0)

<IPython.core.display.Javascript object>

In [47]:
from numpy.random import randn

plt.plot(randn(30).cumsum(), 'go--')

[<matplotlib.lines.Line2D at 0x7fbc5d736460>]

In [48]:
plt.close('all')

In [49]:
plt.plot?

In [50]:
data = np.random.randn(30).cumsum()
plt.plot(data, 'k--', label='Default')
plt.plot(data, 'b-', drawstyle='steps-post', label='steps-post')
plt.legend(loc='best')

<IPython.core.display.Javascript object>

<matplotlib.legend.Legend at 0x7fbc5d9f09d0>

### Tiques, rótulos e legendas

In [51]:
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.plot(np.random.randn(1000).cumsum())

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fbc5d1796d0>]

In [52]:
ticks = ax.set_xticks([0, 250, 500, 750, 1000])
labels = ax.set_xticklabels(
    ['ano 1', 'ano 2', 'ano 3', 'ano 4', 'ano 5'],
    rotation=30,
    fontsize='small'
)

In [53]:
ax.set_title('Título do gráfico')
ax.set_xlabel('Período')

Text(0.5, 0, 'Período')

In [54]:
plt.close('all')

from numpy.random import rand

fig = plt.figure(); ax = fig.add_subplot(1, 1, 1)
ax.plot(randn(1000).cumsum(), 'k--', label='two')
ax.plot(randn(1000).cumsum(), 'k', label='three')

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fbc5d1de3a0>]

In [55]:
ax.legend(loc='best')

<matplotlib.legend.Legend at 0x7fbc5d190dc0>

### Salvando em Arquivos

plt.savefig('figpath.svg')
plt.savefig('figpath.svg', dpi=400, bbox_inches='tight')

### Configuração do Matplotlib

plt.rc('figure', figsize(10, 10))

font_options = {'family': 'monospace', 'weight': 'bold', 'size': 'small'}
plt.rc('font', **font_options)