# Gráficos em Python

Existem diversas bibliotecas para a construção de gráficos em Python, dentre as quais destacam-se:
+ Matplotlib
+ Bokeh

## Matplotlib

**matplotlib.pyplot** é uma biblioteca de gráficos usada para construir gráficos 2D em Python

Existem diversos tipos de gráficos que podem ser criados usando matplotlib.

Exemplo

In [None]:
import matplotlib.pyplot as plt # importando o pacote pyplot da biblioteca matplotlib com o "apelido" plt

A maneira mais simples de se criar um gráfico é passando as coordenadas do eixo das abcissas e do eixo das ordenadas como parâmetro.

In [None]:
plt.plot([1,2,3],[4,5,1])
plt.show()

O objeto **plt** possui diversos métodos e parâmetros que podem aprimorar o gráfico construído.

In [None]:
import numpy as np
x = np.linspace(0, 2, 100)
plt.plot(x, x, label='linear')
plt.plot(x, x**2, label='quadratic')
plt.plot(x, x**3, label='cubic')
plt.xlabel('x label')
plt.ylabel('y label')
plt.title("Simple Plot")
plt.legend()
plt.show()

Com o matplotlib você pode plotar mais de um gráfico na mesma janela, mudar as cores das linhas e marcadores, a espessura das linhas, adicionar grade, etc

In [None]:
x = [5,8,10]
y = [12,16,6]
x2 = [6,9,11]
y2 = [6,15,7]
plt.plot(x,y,'g',label='line one', linewidth=5) # primeiro gráfico com cor verde (g) e espessura 5
plt.plot(x2,y2,'c',label='line two',linewidth=5) #  segundo gráfico com cor ciano (6) e espessura 5
plt.title('Título')
plt.ylabel('Eixo Y')
plt.xlabel('Eixo X')
plt.legend() # aqui mostra-se a legenda para cada gráfico com o rótulo definido na criação dos mesmos
plt.grid(True,color='k')
plt.show()

Exemplo de gráfico de barras

In [None]:
plt.bar([0.25,1.25,2.25,3.25,4.25],[50,40,70,80,20],
label="BMW", color='b', width=.5)
plt.bar([.75,1.75,2.75,3.75,4.75],[80,20,20,50,60],
label="Audi", color='r',width=.5)
plt.legend()
plt.xlabel('Days')
plt.ylabel('Distance (kms)')
plt.title('Information')
plt.show()

Você pode plotar apenas pontos também com o comando **scatter**

In [None]:
x = [1,1.5,2,2.5,3,3.5,3.6]
y = [7.5,8,8.5,9,9.5,10,10.5]
 
x1=[8,8.5,9,9.5,10,10.5,11]
y1=[3,3.5,3.7,4,4.5,5,5.2]
 
plt.scatter(x,y, label='high income low saving',color='r')
plt.scatter(x1,y1,label='low income high savings',color='b')
plt.xlabel('saving*100')
plt.ylabel('income*1000')
plt.title('Scatter Plot')
plt.legend()
plt.show()

Ou então

In [None]:
plt.plot(x,y,'ro', label='high income low saving')
plt.plot(x1,y1,'bo', label='low income high savings')
plt.xlabel('saving*100')
plt.ylabel('income*1000')
plt.title('Scatter Plot')
plt.legend()
plt.show()

Combinando linhas e pontos

In [None]:
plt.plot(x,y,'ro-', label='high income low saving')
plt.plot(x1,y1,'bo-', label='low income high savings')
plt.xlabel('saving*100')
plt.ylabel('income*1000')
plt.title('Scatter Plot')
plt.legend()
plt.show()

Gráfico de pizza

In [None]:
slices = [7,2,2,13]
activities = ['sleeping','eating','working','playing']
cols = ['c','m','r','b']
 
plt.pie(slices,
  labels=activities,
  colors=cols,
  startangle=90,
  shadow= True,
  explode=(0,0.1,0,0),
  autopct='%1.1f%%')
 
plt.title('Pie Plot')
plt.show()

A biblioteca matplotlib está integrada ao pandas e pode ser usada diretamente nos DataFrames

In [None]:
import pandas as pd
brics = pd.read_excel("brics.xlsx",index_col=0)
plt.figure() # esse comando cria um objeto figure que será usado para manipular os atributos que desejamos adicionar ao gráfico
brics.plot(legend=True)

Plotando o gráfico das linhas

In [None]:
df = brics.T[2:] # pegando apenas as linhas que são numéricas
print(df)
plt.figure()
df.plot()

É possível fazer mais de um gráfico na mesma figura usando **subplot**

In [None]:
def f(t):
    return np.exp(-t) * np.cos(2*np.pi*t)
t1 = np.arange(0.0, 5.0, 0.1)
t2 = np.arange(0.0, 5.0, 0.02)
plt.subplot(211)
plt.plot(t1, f(t1), 'bo', t2, f(t2))
plt.subplot(212)
plt.plot(t2, np.cos(2*np.pi*t2),'r--')
plt.show()

A função **subplot** define uma grade onde serão plotados os gráficos e recebe como argumento um número de 3 
dígitos os quais o primeiro representa o número de linhas da grade, o segundo o número de colunas da grade e o 
terceiro a posição da grade onde será plotado o gráfico em questão.

A função **add_subplot** pode ser usada para se manipular cada **subplot** individualmente.

In [None]:
def f(t):
    return np.exp(-t) * np.cos(2*np.pi*t)
def fp(t):
    return -2*np.pi * np.exp(-t) * np.sin(2*np.pi*t) - np.e**(-t)*np.cos(2*np.pi*t)
def g(t):
    return np.sin(t) * np.cos(1/(t))
python_course_green = "#476042"
fig = plt.figure(figsize=(6, 4))
t = np.arange(-5.0, 1.0, 0.1)
sub1 = fig.add_subplot(221) 
sub1.set_title('The function f')        
sub1.plot(t, f(t))
sub2 = fig.add_subplot(222, facecolor="lightgrey")
sub2.set_title('fp, the derivation of f')
sub2.plot(t, fp(t))
t = np.arange(-3.0, 2.0, 0.02)
sub3 = fig.add_subplot(223)
sub3.set_title('The function g')
sub3.plot(t, g(t))
t = np.arange(-0.2, 0.2, 0.001)
sub4 = fig.add_subplot(224, facecolor="lightgrey")
sub4.set_title('A closer look at g')
sub4.set_xticks([-0.2, -0.1, 0, 0.1, 0.2])
sub4.set_yticks([-0.15, -0.1, 0, 0.1, 0.15])
sub4.plot(t, g(t))
plt.plot(t, g(t))
plt.tight_layout()
plt.show()
plt.savefig("figura.png")

# Bokeh

+ Bokeh é uma biblioteca de visualização interativa que utiliza o browser para apresentação.
+ Seu objetivo é prover a construção elegante e concisa de gráficos versáteis e estender sua capacidade com interatividade de alta performance sobre grande conjuntos de dados.
+ Bokeh pode ajudar quem deseja criar facilmente e rapidamente gráficos interativos, painéis e aplicações com dados.

In [None]:
from bokeh.plotting import figure, output_notebook, show

# aqui determina-se que os gráficos serão mostrados no próprio notebook
output_notebook()

# criando um novo gráfico com um título e rótulos para os eixos
p = figure(title="Exemplo gráfico de linha", x_axis_label='x', y_axis_label='y')

# adicionando uma linha com legenda e espessura da linha
p.line([1,2,3],[4,5,1], legend_label="Temp.", line_width=2)

# mostrando os resultados
show(p)

In [None]:
# o mesmo gráfico sendo mostrado em um outro arquivo HTML
from bokeh.plotting import output_file

output_file("linhas.html")
p = figure(title="Exemplo gráfico de linha", x_axis_label='x', y_axis_label='y')
p.line([1,2,3],[4,5,1], legend_label="Temp.", line_width=2)
show(p)

In [None]:
from bokeh.plotting import reset_output

# limpando o arquivo de saida para que o gráfico seja mostrado apenas no notebook
reset_output()

#mostrando no notebook
output_notebook()

# para gerar um gráfico de barras
p = figure(plot_width=400, plot_height=400)
p.vbar(x=[1, 2, 3], width=0.5, bottom=0,
       top=[1.2, 2.5, 3.7], color="firebrick")

show(p)

In [None]:
from bokeh.models import Range1d

# você pode determinar a faixa de variação dos eixos x e y usando tuplas
p = figure(plot_width=400, plot_height=400, x_range=(0, 20))

# usando o objeto Range1d
p.y_range = Range1d(0, 15)

p.circle([1, 2, 3, 4, 5], [2, 5, 8, 2, 7], size=10)

show(p)

In [None]:
# você pode fazer gráficos com dados qualitativos determinando qual eixo receberá as categorias
factors = ["a", "b", "c", "d", "e", "f", "g", "h"]
x = [50, 40, 65, 10, 25, 37, 80, 60]

p = figure(y_range=factors)

p.circle(x, factors, size=15, fill_color="orange", line_color="green", line_width=3)

show(p)

In [None]:
from numpy import pi, arange, sin, linspace

from bokeh.models import LinearAxis, Range1d

x = arange(-2*pi, 2*pi, 0.1)
y = sin(x)
y2 = linspace(0, 100, len(y))

p = figure(x_range=(-6.5, 6.5), y_range=(-1.1, 1.1))

p.circle(x, y, color="red")

p.extra_y_ranges = {"foo": Range1d(start=0, end=100)}
p.circle(x, y2, color="blue", y_range_name="foo")
p.add_layout(LinearAxis(y_range_name="foo"), 'left')

show(p)

In [None]:
# dados de entrada
x = [0.1, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0]
y0 = [i**2 for i in x]
y1 = [10**i for i in x]
y2 = [10**(i**2) for i in x]

# criando um novo gráfico
p = figure(
   tools="pan,box_zoom,reset,save",
   y_axis_type="log", y_range=[0.001, 10**11], title="Exemplo com eixo na escala logarítmica",
   x_axis_label='sections', y_axis_label='particles'
)

# adicionando os gráficos que serão mostrados
p.line(x, x, legend_label="y=x")
p.circle(x, x, legend_label="y=x", fill_color="white", size=8)
p.line(x, y0, legend_label="y=x^2", line_width=3)
p.line(x, y1, legend_label="y=10^x", line_color="red")
p.circle(x, y1, legend_label="y=10^x", fill_color="red", line_color="red", size=6)
p.line(x, y2, legend_label="y=10^x^2", line_color="orange", line_dash="4 4")

# show the results
show(p)


In [None]:
import numpy as np

from bokeh.layouts import gridplot

# gerando os dados
N = 100
x = np.linspace(0, 4*np.pi, N)
y0 = np.sin(x)
y1 = np.cos(x)
y2 = np.sin(x) + np.cos(x)

# criando um novo gráfico
s1 = figure(width=250, plot_height=250, title=None)
s1.circle(x, y0, size=10, color="navy", alpha=0.5)

# criando um novo gráfico e compartilhando as faixas de variação de ambos os eixos
s2 = figure(width=250, height=250, x_range=s1.x_range, y_range=s1.y_range, title=None)
s2.triangle(x, y1, size=10, color="firebrick", alpha=0.5)

# criando um novo gráfico e compartilhando apenas a faixa de variação do eixo X
s3 = figure(width=250, height=250, x_range=s1.x_range, title=None)
s3.square(x, y2, size=10, color="olive", alpha=0.5)

# colocando os subgráficos em um grid plot e omitindo a barra de ferramentas
p = gridplot([[s1, s2, s3]], toolbar_location=None)

# mostrando os resultados
show(p)


In [None]:
from bokeh.plotting import *
from bokeh.models import ColumnDataSource

# gerando os dados
N = 300
x = np.linspace(0, 4*np.pi, N)
y0 = np.sin(x)
y1 = np.cos(x)

# criando um columndatasource para os gráficos compartilharem
source = ColumnDataSource(data=dict(x=x, y0=y0, y1=y1))

TOOLS = "pan,wheel_zoom,box_zoom,reset,save,box_select,lasso_select"

# criando um novo gráfico
left = figure(tools=TOOLS, width=350, height=350, title=None)
left.circle('x', 'y0', source=source)

# criando um novo gráfico
right = figure(tools=TOOLS, width=350, height=350, title=None)
right.circle('x', 'y1', source=source)

# colocando os subgráficos em um grid
p = gridplot([[left, right]])

# mostrando os resultados
show(p)

In [None]:
# é possível fazer gráficos  utilizando as colunas de um DataFrame Pandas
from bokeh.sampledata.iris import flowers as df

print(df)

In [None]:
p = figure(plot_width=400, plot_height=400)
p.circle('petal_length', 'petal_width', source=df)
show(p)

In [None]:
# dicionário que contém as cores nomeadas
from matplotlib.colors import cnames

colors = list(cnames.keys())

p = figure(plot_width=400, plot_height=400)
for i,column in enumerate(df.columns):
    if column != "petal_length":
        p.circle("petal_length", column, source=df, color=colors[i+10])
show(p)

### Exercício
+ Abra o arquivo pressao_vapor.csv que contém valores de pressão de vapor do tetracloreto de carbono e as respectivas temperaturas de ebulição.
+ Construa uma nova tabela onde estarão apresentados também a temperatura em Kelvin, o recíproco da temperatura absoluta, o respectivo valor médio da pressão (p) a ela associada, a razão p/p\*, na qual p\* é 760 mmHg e o logaritmo neperiano dessa razão.
+ Fazer um gráfico de ln p/p\* em função do recíproco da temperatura absoluta.
+ Determinar os coeficientes da melhor reta por meio do método de regressão linear
+ Traçar a melhor reta escrevendo a equação da mesma na legenda do gráfico.
+ Calcular o valor do calor de vaporização do tetracloreto de carbono sabendo-se que 
    + $\ln \frac{p}{p*} = - \frac{\Delta_{vap}H_m}{R}\frac{1}{T} + \frac{\Delta_{vap}H_m}{R}\frac{1}{T*}$