### Estudos Miranda: Curso intensivo em Python e SciPy

In [None]:
%reload_ext watermark
%watermark -a "Caique Miranda" -gu "caiquemiranda" -iv

### Visualização de dados com matplotlib

Depois de discutir nos capítulos anteriores as bibliotecas Python responsáveis pelos dados
processamento, agora é a vez de você conhecer uma biblioteca que cuida da visualização. Esse
biblioteca é matplotlib.


A visualização de dados é muitas vezes subestimada na análise de dados, mas na verdade é uma
fator muito importante porque a representação de dados incorreta ou ineficiente pode arruinar um
caso contrário excelente análise. Neste capítulo, você descobrirá os vários aspectos do
biblioteca matplotlib, incluindo como ela é estruturada e como maximizar o potencial que
oferece.

#### Biblioteca matplotlib

matplotlib é uma biblioteca Python especializada no desenvolvimento de gráficos bidimensionais
gráficos (incluindo gráficos 3D). Nos últimos anos, tem sido difundido no meio científico e
círculos de engenharia (http://matplolib.org).

Entre todas as características que a tornaram a ferramenta mais utilizada na área gráfica
representação de dados, há alguns que se destacam:

• Extrema simplicidade na sua utilização
• Desenvolvimento gradual e visualização interativa de dados
• Expressões e texto em LaTeX
• Maior controle sobre os elementos gráficos
• Exporte para vários formatos, como PNG, PDF, SVG e EPS

matplotlib é projetado para reproduzir tanto quanto possível um ambiente semelhante ao
MATLAB em termos de visualização gráfica e forma sintática. Esta abordagem provou
bem-sucedido, pois soube explorar a experiência do software (MATLAB) que
está no mercado há vários anos e hoje é difundido em todos os profissionais técnico-científicos
círculos. O matplotlib não é apenas baseado em um esquema conhecido e bastante familiar
para a maioria dos especialistas na área, mas também explora as otimizações que ao longo do
anos levaram a uma dedutibilidade e simplicidade na sua utilização, o que torna esta biblioteca também
uma excelente escolha para aqueles que abordam a visualização de dados pela primeira vez, especialmente
aqueles sem nenhuma experiência com aplicativos como MATLAB ou similares.

Além da simplicidade e dedutibilidade, a biblioteca matplotlib herdou
interatividade do MATLAB também. Ou seja, o analista pode inserir comando após
comando para controlar o desenvolvimento gradual de uma representação gráfica de dados.
Este modo é adequado para as abordagens mais interativas do Python como o IPython
QtConsole e IPython Notebook (consulte o Capítulo 2), fornecendo assim um ambiente
para análise de dados que tem pouco a invejar de outras ferramentas como Mathematica, IDL ou
MATLAB.

A genialidade de quem desenvolveu esta bela biblioteca foi usar e incorporar
as coisas boas atualmente disponíveis e em uso na ciência. Isso não é apenas limitado, como nós
vimos, ao modo de operação do MATLAB e similares, mas também aos modelos de
formatação de expressões científicas e símbolos representados pelo LaTeX. Por causa de sua
grande capacidade de exibição e apresentação de expressões científicas, o LaTeX tem sido um
elemento insubstituível em qualquer publicação ou documentação científica, onde a necessidade de
representar visualmente expressões como integrais, somatórios e derivadas é obrigatório.
Portanto matplotlib integra este notável instrumento para melhorar a
capacidade representativa das cartas.

Além disso, você não deve esquecer que o matplotlib não é um aplicativo separado, mas
uma biblioteca de uma linguagem de programação como Python. Portanto, também aproveita ao máximo o
potencial que as linguagens de programação oferecem. matplotlib parece uma biblioteca de gráficos
que permite gerenciar programaticamente os elementos gráficos que compõem um gráfico
para que a exibição gráfica possa ser controlada em sua totalidade. A capacidade de programar
a representação gráfica permite o gerenciamento da reprodutibilidade dos dados
representação em vários ambientes e especialmente quando você faz alterações ou
quando os dados são atualizados.

Além disso, como matplotlib é uma biblioteca Python, ela permite que você explore todo o
potencial de outras bibliotecas disponíveis para qualquer desenvolvedor que implemente com esta
linguagem. De fato, no que diz respeito à análise de dados, o matplotlib normalmente coopera com um conjunto
de outras bibliotecas como NumPy e pandas, mas muitas outras bibliotecas podem ser integradas
sem qualquer problema.

#### The matplotlib Architecture

One of the key tasks that matplotlib must take on is provide a set of functions and tools
that allow representation and manipulation of a Figure (the main object), along with
all internal objects of which it is composed. However, matplotlib not only deals with
graphics but also provides all the tools for the event handling and the ability to animate
graphics. So, thanks to these additional features, matplotlib proves to be capable of
producing interactive charts based on the events triggered by pressing a key on the
keyboard or on mouse movement.

The architecture of matplotlib is logically structured into three layers, which are
placed at three different levels (see Figure 7-2). The communication is unidirectional,
that is, each layer can communicate with the underlying layer, while the lower layers
cannot communicate with the top ones.

Figure 7-2. The three layers of the matplotlib architecture
The three layers are as follows:
• Scripting
• Artist
• Backend

#### Backend Layer

In the diagram of the matplotlib architecture, the layer that works at the lowest level is
the Backend layer. This layer contains the matplotlib APIs, a set of classes that play the
role of implementation of the graphic elements at a low level.

• FigureCanvas is the object that embodies the concept of
drawing area.
• Renderer is the object that draws on FigureCanvas.
• Event is the object that handles user inputs (keyboard and
mouse events).

#### Artist Layer

As an intermediate layer, we have a layer called Artist. All the elements that make up a
chart, such as the title, axis labels, markers, etc., are instances of the Artist object. Each of
these instances plays its role within a hierarchical structure

There are two Artist classes: primitive and composite.

• The primitive artists are individual objects that constitute the basic
elements to form a graphical representation in a plot, for example a
Line2D, or as a geometric figure such as a Rectangle or Circle, or even
pieces of text.
• The composite artists are those graphic elements present in a chart
that are composed of several base elements, namely, the primitive
artists. Composite artists are for example the Axis, Ticks, Axes, and
Figures

Generally, working at this level you will have to deal often with objects in higher
hierarchy as Figure, Axes, and Axis. So it is important to fully understand what these
objects are and what role they play within the graphical representation. Figure 7-4
shows the three main Artist objects (composite artists) that are generally used in all
implementations performed at this level.

• Figure is the object with the highest level in the hierarchy. It
corresponds to the entire graphical representation and generally can
contain many Axes.
• Axes is generally what you mean as plot or chart. Each Axis object
belongs to only one Figure, and is characterized by two Artist Axis
(three in the three-dimensional case). Other objects, such as the title,
the x label, and the y label, belong to this composite artist.
• Axis objects that take into account the numerical values to be
represented on Axes, define the limits and manage the ticks (the
mark on the axes) and tick labels (the label text represented on each
tick). The position of the tick is adjusted by an object called a Locator
while the formatting tick label is regulated by an object called a
Formatter.

#### Scripting Layer (pyplot)

Artist classes and their related functions (the matplotlib API) are particularly suitable to
all developers, especially for those who work on web application servers or develop the
GUI. But for purposes of calculation, and in particular for the analysis and visualization
of data, the scripting layer is best. This layer consists of an interface called pyplot.

#### pylab and pyplot

In general there is talk of pylab and pyplot. But what is the difference between these
two packages? Pylab is a module that is installed along with matplotlib, while pyplot
is an internal module of matplotlib. Often you will find references to one or the other
approach.

In [None]:
from pylab import *
#and
import matplotlib.pyplot as plt
import numpy as np

Pylab combines the functionality of pyplot with the capabilities of NumPy in a single
namespace, and therefore you do not need to import NumPy separately. Furthermore,
if you import pylab, pyplot and NumPy functions can be called directly without any
reference to a module (namespace), making the environment more similar to MATLAB.

In [None]:
plot(x,y)
array([1,2,3,4])
# Instead of
plt.plot()
np.array([1,2,3,4]

The pyplot package provides the classic Python interface for programming the
matplotlib library, has its own namespace, and requires the import of the NumPy
package separately. This approach is the one chosen for this book; it is the main topic of
this chapter; and it will be used for the rest of the book. In fact this choice is shared and
approved by most Python developers.

---

### Fim.