# Uma breve introdução à Numpy

<br>

Na aula de hoje, iremos estudar um pouco a NumPy, o principal módulo para cálculos numéricos da Python. Ela será nossa companheira ao longo de todo o curso. Por isso, é importante que nos debrucemos cuidadosamente sobre ela.

## Módulos, bibliotecas e a NumPy

Um **módulo** é um arquivo contendo definições e comandos em Python, o qual pode ser importado por outros módulos.
O nome de um módulo é o mesmo nome do arquivo `.py` contendo seu código.
Ele é compilado no momento de sua importação, gerando arquivos `.pyc`, que são carregados pelo interpretador.
Uma coleção de módulos dá origem ao que chamamos de **pacote** ou **biblioteca**.

O projeto __[SciPy](https://www.scipy.org/)__ visa desenvolver uma plataforma para a implementação de softwares científicos e de engenharia.
A biblioteca __[NumPy](https://www.numpy.org/)__, parte deste projeto, inclue tipos numéricos primitivos, arranjos numéricos semelhantes às listas e diversos algoritmos que manipulam estes dados.

## Importando a NumPy

Para que possamos utilizar a NumPy precisamos, primeiro, nos assegurar de que ela está instalada. Podemos verificar isso ao tentarmos importá-la:

In [24]:
import numpy as np

Se a execução da célula acima não retornar qualquer erro, podemos  acessar um objeto `func` definido na NumPy escrevendo `np.func`.
Caso contrário, é sinal de que ela precisa ser instalada. A instalação de pacotes Python depende do sistema operacional.

- Windows:
    1. Digite `Janela` + `R` e pressione `Enter`;
    1. Digite `cmd` e pressione `Enter`;
    1. No terminal ("tela preta"), digite `pip install numpy` e pressione `Enter`

- Linux (distro com `apt`):
    1. Abra o terminal;
    1. `pip3 install numpy` e pressione `Enter`

Agora, retorne ao início desta seção e refaça o teste de importação.

## Tipos de dados

### Tipos primitivos

`bool`
`int32`
`int64`
`uint32`
`uint64`
`float32`
`float64`
`complex64`
`complex128`

Podemos exibir as características de um tipo real específico usando a `numpy.finfo`:

In [3]:
print(np.finfo(np.float))

Machine parameters for float64
---------------------------------------------------------------
precision =  15   resolution = 1.0000000000000001e-15
machep =    -52   eps =        2.2204460492503131e-16
negep =     -53   epsneg =     1.1102230246251565e-16
minexp =  -1022   tiny =       2.2250738585072014e-308
maxexp =   1024   max =        1.7976931348623157e+308
nexp =       11   min =        -max
---------------------------------------------------------------



As informações de tipos inteiros são dadas por `numpy.iinfo`:

In [30]:
print(np.iinfo(np.int))

Machine parameters for int64
---------------------------------------------------------------
min = -9223372036854775808
max = 9223372036854775807
---------------------------------------------------------------



## Constantes

A NumPy possui diversas constantes matemáticas pré-definidas. Algumas delas são:

In [4]:
np.e, np.pi, np.inf, np.nan

(2.718281828459045, 3.141592653589793, inf, nan)

A lista completa dessas constantes está disponível __[aqui](https://docs.scipy.org/doc/numpy/reference/constants.html)__.

## Arranjos

A `numpy.array` é o principal objeto da NumPy, um tipo de arranjo numérico homogêneo.
O tamanho de um arranjo é imutável e não pode ser criado com elementos vazios.

#### Construção de arranjos

In [5]:
a = np.array([[1,3.5],[-1,0],(1+1j,3.)])
a

array([[ 1. +0.j,  3.5+0.j],
       [-1. +0.j,  0. +0.j],
       [ 1. +1.j,  3. +0.j]])

Eles são muito mais do que simples arranjos.

In [6]:
a = np.arange(15).reshape(3, 5)
a,a.shape,a.ndim,a.dtype.name,a.itemsize,a.size,type(a)

(array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]]), (3, 5), 2, 'int64', 8, 15, numpy.ndarray)

Há também funções de construção especiais:

In [7]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [8]:
np.zeros((2, 3))

array([[0., 0., 0.],
       [0., 0., 0.]])

In [9]:
np.linspace(1., 4., 6)

array([1. , 1.6, 2.2, 2.8, 3.4, 4. ])

#### Acessando elementos de um arranjo

In [10]:
A = np.array([[3, 8, 2, 3],[8, 9, 7, 2],[6, 5, 5, 7],[6, 4, 5, 9]])
A[0,0],A[1,1]

(3, 9)

#### Operações com arranjos

As operações +, -, * são elemento a elemento. Por exemplo,

In [11]:
A = np.array([[3, 8, 2, 3],[8, 9, 7, 2],[6, 5, 5, 7],[6, 4, 5, 9]])
B = np.array([[7, 1, 3, 0],[6, 0, 2, 6],[2, 2, 1, 9],[8, 6, 7, 1]])
A*B

array([[21,  8,  6,  0],
       [48,  0, 14, 12],
       [12, 10,  5, 63],
       [48, 24, 35,  9]])

Para efetuarmos o produto matricial, conforme definido em álgebra, utilizamos a função `numpy.dot` (produto escalar).

In [12]:
np.dot(A,B)

array([[ 97,  25,  48,  69],
       [140,  34,  63, 119],
       [138,  58,  82,  82],
       [148,  70,  94,  78]])

The class of universal functions or ufuncs adds considerably to the usefulness of NumPy.
A ufunc is a function which when applied to a scalar generates a scalar, but when applied
to an array produces an array of the same size, by operating component-wise. Some of
the ufuncs which are most useful for scientists are shown in Table 4.1.

|    |  |  |  | |
| ---  | --- | --- | --- | --- |
| sign | abs | angle | real | imag |
| conj | fix | cos | sin | tan |
| arccos | arcsin | arctan | arctan2 | cosh |
| sinh | tanh | arccosh | arcsinh | arctanh |
| exp  | log | log10 | sqrt | power |
| dot | vdot |       |      |       |

Você já deve estar familiarizado com algumas delas. Mas se tiver alguma dúvida, consulte a __[docstring](https://en.wikipedia.org/wiki/Docstring)__ da função. Por exemplo,

In [31]:
np.power?

[0;31mCall signature:[0m  [0mnp[0m[0;34m.[0m[0mpower[0m[0;34m([0m[0;34m*[0m[0margs[0m[0;34m,[0m [0;34m**[0m[0mkwargs[0m[0;34m)[0m[0;34m[0m[0m
[0;31mType:[0m            ufunc
[0;31mString form:[0m     <ufunc 'power'>
[0;31mFile:[0m            ~/.local/lib/python3.5/site-packages/numpy/__init__.py
[0;31mDocstring:[0m      
power(x1, x2, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj])

First array elements raised to powers from second array, element-wise.

Raise each base in `x1` to the positionally-corresponding power in
`x2`.  `x1` and `x2` must be broadcastable to the same shape. Note that an
integer type raised to a negative integer power will raise a ValueError.

Parameters
----------
x1 : array_like
    The bases.
x2 : array_like
    The exponents. If ``x1.shape != x2.shape``, they must be broadcastable to a common shape (which becomes the shape of the output).
out : ndarray, None, or tuple of 

## O auditor matricial

A Prefeitura de Frevolândia lançou edital para a contratação de novos *auditores matriciais*.
O requisito mínimo é ter cursado as disciplinas de Álgebra Linear e Programação Computacional em nível de graduação.
Compete ao auditor matricial verificar se o produto de duas matrizes quadradas de ordem $n$ está correto.
Ele atuará na fiscalização da mais nova empresa fornecedora de produtos matriciais, a Linear Consultoria, contratada para calcular o produto de matrizes fornecidas pela Secretaria da Previdência do município.
Dadas duas matrizes $\mathbf{A}$ e $\mathbf{B}$, fornecidas pela secretaria, e uma matriz $\mathbf{C}$ calculada pela Linear Consultoria, o auditor deverá verificar que $\mathbf{C} = \mathbf{A}\mathbf{B}$.

Entusiasmado com o concurso, Cícero decidiu se antecipar e já ir pensando como poderia realizar esses testes da forma mais rápida possível.

### Método determinístico

A primeira ideia que veio à mente de Cícero foi um método força bruta: calcular o produto $\mathbf{A}\mathbf{B}$ separadamente e verificar, elemento por elemento, se vale a igualdade $\mathbf{C} = \mathbf{A}\mathbf{B}$. Por conveniência, ele decidiu fazer seus testes usando Python e a biblioteca NumPy e acabou implementando a função abaixo.

In [46]:
# Complete esta função.
def forca_bruta(A,B,C):
    """Esta função verifica se vale a igualdade C = AB, usando força bruta.
    
    Argumentos:
        A,B,C (numpy.array): Matrizes quadradas com mesmas dimensões.

    Retorno:
        res (bool): True se verdadeiro, False caso contrário.
    """
    
    # Seu código deve iniciar aqui embaixo.
    
    return True # altere/remova esta linha, caso necessário

*Verificação fictícia 1.*

In [43]:
%%time
A = np.array([[3, 8, 2, 3],[8, 9, 7, 2],[6, 5, 5, 7],[6, 4, 5, 9]])
B = np.array([[7, 1, 3, 0],[6, 0, 2, 6],[2, 2, 1, 9],[8, 6, 7, 1]])
C = np.array([[97, 25, 48, 69],[140, 34, 63, 119],[138, 58, 82, 82],[148, 70, 94, 78]])

forca_bruta(A,B,C)

CPU times: user 154 µs, sys: 0 ns, total: 154 µs
Wall time: 155 µs


True

*Verificação fictícia 2.*

In [45]:
%%time
C = np.array([[1, 1, 1, 4],[1, 0, 6, 9],[5, 5, 3, 1],[4, 0, 5, 3]])

forca_bruta(A,B,C)

CPU times: user 5 µs, sys: 137 µs, total: 142 µs
Wall time: 143 µs


False

### Método probabilístico

Refletindo sobre o problema, Cícero se fez a seguinte pergunta:

<blockquote>Dado um vetor $\mathbf{x}$ arbitrário, será que se tivermos $\mathbf{C} = \mathbf{A}\mathbf{B}$, também teremos $\mathbf{C}\mathbf{x} = \mathbf{A}\mathbf{B}\mathbf{x}$?
</blockquote>

#### **Exercício.**
Responda à pergunta de Cícero.

_Escreva sua resposta aqui._

Usando esta linha de raciocínio, ele chegou no seguinte algoritmo:

1. Gere aleatoriamente um vetor $\mathbf{x}$ composto apenas por $0$'s e $1$'s
2. Calcule os produtos $\mathbf{C}\mathbf{x}$ e $\mathbf{A}(\mathbf{B}\mathbf{x})$
3. Se os resultados do item (2) forem os mesmos, a resposta será *sim*. Caso contrário, será *não*.

#### **Exercício.**
Você vê algum problema com o algoritmo de Cícero?

*Digite sua resposta nesta célula*

De repente, Cícero se enche de felicidade, pelo *insight* que acaba de ter. Ele decide então alterar seu algoritmo para:

1. Repita $50$ vezes o seguinte:  
  1.1 Gere aleatoriamente um vetor $\mathbf{x}$ composto apenas por $0$'s e $1$'s.  
  1.2 Calcule os produtos $\mathbf{C}\mathbf{x}$ e $\mathbf{A}(\mathbf{B}\mathbf{x})$.  
  1.3 Se os resultados do item (1.2) forem diferentes, a resposta será *não*. Caso contrário, continue o laço.
2. Se você chegou aqui, a resposta será *sim*.

#### **Exercício.**
Sua tarefa agora é implementar a última versão do algoritmo de Cícero.

In [34]:
# Complete esta função.
def probabilistico(A,B,C):
    """Esta função verifica se vale a igualdade C = AB, usando um algoritmo probabilístico.
    
    Argumentos:
        A,B,C (numpy.array): Matrizes quadradas com mesmas dimensões.

    Retorno:
        res (bool): True se verdadeiro, False caso contrário.
    """
    
    # Seu código deve iniciar aqui embaixo.
    
    
    return True # altere/remova esta linha, caso necessário

*Verificação fictícia 1.*

In [37]:
%%time
C = np.array([[97, 25, 48, 69],[140, 34, 63, 119],[138, 58, 82, 82],[148, 70, 94, 78]])

probabilistico(A,B,C)

CPU times: user 50 µs, sys: 11 µs, total: 61 µs
Wall time: 66 µs


True

*Verificação fictícia 2.*

In [36]:
%%time
C = np.array([[1, 1, 1, 4],[1, 0, 6, 9],[5, 5, 3, 1],[4, 0, 5, 3]])

probabilistico(A,B,C)

CPU times: user 46 µs, sys: 10 µs, total: 56 µs
Wall time: 61.5 µs


True

Boa sorte, Cícero!

## Saiba mais

- Ao longo do curso, aprenderemos muito mais sobre a NumPy. Se você ficou curioso e quer saber mais sobre ela, sugiro que acesse: __[https://www.numpy.org/](https://www.numpy.org/)__

- O problema do "auditor matricial" foi inspirado na Miniatura 11 do livro do professor Jiří Matoušek,  __[Thirty-three Miniatures: Mathematical and Algorithmic Appplications of Linear Algebra](https://kam.mff.cuni.cz/~matousek/stml-53-matousek-1.pdf)__, *Student Mathematical Library*, v. 53, AMS, 2010.


<br>
<p>&copy; 2019 Vicente Helano<br>
UFCA | Centro de Ciências e Tecnologia</p>