# Uma breve introdução à NumPy

<br>

Na aula de hoje, iremos estudar um pouco a NumPy, o principal módulo para cálculos numéricos da Python. Ela será nossa companheira ao longo de todo o curso. Por isso, é importante que nos debrucemos cuidadosamente sobre ela.

## Módulos, bibliotecas e a NumPy

Um **módulo** é um arquivo contendo definições e comandos em Python, o qual pode ser importado por outros módulos.
O nome de um módulo é o mesmo nome do arquivo `.py` contendo seu código.
Ele é compilado no momento de sua importação, gerando arquivos `.pyc`, que são carregados pelo interpretador.
Uma coleção de módulos dá origem ao que chamamos de **pacote** ou **biblioteca**.

O projeto __[SciPy](https://www.scipy.org/)__ visa desenvolver uma plataforma para a implementação de softwares científicos e de engenharia.
A biblioteca __[NumPy](https://www.numpy.org/)__, parte deste projeto, inclue tipos numéricos primitivos, arranjos numéricos semelhantes às listas e diversos algoritmos que manipulam estes dados.

## Importando a NumPy

Para que possamos utilizar a NumPy precisamos, primeiro, nos assegurar de que ela está instalada. Podemos verificar isso ao tentarmos importá-la:

In [None]:
import numpy as np

Se a execução da célula anterior não retornar qualquer erro, podemos  acessar um objeto `func` definido na NumPy escrevendo `np.func`.
Caso contrário, é sinal de que ela precisa ser instalada. A instalação de pacotes Python depende do sistema operacional.

- Windows:
    1. Digite `Janela` + `R` e pressione `Enter`;
    1. Digite `cmd` e pressione `Enter`;
    1. No terminal ("tela preta"), digite `pip install numpy` e pressione `Enter`

- Linux (distro com `apt`):
    1. Abra o terminal;
    1. `pip3 install numpy` e pressione `Enter`

Agora, retorne ao início desta seção e refaça o teste de importação.

## Tipos de dados da Numpy

### Tipos primitivos

`bool`
`int32`
`int64`
`uint32`
`uint64`
`float32`
`float64`
`complex64`
`complex128`

Podemos exibir as características de um tipo real específico usando a `numpy.finfo`:

In [None]:
print(np.finfo(np.float))

As informações de tipos inteiros são dadas por `numpy.iinfo`:

In [None]:
print(np.iinfo(np.int))

### Constantes

A NumPy possui diversas constantes matemáticas pré-definidas. Algumas delas são:

In [None]:
np.e, np.pi, np.inf, np.nan

A lista completa dessas constantes está disponível __[aqui](https://docs.scipy.org/doc/numpy/reference/constants.html)__.

### Arranjos

A `numpy.array` é o principal objeto da NumPy, um tipo de arranjo numérico **homogêneo**.
Apesar de ser um tipo *mutável*, o tamanho de um arranjo NumPy é **imutável** e, por isso, não pode ser vazio.

#### Construção de arranjos

Construimos arranjos usando listas de listas, como fizemos na aula passada. Por exemplo,

In [None]:
A = np.array([[1,3.5],[-1,0],[1+1j,3.]])
A

Eles são muito mais do que simples arranjos.

In [None]:
A = np.arange(15).reshape(3, 5)
A,A.shape,A.ndim,A.dtype.name,A.itemsize,A.size,type(A)

Há também funções de construção especiais. Tem função para criar um arranjo definindo por um "range":

In [None]:
np.arange(10)

Função para criar arranjos nulos:

In [None]:
np.zeros((2, 3))

Função que permite criar subdivisões regulares de um intervalo. Por exemplo, abaixo criamos 6 pontos regularmente espaçados no intervalo $[1,4]$:

In [None]:
np.linspace(1., 4., 6)

Há ainda geradores aleatórios, usando diversas distribuições de probabilidade, para arranjos de números reais:

In [None]:
np.random.uniform(-1,1,5)

e números inteiros:

In [None]:
np.random.randint(10,size=5)

#### Acessando elementos de um arranjo

Os elementos de um `np.array` podem ser acessados usando índices. Pomos fazer

In [None]:
A = np.array([[3, 8, 2, 3],[8, 9, 7, 2],[6, 5, 5, 7],[6, 4, 5, 9]])
A[0,0],A[1,1]

ou

In [None]:
A[0][0],A[1][1]

no entanto, a primeira forma é mais rápida, pois no segundo caso, a expressão `A[i][j]` primeiro extrai uma cópia da linha `i` de `A` para depois retornar o $j$-ésimo elemento desta linha.

#### Operações com arranjos

As operações +, -, * aplicadas a arranjos da NumPy acontecem **elemento a elemento**. Vejamos:

In [None]:
A = np.array([[3, 8, 2, 3],[8, 9, 7, 2],[6, 5, 5, 7],[6, 4, 5, 9]])
B = np.array([[7, 1, 3, 0],[6, 0, 2, 6],[2, 2, 1, 9],[8, 6, 7, 1]])
A*B

Atualmente, é recomendado efetuar o produto de matrizes utilizando a função `numpy.dot` (produto escalar).

In [None]:
np.dot(A,B)

## Funções universais

A NumPy possui diversas funções que operam sobre valores escalares e vetoriais. Uma _função universal_ (`ufunc`) é uma função que 
tem como entrada e saída arranjos e realiza operações elemento a elemento. Cada `ufunc` possui regras de espalhamento (__[broadcasting](https://docs.scipy.org/doc/numpy/reference/ufuncs.html#ufuncs-broadcasting)__) quando da operação em arranjos com dimensões distintas.

Por exemplo, considere um arranjo $\mathbf{a} = \begin{bmatrix}0 & 1 & 1 & 2 & 3 & 5 & 8\end{bmatrix}$ e suponha que precisamos adicionar duas unidades a cada elemento de $\mathbf{a}$. Podemos fazer isto sem _broadcasting_:

In [None]:
A = np.array([0,1,1,2,3,5,8])
B = np.array([2,2,2,2,2,2,2])
A = A + B
A

ou aproveitando esta funcionalidade:

In [None]:
A = np.array([0,1,1,2,3,5,8])
A = A + 2
A

Todas as operações aritméticas (+, -, *, ...) com arranjos da NumPy utilizam a técnica de espalhamento. Outras funções universais bastante usadas por cientistas e engenheiros são:

|    |  |  |  | |
| ---  | --- | --- | --- | --- |
| sign | abs | angle | real | imag |
| conj | fix | cos | sin | tan |
| arccos | arcsin | arctan | arctan2 | cosh |
| sinh | tanh | arccosh | arcsinh | arctanh |
| exp  | log | log10 | sqrt | power |
| dot | vdot |       |      |       |

Você já deve estar familiarizado com algumas delas. Mas se tiver alguma dúvida, consulte a __[docstring](https://en.wikipedia.org/wiki/Docstring)__ da função utilizando o operador `?`. Por exemplo,

In [None]:
np.power?

## O auditor matricial

A Prefeitura de Frevolândia lançou edital para a contratação de novos *auditores matriciais*.
O requisito mínimo é ter cursado as disciplinas de Álgebra Linear e Programação Computacional em nível de graduação.
Compete ao auditor matricial verificar se o produto de duas matrizes quadradas de ordem $n$ está correto.
Ele atuará na fiscalização da mais nova empresa fornecedora de produtos matriciais, a Linear Consultoria, contratada para calcular o produto de matrizes fornecidas pela Secretaria da Previdência do município.
Dadas duas matrizes $\mathbf{A}$ e $\mathbf{B}$, fornecidas pela secretaria, e uma matriz $\mathbf{C}$ calculada pela Linear Consultoria, o auditor deverá verificar se vale a identidade: $\mathbf{C} = \mathbf{A}\mathbf{B}$.

Entusiasmado com o concurso, Cícero decidiu se antecipar e já ir pensando como poderia realizar esses testes da forma mais rápida possível.

### Método determinístico

A primeira ideia que veio à mente de Cícero foi um método força bruta: calcular o produto $\mathbf{A}\mathbf{B}$ separadamente e verificar, elemento por elemento, se vale a igualdade $\mathbf{C} = \mathbf{A}\mathbf{B}$. Por conveniência, ele decidiu fazer seus testes usando Python e a biblioteca NumPy e acabou implementando a função abaixo.

In [None]:
# Complete esta função.
def forca_bruta(A,B,C):
    """Esta função verifica se vale a igualdade C = AB, usando força bruta.
    
    Argumentos:
        A,B,C (numpy.array): Matrizes quadradas com mesmas dimensões.

    Retorno:
        res (bool): True se verdadeiro, False caso contrário.
    """
    
    # Digite seu código a partir daqui.

*Verificação fictícia 1.*

In [None]:
%%time
# Digite seu código a partir daqui.

*Verificação fictícia 2.*

In [None]:
%%time
# Digite seu código a partir daqui.

### Método probabilístico

Refletindo sobre o problema, Cícero se fez a seguinte pergunta:

<blockquote>Dado um vetor $\mathbf{x}$ arbitrário, será que se tivermos $\mathbf{C} = \mathbf{A}\mathbf{B}$, também teremos $\mathbf{C}\mathbf{x} = \mathbf{A}\mathbf{B}\mathbf{x}$?
</blockquote>

#### **Exercício.**
Responda à pergunta de Cícero.

_Escreva sua resposta aqui._

Usando esta linha de raciocínio, ele chegou no seguinte algoritmo:

1. Gere aleatoriamente um vetor $\mathbf{x}$ composto apenas por $0$'s e $1$'s
2. Calcule os produtos $\mathbf{C}\mathbf{x}$ e $\mathbf{A}(\mathbf{B}\mathbf{x})$
3. Se os resultados do item (2) forem os mesmos, a resposta será *sim*. Caso contrário, será *não*.

#### **Exercício.**
Você vê algum problema com o algoritmo de Cícero?

*Digite sua resposta nesta célula*

De repente, Cícero se enche de felicidade, por um *insight* que acaba de ter. Ele decide então alterar seu algoritmo para:

1. Repita $50$ vezes o seguinte:  
  1.1 Gere aleatoriamente um vetor $\mathbf{x}$ composto apenas por $0$'s e $1$'s.  
  1.2 Calcule os produtos $\mathbf{C}\mathbf{x}$ e $\mathbf{A}(\mathbf{B}\mathbf{x})$.  
  1.3 Se os resultados do item (1.2) forem diferentes, a resposta será *não*. Caso contrário, continue o laço.
2. Se você chegou aqui, a resposta será *sim*.

#### **Exercício.**
Sua tarefa agora é implementar a última versão do algoritmo de Cícero.

In [None]:
# Complete esta função.
def probabilistico(A,B,C):
    """Esta função verifica se vale a igualdade C = AB, usando um algoritmo probabilístico.
    
    Argumentos:
        A,B,C (numpy.array): Matrizes quadradas com mesmas dimensões.

    Retorno:
        res (bool): True se verdadeiro, False caso contrário.
    """

    # Digite seu código a partir daqui.

*Verificação fictícia 1.*

In [None]:
%%time
# Digite seu código a partir daqui.

*Verificação fictícia 2.*

In [None]:
%%time
# Digite seu código a partir daqui.

Boa sorte, Cícero!

#### **Desafio.**
O algoritmo mais natural para a realização do produto de duas matrizes reais $n\times n$ requer da ordem de $n^3$ operações aritméticas.
No entanto, utilizando a abordagem de dividir para conquistar, Strassen (1969) conseguiu mostrar que é possível reduzir isto para $O(n^{2{,}8074})$.
O desafio de hoje é implementar o algoritmo probabilístico acima utilizando como ferramenta o algoritmo de Strassen.

In [None]:
def matmat_strassen(A,B):
    return None # altere esta linha, caso necessário

*Verificação da função `matmat_strassen`.*

In [None]:
%%time
# Digite seu código a partir daqui.

In [None]:
def prob_strassen(A,B):
    return None # altere esta linha, caso necessário

*Verificação da função `prob_strassen` 1.*

In [None]:
%%time
# Digite seu código a partir daqui.

*Verificação da função `prob_strassen` 2.*

In [None]:
%%time
# Digite seu código a partir daqui.

## Saiba mais

- Ao longo do curso, aprenderemos muito mais sobre a NumPy. Se você ficou curioso e quer saber mais sobre ela, sugiro que acesse: __[https://www.numpy.org/](https://www.numpy.org/)__

- O problema do "auditor matricial" foi inspirado na Miniatura 11 do livro do professor Jiří Matoušek,  __[Thirty-three Miniatures: Mathematical and Algorithmic Appplications of Linear Algebra](https://kam.mff.cuni.cz/~matousek/stml-53-matousek-1.pdf)__, *Student Mathematical Library*, v. 53, AMS, 2010.


- Para saber um pouco mais sobre o algoritmo de Strassen, sugiro dar uma lida no livro **Algoritmos: teoria e prática**, de Thomas H. Cormen, Charles E Leiserson, Ronald L. Rivest e Clifford Stein, Rio de Janeiro, Elsevier, 2012.

<br>
<p>&copy; 2020 Vicente Helano<br>
UFCA | Centro de Ciências e Tecnologia</p>