# NumPy

O NumPy é um pacote para realizar cálculos numéricos com facilidade e eficiência. Ele é tradicionalmente importado com o nome `np`, como no comando abaixo.

In [None]:
import numpy as np

## Criando arrays

A principal estrutura de dados do NumPy é o *array*, que representa um array similar aos de C, mas com diversas operações simplificadas, como veremos.

Uma forma de criar arrays é criando-os inicialmente com todos os elementos nulos ou todos os elementos unitários.

In [None]:
np.zeros(10)

In [None]:
np.ones(10)

Note que o array criado tem valores de ponto flutuante; na verdade, de precisão dupla. Podemos especificar o tipo desejado dos elementos, se queremos algo diferente.

In [None]:
np.zeros(10, dtype=np.int)

Outra forma é especificar um valor para os elementos:

In [None]:
np.full(10, 42)

Neste caso, os elementos do array têm o mesmo tipo do valor fornecido:

In [None]:
np.full(10, 42.0)

Outra variante dessas formas de criação de arrays é quando, ao invés de fornecer o formato que desejamos do array, fornecemos um outro array, do qual o novo array irá copiar o formato (mas não os valores). Esta são as variantes `*_like`:

In [None]:
a1 = np.zeros(10)
a2 = np.zeros((3, 2))
a3 = np.zeros((2, 2, 2))
b1 = np.zeros_like(a1)
b2 = np.ones_like(a2)
b3 = np.full_like(a3, 11.)

In [None]:
a1, b1

In [None]:
a2

In [None]:
b2

In [None]:
a3

In [None]:
b3

Outra forma de criar um array é convertendo uma lista Python em um array.

In [None]:
potencias_10 = np.array([1, 10, 100, 1000, 10000])
potencias_10

Ao contrário de listas, todos os elementos de um array têm o mesmo tipo (haverá conversão de acordo com o necessário).

In [None]:
[1, 2, 4, 8.0, 16]

In [None]:
np.array([1, 2, 4, 8.0, 16])

In [None]:
np.array([1, 2.0, 4+5j, 6.0+7.0j])

Arrays podem ser indexados da mesma forma que listas.

In [None]:
potencias_10[2]

In [None]:
potencias_10[0:4:2]

Outras formas úteis de criar arrays permitem gerar valores consecutivos. Por exemplo, temos uma generalização do `range` de Python, mas que aceita valores de ponto flutuante e retorna um array:

In [None]:
np.arange(10)

In [None]:
np.arange(1, 10)

In [None]:
np.arange(1, 10, 2)

In [None]:
np.arange(1, 10, 1.5)

Outra opção similar é especificar o número de intervalos desejados entre o início e o final, ao invés de especificar a separação entre os valores (como acontece no `arange`).

In [None]:
np.linspace(1, 10, 10)

Note que no `linspace` o extremo superior é incluido.

In [None]:
np.linspace(0, 10, 10)

In [None]:
np.linspace(0, 10, 10+1)

Uma matriz identidade de certo tamanho pode ser criada pela função `identity`:

In [None]:
np.identity(8)

Para gerar várias cópias de certos valores, usamos a função `repeat`

In [None]:
np.repeat(3, 5)

In [None]:
np.repeat([1, 10], 3)

Se o array de valores fornecidos para repetição for multidimensional, ele é considerado simplesmente como uma sequência de valores (se nada mais for pedido):

In [None]:
np.repeat([[1,2], [3, 4]], 2)

Podemos também especificar um "eixo" (dimensão) no qual as repetições serão feitas:

In [None]:
np.repeat([[1,2], [3, 4]], 2, axis=0)

O eixo 0 é a primeira dimensão (linhas, no caso de uma matriz), portanto duplicamos cada uma das linhas.

In [None]:
np.repeat([[1,2], [3, 4]], 2, axis=1)

O eixo 1 é a segunda dimensão (colunas, no caso de uma matriz), portanto duplicamos cada uma das colunas.

Podemos também fornecer número diferente de repetições para cada linha ou coluna:

In [None]:
np.repeat([[1,2], [3, 4]], [1,2], axis=0)

In [None]:
np.repeat([[1,2], [3, 4]], [1,2], axis=1)

## Verificando propriedades de arrays

Podemos conserguir algumas informações sobre um array acessando alguns campos, como abaixo.

Para saber o número de dimensões, consultamos a propriedade `ndim`:

In [None]:
print(a1.ndim, a2.ndim, a3.ndim)

Chamamos de shape a descrição do número de elementos em cada dimensão do array.

In [None]:
potencias_10.shape

Arrays podem ser criados com mais do que uma dimensão. Para isso, passamos uma tupla com os tamanhos nas diversas dimensões.

In [None]:
m0 = np.zeros((5, 10))

In [None]:
m0

Mais tarde podemos consultar o shape para saber o formato do array.

In [None]:
m0.shape

In [None]:
m3 = np.ones((2, 2, 3))

In [None]:
m3

In [None]:
m3.shape

In [None]:
m4 = np.full((3, 3), 42.)
m4

Também podemos verificar qual o tipo de cada um dos elementos do array.

In [None]:
m3.dtype

In [None]:
zzeros = np.ones(10, dtype=np.complex)

In [None]:
zzeros

In [None]:
zzeros.dtype

O tamanho de um array é o número total de elementos, considerando todas as dimensões.

In [None]:
m3.size

In [None]:
potencias_10.size

## Operações sobre arrays

Uma das coisas que fazem com que os arrays permitam uma programação simples é que podemos realizar operações algébricas sobre um array, o que significa realizar essas operações sobre cada elemento do array.

In [None]:
2 * np.ones(10)

In [None]:
dois = np.full(10, 2.)
meio = np.full(10, 0.5)

In [None]:
dois - meio

In [None]:
dois * meio

In [None]:
dois / meio

In [None]:
3 * dois - meio / 0.1 + 4

In [None]:
3 * np.arange(10) - np.ones(10)

O NumPy também define diversas funções matemáticas que operam sobre arrays aplicando a função a cada um dos elementos do array.

In [None]:
np.exp(np.arange(10))

In [None]:
np.exp(1)

In [None]:
np.sin(np.linspace(0, 2*np.pi,10))

## Arrays aleatórios

Também é fornecido um módulo de geração de números pseudo-aleatórios:

In [None]:
np.random.random(10)

In [None]:
np.random.random((4,4))

Outras formas de gerar arrays aleatórios:

In [None]:
r1 = np.random.randint(1, 10, size=(3,3)) # Array 3x3 de números aleatórios entre 1 e 10 (10 excluído)
r2 = np.random.standard_normal(size=(2,4)) # Array 2x4 de número aleatórios com distribuição normal média 0, desvio padrão 1
r3 = 2 * np.random.standard_normal(size=(10,10)) + 12 # Este tem média 12 e desvio 2
r4 = np.random.gamma(3., 1.5, size=(2,2)) # Distribuição gamma com "shape" 3 e "escala" 1.5

Ver diversas outras opções na documentação.

## Valores especiais de arrays

Algumas funções especiais sobre arrays:

In [None]:
np.sum(np.ones(10))

In [None]:
np.sum(np.arange(10))

In [None]:
sum(np.ones(10))

In [None]:
np.prod(np.arange(1,10))

In [None]:
alea = np.random.random(100)

In [None]:
min(alea), max(alea)

In [None]:
np.cumsum(np.arange(10))

`cumsum` retorna um array que no índice `i` tem a soma dos valores do array original dos índices 0 até `i`.

Nestas operações, como em outras, podemos especificar um "eixo" (dimensão) na direção do qual as operações serão realizadas:

In [None]:
a = np.arange(1, 49, 2).reshape((6, 4))
a

In [None]:
np.sum(a, axis=0)

In [None]:
np.sum(a, axis=1)

In [None]:
np.max(a, axis=0)

In [None]:
np.min(a, axis=1)

In [None]:
np.cumsum(a)

In [None]:
np.cumsum(a, axis=0)

In [None]:
np.cumsum(a, axis=1)

## Indexação de arrays

Vejamos agora algumas formas de indexar arrays.

In [None]:
sequencia = 10 * np.arange(100)

Eles podem ser indexados como listas de Python.

In [None]:
sequencia[2]

In [None]:
sequencia[1:4]

In [None]:
sequencia[10:-10]

Arrays multidimensionais são indexados usando uma tupla como índice.

In [None]:
mat = np.array([[1, 2, 3], [10, 20, 30]])

In [None]:
mat.shape

In [None]:
mat

In [None]:
mat[0, 2]

In [None]:
mat[1, 1]

Usando slices em algum dos índices, pegamos todos os valores de índice correspondentes.

In [None]:
mat[:, 2]

In [None]:
mat[:, 0:2]

Também podemos fornecer um array de índices:

In [None]:
ind = np.arange(10, 90, 2)

In [None]:
ind

In [None]:
sequencia[ind]

Ou uma lista de índices (que será convertida implicitamente para um array).

In [None]:
sequencia[[4, 7]]

---

### DETALHE: *Visão (view) sobre um array*

Um fator importante a considerar é que quando indexamos um array, o valor retornado não é uma cópia dos valores do array original (como ocorre no caso de listas), mas sim o que é chamado de uma nova **visão** (*view*) dos elementos indexados.

Isso quer dizer que podemos alterar os elementos indexados diretamente.

In [None]:
sequencia

In [None]:
sequencia[ind] = -sequencia[ind]

In [None]:
sequencia

In [None]:
sequencia[ind] = -1

In [None]:
sequencia

---

Ainda uma opção bastante útil é usar um array the booleanos para indexar. Neste caso, o array the booleanos deve ter o mesmo tamanho do array indexado, e serão escolhidos os elementos para os quais o índice for `True`.

In [None]:
alguns = np.zeros_like(sequencia, dtype=np.bool) # em bool, 0 é False, 1 é True
alguns[3:10] = True
alguns[15:21] = True
alguns[80:90] = True
alguns

In [None]:
sequencia[alguns]

Uma das grandes utilidades disso é porque um array the booleanos é retornado quando fazemos comparação de arrays:

In [None]:
sequencia < 0

In [None]:
sequencia[sequencia < 0] = 0
# sequencia < 0 retorna um array de booleanos com True apenas nos elementos negativos
# sequencia[sequencia < 0] é o sub-array dos valores negativos de sequencia
# A todos os elementos desse sub-array, atribuimos 0
# Resultado final: os valores negativos de sequencia são zerados.
sequencia

In [None]:
m = np.array([[1, -2, 0], [-1, 2, 0]])
m

In [None]:
m < 0

In [None]:
m[m<0]

Podemos combinar comparações usando os operadores lógicos `&` (**e**), `|` (**ou**) e `~` (negação). Use sempre parêntesis para evitar problemas!

In [None]:
sequencia[(sequencia > 100) & (sequencia < 500)]

In [None]:
sequencia[(sequencia != 0) & ((sequencia % 20 != 0) | (sequencia % 100 == 0))]

In [None]:
sequencia[~((sequencia < 70) | (sequencia > 180))]

Arrays de booleanos também podem ser utilizados para verificar o conteúdo de um array, além de usar para indexação. Para isso, duas funções úteis são `any`, que verifica se algum dos valores é `True` e `all`, que verifica se todos os valores são `True`:

In [None]:
a = np.arange(10)
a

In [None]:
np.all(a >= 0)

In [None]:
np.all(a > 0)

In [None]:
np.any(a > 0)

In [None]:
np.any(a < 0)

Essas funções também podem receber um eixo de operação:

In [None]:
a = np.arange(12).reshape((3, 4))
a

In [None]:
np.any(a > 5, axis=1)

In [None]:
np.all(a < 10, axis=0)

Note que, num array multidimensional, nada impede que usemos tipos diferentes de indexação em cada uma das dimensões:

In [None]:
a = np.arange(0, 100).reshape((10, 10))
a

In [None]:
a[3, [1, 4, 7, 9]]

In [None]:
a[[3, 4, 8], 2:5]

In [None]:
a[1:-1:2, [True, False, False, True, False, False, False, False, True, True]]

## Reorganizando um array

Podemos também gerar **outra visão** de um array simplesmente encarando os mesmos valores como se fossem um array de outras dimensões.

In [None]:
ret = sequencia.reshape((10, 10))

In [None]:
sequencia.size, ret.size

In [None]:
sequencia.shape, ret.shape

In [None]:
ret

Como essa é uma outra visão, se alteramos o array `ret` estamos também alterando o array orginal `sequencia`.

In [None]:
ret[9, 9] = 9999

In [None]:
ret

In [None]:
sequencia

### Achatamento

Também podemos "achatar" um array multidimensional, isto é, considerá-lo apenas como uma sequência de valores. Uma forma de fazer isso é com a função `ravel`:

In [None]:
a = 2 * np.arange(16).reshape(4, 4)
a

In [None]:
b = np.ravel(a)
b

Note que os elementos foram sequencializados percorrendo por linhas. O resultado de um `ravel` feito assim é um **view**:

In [None]:
b[5] = -111
a

Podemos também pedir que os elementos sejam sequencializados *por colunas*, no estilo Fortran:

In [None]:
c = np.ravel(a, order='F') # 'F' de Fortran. Outra opção é 'C', que é o default
c

Uma diferença importante aqui é que, neste caso, temos uma **cópia**, e não um view:

In [None]:
c[5] = 10
c

In [None]:
a

Isto ocorre porque os elementos de `a` estão armazenados originalmente por linhas, então não é possível fornecer uma visão deles por colunas, e portanto precisamos fazer uma cópia.

Para evitar confusões entre cópias e visões, podemos usar o método `flatten`, que funciona de forma similar a `ravel`, mas sempre retorna uma cópia:

In [None]:
d = a.flatten()
d

In [None]:
d[5] = 10
d

In [None]:
a

In [None]:
e = a.flatten(order='F')
e

### Transposição

Também podemos realizar transposição em arrays:

In [None]:
a = np.arange(10).reshape(2,5)
a

In [None]:
b = np.transpose(a)
b

O resultado da transposição é um **view**!

In [None]:
b[2, 1] = -777
a

Existe também o *método* `transpose` e o *atributo* `T`, com o mesmo significado:

In [None]:
c = a.transpose()
c

In [None]:
a.T

In [None]:
a.T[2, 1] = 7
b

No caso de arrays de uma dimensão, transposição não tem nenhum efeito:

In [None]:
np.transpose(np.zeros(10))

No caso de arrays com mais do que duas dimensões, o comportamento default é inverter a ordem das dimensões:

In [None]:
a = np.arange(24).reshape((3, 2, 4))
a

In [None]:
b = np.transpose(a)
print(b.shape)
b

Mas você pode especificar num parâmetro opcional `axes` uma tupla com a ordem desejada das dimensões:

In [None]:
c = np.transpose(a, axes=(0, 2, 1))
print(c.shape)
c

In [None]:
d = np.transpose(a, axes=(2, 0, 1))
print(d.shape)
d

O mesmo vale para o método `transpose`. O atributo `T` sempre reverte todas as dimensões:

In [None]:
print(a.T.shape)
a.T

Em arrays com múltiplas dimensões, se você quer apenas transpor duas das dimensões, fica mais simples usar a função `swapaxes` (ou o método de mesmo nome):

In [None]:
a = np.arange(16).reshape((2,2,2,2))
a

In [None]:
np.swapaxes(a, 0, 3) # Transpões as dimensões 0 e 3

## Inserção e remoção de elementos

É possível inserir ou remover elementos e posições arbitrárias de um array, mas *estas operações são custosas e não devem ser feitas frequentemente*.

In [None]:
a = 10 * np.arange(10)
a

In [None]:
np.delete(a, 3)

A operação retorna um novo array, e não altera o array original:

In [None]:
a

Podemos apagar diversos valores:

In [None]:
np.delete(a, [1, 4, 7])

Num array multidimensional, devemos especificar em qual dimensão serão feitas as eliminações:

In [None]:
a = np.arange(12).reshape((3,4))
a

In [None]:
np.delete(a, 1, axis=0) # Linha

In [None]:
np.delete(a, 1, axis=1) # Coluna

In [None]:
np.delete(a, [0, 3], axis=1)

Inserção é feita de forma similar, mas precisamos fornecer o valor a inserir. O valor será inserido no índice especificado, deslocando os valores anteriores para frente:

In [None]:
a = 3 * np.arange(10)
a

In [None]:
np.insert(a, 4, 7)

Novamente, retorna-se um novo array, e o original não é alterado:

In [None]:
a

In [None]:
a = np.arange(12).reshape((3,4))
a

In [None]:
np.insert(a, 2, np.ones(4), axis=0)

In [None]:
np.insert(a, 2, np.ones(3), axis=1)

Ao inserir linhas ou colunas, se fornecemos apenas um valor, este é duplicado por toda a linha ou coluna:

In [None]:
np.insert(a, 2, 42, axis=0)

In [None]:
np.insert(a, 2, 42, axis=1)

In [None]:
a = np.arange(24).reshape((2,3,4))
a

In [None]:
np.insert(a, 0, 111, axis=0)

In [None]:
np.insert(a, a.shape[0], 111, axis=0)

## Juntando arrays

Podemos também construir um array juntando pedaços de outros arrays.

In [None]:
p1 = np.zeros(8)

In [None]:
p2 = np.ones(8)

In [None]:
np.concatenate((p1, p2))

In [None]:
np.concatenate((p1.reshape((8,1)), p2.reshape(8,1)), axis=1)

In [None]:
np.concatenate((p1.reshape((1,8)), p2.reshape(1,8)), axis=0)

O parâmetros `axis` especifica a dimensão a usar para fazer a concatenação (0: linha, 1: colunas, etc).

Também podemos separar um array em diversos pedaços.

In [None]:
a, b = np.split(np.arange(20), 2) # Separa em duas partes, uma vai para a outra para b

In [None]:
a

In [None]:
b

Existem diversas formas de realizar o `split`, dependendo dos parâmetros passados. Procure a documentação na Internet para mais detalhes. 

O `split` também gera um **view**, ao invés de arrays novos.

In [None]:
c = np.arange(20)
a, b = np.split(c, 2)
a[0] = 100
b[0] = 200
c

Uma forma alternativa de juntar arrays é usando as funções `hstack` e `vstack`. A primeira empilha arrays horizontalmente, enquanto a segunda empilha verticalmente.

In [None]:
a = np.ones(10)
b = np.full(10, 2)
np.hstack((a, b))

In [None]:
np.vstack((a,b))

In [None]:
a = np.arange(9).reshape((3, 3))
b = 10 * np.arange(6).reshape((3, 2))
np.hstack((a,b))

In [None]:
a = np.arange(6).reshape((2, 3))
b = 10 * np.arange(9).reshape((3, 3))
np.vstack((a, b))

Obviamente, os tamanhos precisam ser compatíveis:

In [None]:
a = np.zeros((3, 3))
b = np.zeros((3, 2))
np.vstack((a, b))

## Arrays e operações de álgebra linear

Ao lidar com array, os arrays de 1 dimensão são bastante versáteis e úteis, porém temos que tomar cuidado quando estamos fazendo cálculos matriciais, pois neste caso termos vetores linha (que correspondem a uma matriz $N \times 1$) e vetores coluna (que correspondem a uma matriz $1 \times N$). **Os arrays unidimensionais de NumPy não correspondem a nenhum desses casos.**

Minha recomendação é, quando realizando cálculos matriciais, utilizar sempre explicitamente arrays $N\times 1$ ou $1\times N$, conforme o apropriado.

In [None]:
m1 = np.array([[1, 2], [3, 4]])
m2 = np.array([[1, 0],[0, 1]])
print(m1)
print(m2)

Este é o produto elemento a elemento:

In [None]:
m1 * m2

Este é o produto de matrizes.

In [None]:
m1 @ m2

In [None]:
v1 = np.array([1, 2]).reshape((1, 2))
v2 = np.array([1, 2]).reshape((2, 1))
print('v1.shape=', v1.shape, 'v2.shape=', v2.shape)
print('v1:\n', v1)
print('v2:\n', v2)

O operador `@` realiza multiplicação matricial:

In [None]:
v1 @ m1

In [None]:
m1 @ v2

In [None]:
v1 @ v2

In [None]:
v3 = np.array([1,2])

In [None]:
v3 @ m1

In [None]:
m1 @ v3

In [None]:
v3 @ v3

In [None]:
v3 * m1

In [None]:
m1 * v3

In [None]:
v3 * v3

## Broadcast

Para o operador `@` (e as funções associadas `numpy.dot` e `numpy.matmult`), as regras são as de multiplicação de matrizes. Para as outras operações, a explicação desses resultados é através das **regras de _broadcast_**.

Quando realizando uma operação com dois arrays, as dimensões desses arrays (`shape`) são alinhadas a partir da mais à direita. Os valores de tamanho em uma dimensão são compatíveis se eles são iguais ou se um deles é 1. Se o número de dimensões é diferente, o com menos dimensões tem seu número de dimensões expandido, colocando tamanhos 1 em cada nova dimensão. Dimensões de tamanho 1 são esticadas por cópia para o tamanho no outro array.

Por exemplo, se operamos array $2\times 3\times 5$ com outro $3\times 1$, os passos são os seguintes:
- Ajusta à direita:
```
    2 3 5
      3 1
```
- Aumenta o número de dimensões do menor, acrescentando um dimensão de tamanho 1.
```
    2 3 5
    1 3 1
```
- Estica as dimensões 1 que correspondem a dimensões maiores no outro array, fazendo cópias.
```
    2 3 5
    2 3 5
```
- Realiza as operações elemento a elemento.

In [None]:
a = 2 * np.arange(0, 30, 1).reshape((2, 3, 5))
b = 3 * np.arange(1,4,1).reshape((3, 1))

In [None]:
a

In [None]:
b

In [None]:
a - b

## Vetorizando funções

Operar sobre todos os elementos de um array NumPy simultaneamente é bastante conveniente. Porisso, muitas vezes você vai querer implementar funções Python que operam dessa forma.

Existem dois modos em que isso pode ser feito, adequados para situações diferentes. O primeiro caso é quando a nossa função realiza apenas operações já definidas sobre arrays NumPy da forma que desejamos. Por exemplo, suponha que temos uma função que calcula um polinômio:

In [None]:
def my_poly(x):
    return 2 * x**2 - 3 * x + 4

Essa função pode ser aplicada sobre escalares:

In [None]:
print(my_poly(3))
print(my_poly(5.1))
print(my_poly(2+1j))

Mas ela também pode ser aplicada diretamente a arrays NumPy:

In [None]:
my_arr = np.array([1, 2, 3, 4])
print(my_poly(my_arr))

Isto funciona pois a função `my_poly` usa apenas operações definidas para arrays NumPy: exponenciação com escalar, produto por escalar, subtração e soma de arrays. Assim, quando chamamos `my_poly(my_arr)` a variável `x` de `my_poly` referenciará o mesmo array que `my_arr`, e estaremos fazendo

    2 * my_arr**2 - 3 * my_arr + 4
    
O que, como esperado, executará as diversas operações elemento a elemento.

Infelizmente, isto não sempre funciona, falhando quando a função realiza alguma operação não definida para arrays NumPy. Por exemplo, suponha a função seguinte:

In [None]:
def region(x):
    if x < 2:
        return 0
    elif x < 4:
        return 1
    else:
        return 2

Esta função funciona para escalares (que tem ordem total):

In [None]:
print(region(3))
print(region(5.1))

Mas ela não funciona para arrays:

In [None]:
print(region(my_arr))

Novamente, isso ocorre porque o `x` da função `region` será uma referência para um array, e neste caso a comparação `x < 2` (por exemplo) no `if` retorna um array de booleanos, ao invés de um booleano, como esperado pelo Python.

O que desejamos é que essa função seja aplicada individualmente a cada elemento do array. Isto é denominado em NumPy de **vetorização**. Para isto funcionar, precisamos soliciar ao NumPy que gere uma versão vetorizada da função, usando a função `np.vectorize`:

In [None]:
region = np.vectorize(region)

Agora podemos passar um array para essa função, e ela será chamada para cada um dos elementos:

In [None]:
print(region(my_arr))

O que acontece é que, ao chamarmos `np.vectorize` para uma função criamos uma nova função que aplica a função original a cada um dos elementos do array passado, ao invés de passar o array diretamente para a função, como antes.

Note que colocamos a nova função retornada por `np.vectorize` numa variável com o mesmo nome da função original. Isto não gera problemas, pois a função continua podendo ser aplicada a escalares, retornando um array de 1 elemento:

In [None]:
region(3)

Se isso for inconveniente para o seu código, você pode colocar a função vetorizada em uma variável com nome diferente.

## Leitura de um arquivo

O NumPy tem diversas formas de leitura de arrays a partir de dados em arquivos. Não cobriremos todas as possibilidades, mas vamos ver como ler um array de um arquivo de texto usando `loadtxt`.

Por exemplo, suponha que tenhamos um arquivo denominado `stress.dat` com os seguintes valores:

    3.047 9.468 8.304 2.920
    7.017 1.517 2.069 0.095
    2.808 5.005 0.302 7.577
    3.682 1.721 4.172 4.572
    0.011 0.954 1.773 9.076
    6.775 0.643 0.303 9.549

Podemos ler esses valores em um array com:

In [None]:
stress = np.loadtxt('stress.dat')
stress

Note como a leitura é feita: cada linha do arquivo é uma linha do array, e as colunas são separadas por espaços. Se o separador for outro, podemos indicar. Por exemplo, se o arquivo `stress.csv` tivesse o formato CSV:

    3.047, 9.468, 8.304, 2.920
    7.017, 1.517, 2.069, 0.095
    2.808, 5.005, 0.302, 7.577
    3.682, 1.721, 4.172, 4.572
    0.011, 0.954, 1.773, 9.076
    6.775, 0.643, 0.303, 9.549

bastaria fazer:

In [None]:
stressv = np.loadtxt('stress.csv', delimiter=',')
stressv

Como indicado acima, existem outras formas de ler dados de arquivo, assim como a própria função `loadtxt` tem diversas opções que permitem que ela trabalhe com diversos formatos de arquivo. Consulte a documentação.

## Desempenho

A principal razão para a existência de NumPy é permitir executar códigos numéricos com boa eficiência em Python. A razão para a maior eficiência de arrrays NumPy em comparação com listas primitivas de Python são diversas:

- As listas guardam *referências* (endereços de memória) para os objetos, enquanto os arrays guardam o próprio objeto. Isto faz com que o acesso ao objeto seja direto, ao invés de indireto.
- Os números são representados em arrays diretamente pelos seus valores, enquanto em listas eles são representados por objetos, que possuem as seguintes informações:
  - Tipo do objeto
  - Tamanho na memória ocupado pelo objeto
  - Valor do objeto
  - Informação para coleta de lixo

  Essas informações adicionais ocupam mais espaço na memória (veja abaixo o problema), além de implicar que para realizar operações sobre cada um dos objetos precisamos consultar as informações do tipo. Em arrays, o tipo do objeto já é conhecido, e as operações sobre esse tipo determidas apenas uma vez (e não para cada um dos elementos).
- Os objetos no array são armazenados contiguamente na memória (um atrás do outro), enquanto em listas eles ficam dispersos pela memória. Devido à forma de operação dos computadores atuais, a atuação sobre elementos contíguos é muito mais eficiente.
- O fato de trabalhar com valores contíguos todos do mesmo tipo também habilita o uso de instruções vetoriais (SIMD) que são bem mais eficientes que instruções escalares.

Para quem tem interesse: a maior eficiência do uso de elementos contíguos e menor uso de memória para as mesmas operações está relacionada com a hierarquia de memória e os caches em computadores atuais.

Para dar uma demonstração da questão de eficiência, vamos fazer um experimento simples: Calcular o cosseno de diversos ângulos igualmente espaçados entre 0 e $2\pi$, usando Python puro e NumPy.

In [None]:
import math

In [None]:
N = 100000

In [None]:
%%timeit
res = []
for i in range(N+1):
    xi = 2 * i * math.pi/N
    res.append(math.cos(xi))

In [None]:
%%timeit 
[math.cos(2*i*math.pi/N) for i in range(N+1)]

In [None]:
%timeit list(map(lambda i: math.cos(2*i*math.pi/N), range(N+1)))

In [None]:
%timeit np.cos(np.linspace(0, 2*np.pi, N+1))

## Exercícios

### 1

Crie um array $7\times7$ no qual todos os elementos têm valor 0, exceto os da linha 3 e da coluna 3, que têm valor 1, como a seguir:

```
0 0 0 1 0 0 0
0 0 0 1 0 0 0
0 0 0 1 0 0 0
1 1 1 1 1 1 1
0 0 0 1 0 0 0
0 0 0 1 0 0 0
0 0 0 1 0 0 0
```

### 2

Crie um array $3\times2\times4$ onde o elemento de índice $(i, j, k)$ tem valor $i^2$ para qualquer $j, k$, como abaixo:

```
0 0 0 0
0 0 0 0

1 1 1 1
1 1 1 1

4 4 4 4
4 4 4 4
```

### 3

Crie um array $10\times10$ onde o elemento de índice $(i,j)$ tem valor $\cos(2\pi i j/100)$.

### 4

Gere uma matriz $100\times100$ de números aleatórios com distribuição normal de média 0 e desvio padrão 1. Calcule o *máximo* valor em cada linha e o *mínimo* valor em cada coluna.

### 5

Gere uma matriz $100\times100$ de números aleatórios com distribuição normal de média 1 e desvio padrão 3. Depois gere uma outra matriz de mesmo formato cujo elemento $(i,j)$ terá valor $1$ se o elemento $(i,j)$ da matriz aleatória for menor que -5 ou maior do que 7, e zero caso contrário.
Conte o número de valores diferentes de zero nessa nova matriz.

### 6

Use as regras de *broadcast* em seu benefício para gerar uma matriz $10\times10$ cujos elementos $(i,j)$ têm valor $i$. Faça o mesmo para gerar uma outra matriz de mesmo tamanho cujos elementos $(i,j)$ tenham valor $j$. Por fim, combine isso para gerar uma matriz também $10\times10$ cujos elementos $(i,j)$ tenham valor $2 i - j$.