# Indrodução ao NumPy

NumPy provém de NUMerical PYthon e provê uma interface eficiente para armazenar e operar grandes volumes de dados. 
O NumPy armazena os dados através das arrays, que podem ser vetores ou matrizes. As arrays podem ser comparadas com a função built-in ``list`` do Python, porém as arrays do NumPy proveem uma forma muito mais eficiente de armazenar e operar grandes volumes dados.  

Algumas das operações possíveis com Numpy: Algebra linear, geração de números aleatórios e transformada de Fourrier.  

As arrays do NumPy são a base de praticamente todo o ecosistema de data scince em Python. Outros pacotes como Pandas, SciPy e Matplotlib foram desenvolvidos a partir do NumPy.

A documentação completa do NumPy pode ser encontrada em:  http://www.numpy.org

**Importando o pacote NumPy**  
Como convenção, abreviamos o NumPy como np.

In [1]:
import numpy as np

**Comparando operações com o NumPy vs Python**  
No código a seguir, vamos fazer um comparativo entre o desempenho do array do numpy e a lista do python. Em média o NumPy costuma ser de 10 a 100x mais rápido que o Python.

In [2]:
# Criando a massa de dados com 1.000.000 de elementos
np_array = np.arange(1000000)     # criando uma array do NumPy
py_list = list(range(1000000))    # criando uma lista do python

# Verificando o tempo necessário para uma multiplicação para os 10 primeiros elementos
%time for x in range(10): np_array2 = np_array * 3
%time for x in range(10): py_list2 = py_list * 3

Wall time: 20 ms
Wall time: 392 ms


Essa diferença de desempenho ocorre devido à maneira que o Numpy armazena os dados em memória. Enquanto a lista feita em Python é mais flexível, permitindo que se armazene dados com propriedades diferentes, no NumPy todos os dados possuem a mesma propriedade. Essa "falta de flexibilidade" do NumPy é determinante para seu ganho de desempenho.

Veja, nos comandos abaixo, como os dados são armazenados:

**Python**

In [3]:
# Verificando os elementos de uma lista criada em Python
python = [True, "2", 3.0, 4]
[type(item) for item in python]

[bool, str, float, int]

**NumPy**

In [4]:
# Atribuindo os elementos da lista criada em Python à uma array em Numpy
numpy = np.array([python])
numpy.dtype

dtype('<U5')

Enquanto cada elemento criado em Python possui um tipo de dado diferente, no NumPy, todos possuem a mesma categoria.

No nível de implementação, a array contém essencialmente um único ponteiro para um bloco contíguo de dados. A lista Python, por outro lado, contém um ponteiro para um bloco de ponteiros, cada um dos quais, por sua vez, aponta para um objeto Python completo. Novamente, a vantagem da lista é a flexibilidade: como cada elemento da lista é uma estrutura completa contendo dados e informações de tipo, a lista pode ser preenchida com dados de qualquer tipo desejado. Arrays NumPy por possuírem uma categoria única não têm essa flexibilidade, mas são muito mais eficientes para armazenar e manipular dados.

![](NumPy_x_Python.png)