# Guia de Introdução ao NumPy

NumPy, que significa Numerical Python, é uma biblioteca fundamental para a computação científica em Python. Mas suas capacidades vão muito além disso, como veremos nos nestes vídeos. E ele serve como uma boa base para o Pandas, que é uma das bibliotecas mais populares para análise de dados em Python.

## Instalação

Para instalar o NumPy, você pode usar o comando `pip install numpy` no terminal.

In [None]:
# !pip install numpy

## Arrays NumPy

Um array é uma estrutura de dados que armazena valores de um mesmo tipo. Em Python, isso é uma grande vantagem porque economiza espaço e permite operações mais eficientes.

In [11]:
import numpy as np
array = np.array([1,2,3,4,5])
print(array)
print(type(array))

[1 2 3 4 5]
<class 'numpy.ndarray'>


É relevante entender a diferença entre uma lista e um array.

Uma **lista** é uma das estruturas de dados mais básicas em Python. Ela pode conter qualquer tipo de elementos, como números, strings, outras listas, e todos eles podem ser de tipos diferentes. Por exemplo:


In [3]:
lista = [1,'dois',3.0]
print(lista)
print(type(lista))

[1, 'dois', 3.0]
<class 'list'>


Um **array**, por outro lado, é uma estrutura de dados que também armazena elementos, mas todos os elementos devem ser do mesmo tipo. Se você tentar criar um array com elementos de tipos diferentes, o NumPy irá convertê-los todos para o tipo mais geral. Por exemplo:

In [5]:
for i in lista:
    print(type(i))

<class 'int'>
<class 'str'>
<class 'float'>


In [13]:
array = np.array(lista)
print(array)


['1' 'dois' '3.0']


In [14]:
for i in array:
    print(type(i))

<class 'numpy.str_'>
<class 'numpy.str_'>
<class 'numpy.str_'>


In [15]:
print(array.dtype)

<U32



## Operações Matemáticas

Se você tentar adicionar um número a todos os elementos de uma lista, você receberá um erro.



In [23]:
lista = [1,2,3,4,5]
novaLista = []
for numero in lista:
    novaLista.append(numero+1)
print(novaLista)

[2, 3, 4, 5, 6]


In [21]:
print(lista+[1])

[1, 2, 3, 4, 5, 1]


Com um array NumPy, você pode adicionar (ou subtrair, multiplicar, dividir) um número a todos os elementos de uma vez.



In [24]:
array = np.array([1,2,3,4,5])
novoArray = array/10
print(novoArray)

[0.1 0.2 0.3 0.4 0.5]


## Desempenho

Para grandes quantidades de dados, os arrays NumPy são significativamente mais eficientes em termos de memória e desempenho do que as listas Python. Aqui está um exemplo que demonstra isso:



In [26]:
import time

lista = list(range(1,10_000_001))
array = np.array(range(1,10_000_0001))

inicio  = time.time()
soma_lista = sum(lista)
fim = time.time()
print(f'Resultado de tempo: {fim-inicio}')

inicio  = time.time()
soma_array = np.sum(array)
fim = time.time()
print(f'Resultado de tempo: {fim-inicio}')

Resultado de tempo: 0.2629659175872803
Resultado de tempo: 0.05603361129760742


## Resumindo

Aqui estão algumas diferenças chave entre listas e arrays:

1. **Tipo de dados**: As listas podem armazenar elementos de tipos diferentes ao mesmo tempo, enquanto os arrays armazenam elementos do mesmo tipo.

2. **Operações matemáticas**: Você pode realizar operações matemáticas em todos os elementos de um array de uma vez, o que não é possível com listas.

3. **Desempenho**: Arrays são mais eficientes em termos de memória e desempenho do que listas quando se trabalha com grandes quantidades de dados numéricos.

4. **Funcionalidades**: NumPy arrays vêm com várias funções integradas para operações matemáticas e científicas, como média, soma, multiplicação de matrizes, etc., que não estão disponíveis com listas.
