# Guia de Introdução ao NumPy

NumPy, que significa Numerical Python, é uma biblioteca fundamental para a computação científica em Python. Mas suas capacidades vão muito além disso, como veremos nos nestes vídeos. E ele serve como uma boa base para o Pandas, que é uma das bibliotecas mais populares para análise de dados em Python.

## Instalação

Para instalar o NumPy, você pode usar o comando `pip install numpy` no terminal.

In [None]:
!pip3 install numpy

## Arrays NumPy

Um array é uma estrutura de dados que armazena valores de um mesmo tipo. Em Python, isso é uma grande vantagem porque economiza espaço e permite operações mais eficientes.

In [None]:
# array -> sequência 
# array -> estrutura de dados que armazena uma sequencia de valores

import numpy as np

array_teste = np.array([1, 2, 3, 4, 5])

# similar a uma lista
print(array_teste)

É relevante entender a diferença entre uma lista e um array.

Uma **lista** é uma das estruturas de dados mais básicas em Python. Ela pode conter qualquer tipo de elementos, como números, strings, outras listas, e todos eles podem ser de tipos diferentes. Por exemplo:


In [None]:
lista_teste = [1, 'dois', 3.0]

print(type(lista_teste))

In [None]:
for elemento in lista_teste:
    print(type(elemento))

Um **array**, por outro lado, é uma estrutura de dados que também armazena elementos, mas todos os elementos devem ser do mesmo tipo. Se você tentar criar um array com elementos de tipos diferentes, o NumPy irá convertê-los todos para o tipo mais geral. Por exemplo:

In [None]:
array_teste = np.array(lista_teste)
print(array_teste)

print(type(array_teste))

In [None]:
for elemento in array_teste:
    print(type(elemento))


## Operações Matemáticas

Se você tentar adicionar um número a todos os elementos de uma lista, você receberá um erro.



In [None]:
lista = [1, 2, 3, 4, 5]
nova_lista = lista + 1

print(nova_lista)

In [12]:
nova_lista = []

for num in lista:
    nova_lista.append(num + 1)

print(nova_lista)

[2, 3, 4, 5, 6]


Com um array NumPy, você pode adicionar (ou subtrair, multiplicar, dividir) um número a todos os elementos de uma vez.



In [None]:
import numpy as np

array_teste = np.array([1, 2, 3, 4, 5])
# adicionando 1 a todos os elementos presente no array_teste
novo_array_teste = array_teste + 1
print(novo_array_teste)

[ 1  4  9 16 25]


## Desempenho

Para grandes quantidades de dados, os arrays NumPy são significativamente mais eficientes em termos de memória e desempenho do que as listas Python. Aqui está um exemplo que demonstra isso:



In [17]:
import numpy as np
import time

# criando uma lista e um array com 10 milhões de números
# no python 10000000 == 10_000_000
lista_auxiliar = list(range(1, 10_000_001))
array_auxiliar = np.array(range(1, 10_000_001))

# Calculando a soma de todos os números na lista
tempo_inicial = time.time()
soma_lista = sum(lista_auxiliar)
tempo_final = time.time()

print(f'O tempo para somar todos os valores na lista foi de {tempo_final - tempo_inicial} segundos')

# Calculando a soma de todos os números do array
tempo_inicial = time.time()
soma_array = np.sum(array_auxiliar)
tempo_final = time.time()
print(f'O tempo para somar todos os valores no array foi de {tempo_final - tempo_inicial} segundos')

O tempo para somar todos os valores na lista foi de 0.11752486228942871 segundos
O tempo para somar todos os valores no array foi de 0.008761167526245117 segundos


## Resumindo

Aqui estão algumas diferenças chave entre listas e arrays:

1. **Tipo de dados**: As listas podem armazenar elementos de tipos diferentes ao mesmo tempo, enquanto os arrays armazenam elementos do mesmo tipo.

2. **Operações matemáticas**: Você pode realizar operações matemáticas em todos os elementos de um array de uma vez, o que não é possível com listas.

3. **Desempenho**: Arrays são mais eficientes em termos de memória e desempenho do que listas quando se trabalha com grandes quantidades de dados numéricos.

4. **Funcionalidades**: NumPy arrays vêm com várias funções integradas para operações matemáticas e científicas, como média, soma, multiplicação de matrizes, etc., que não estão disponíveis com listas.
