# Numpy

Para iniciar a etapa de análise de dados, é essencial conhecer as principais ferramentas utilizadas nesse processo. A biblioteca NumPy é uma das mais fundamentais na base do ecossistema de ciência de dados em Python. Voltada para o trabalho com arrays e operações numéricas de alta performance, ela fornece estruturas eficientes e funções otimizadas para cálculos matemáticos e manipulação de dados, servindo como suporte para diversas outras bibliotecas e aplicações analíticas.

### Arrays e Listas

Arrays são estruturas fundamentais em ciência de dados por permitirem o armazenamento e a manipulação eficiente de grandes volumes de dados numéricos. Eles tornam cálculos matemáticos mais rápidos e simples graças às operações vetorizadas.

- **Array Numpy**
    - É uma estrutura de dados que armazena elementos de um único tipo, o que resulta em maior eficiência de memória e desempenho em comparação com listas.
    - Permite realizar operações matemáticas de forma vetorizada (aplicar operações matemáticas em todos os elementos do array ao mesmo tempo), sem a necessidade de loops.
    - Caso receba elementos de tipos diferentes, converte todos para o tipo mais genérico. Por exemplo, se houver inteiros e uma string, todos os elementos serão convertidos para string.

- **Listas**
    - Uma lista é uma das estruturas de dados mais fundamentais do Python.
    - Permite armazenar qualquer tipo de dado: números, strings, outras listas, objetos, etc., mesmo misturados entre si.
    - É uma estrutura mutável, ou seja, os elementos podem ser alterados, adicionados ou removidos após a criação da lista.

Em Python, listas são criadas utilizando colchetes `[]`, enquanto arrays do NumPy são criados com a função `np.array()`. Veja abaixo um exemplo de como criar ambos com os mesmos valores:

In [1]:
import numpy as np 

# criando uma lista
lista = [1, 2, 3, 4, 5, 6]

# criando um array numpy
array = np.array([1, 2, 3, 4, 5, 6])

### Diferenças entre Arrays e Listas

- **Tipos de Dados**
    - **Listas:** Podem conter elementos de tipos diferentes (por exemplo, números, strings, listas dentro de listas).
    - **Arrays:** Armazenam elementos de um único tipo. Se houver elementos de tipos diferentes, o NumPy converte todos para o tipo mais genérico (por exemplo, tudo vira string).

- **Operações Matemáticas**
    - **Listas:** Não suportam operações matemáticas diretamente sobre todos os elementos. É necessário iterar com `for` ou usar `list comprehensions`.
    - **Arrays:** Permitem realizar operações matemáticas diretamente de forma vetorizada, ou seja, operando sobre todos os elementos ao mesmo tempo (ex: `array + 2`, `array * 3`).

- **Funcionalidades**
    - **Listas:** São versáteis, mas limitadas para operações numéricas. Precisam de código adicional ou bibliotecas externas para estatísticas e álgebra linear.
    - **Arrays:** Têm diversas funções integradas otimizadas, como `sum()`, `mean()`, `std()`, `dot()`, além de suporte a operações entre matrizes, broadcasting, entre outras.

- **Desempenho**
    - **Listas:** Mais lentas e menos eficientes em memória para grandes volumes de dados numéricos.
    - **Arrays:** Mais rápidos e eficientes, especialmente em cálculos com grandes conjuntos de dados.

### Exemplo de Operações Matemáticas

Abaixo será apresentada a diferença entre realizar uma operação matemática utilizando listas e arrays, para evidenciar a diferença entre ambos.