<!-- Projeto Desenvolvido na Data Science Academy - www.datascienceacademy.com.br -->
# <font color='blue'>Data Science Academy</font>
## <font color='blue'>Matemática e Estatística Aplicada Para Data Science, Machine Learning e IA</font>
## <font color='blue'>Lab 5</font>
### <font color='blue'>Operações com Matrizes, Determinantes, Autovalores e Autovetores em Ciência de Dados</font>

## Instalando e Carregando os Pacotes

In [2]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [10]:
# Imports
import numpy as np

In [11]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" 

Author: Data Science Academy



## Por Que NumPy é Mais Veloz nas Operações Matemáticas?

Python é uma excelente linguagem de programação, mas ela pode ser lenta quando usada na sua forma básica. No entanto, ela permite que você acesse bibliotecas que executem código mais rápido escrito em linguagens como C. 

NumPy é uma dessas bibliotecas e fornece alternativas rápidas para operações matemáticas em Python e foi projetado para funcionar de forma eficiente com grupos de números - como matrizes.

NumPy é uma excelente biblioteca, sendo a base de quase todos os frameworks de aprendizagem de máquina em Python. 

O Numpy oferece mais velocidade nas operações em comparação com Python "puro" por várias razões:

**Implementação em C**: O Numpy é escrito principalmente em C, uma linguagem compilada que é muito mais rápida que Python, uma linguagem interpretada. Isso significa que muitas de suas operações internas são executadas em código de máquina, que é executado diretamente pelo processador, oferecendo um desempenho muito mais rápido.

**Otimizações de Array**: Numpy usa arrays multidimensionais (ndarrays) que são armazenados de maneira contínua na memória. Isso é bem diferente das listas do Python, que são arrays de ponteiros para objetos espalhados pela memória. A representação contínua permite operações mais eficientes de leitura e escrita de dados.

**Operações Vetorizadas**: Numpy permite operações vetorizadas, que são operações aplicadas diretamente a arrays inteiros ao invés de seus elementos individuais (como seria feito em um loop em Python "puro"). Essas operações são otimizadas e executadas em C, resultando em um desempenho muito mais rápido.

**Menos Overhead de Verificação de Tipo**: Em Python, cada operação inclui verificações de tipo e outras verificações de segurança, que adicionam overhead de processamento. Numpy, por outro lado, trabalha com tipos de dados homogêneos, reduzindo significativamente esse overhead.

**Uso de Bibliotecas de Matemática Otimizadas**: Numpy é integrado com bibliotecas de matemática otimizadas como BLAS e LAPACK, que são altamente eficientes para operações matemáticas complexas e álgebra linear.

**Paralelização**: Algumas operações do Numpy são intrinsecamente paralelas, permitindo que elas aproveitem processadores multi-core e operações de hardware otimizadas.

Esses fatores combinados fazem com que o Numpy seja muito mais rápido para operações matemáticas e manipulação de dados em grande escala do que Python "puro", especialmente para arrays grandes e cálculos complexos.

## Escalares, Vetores, Matrizes e Tensores

A maneira mais comum de trabalhar com números usando NumPy é através de objetos ndarray. Eles são semelhantes às listas em Python, mas podem ter qualquer número de dimensões. Além disso, o ndarray suporta operações matemáticas rápidas, o que é exatamente o que queremos.

Como você pode armazenar qualquer número de dimensões, você pode usar ndarrays para representar qualquer um dos tipos de dados: escalares, vetores, matrizes ou tensores.

## Escalares

Escalares com NumPy são mais eficientes do que em Python. Em vez dos tipos básicos em Python como int, float, etc., o NumPy permite especificar tipos mais específicos, bem como diferentes tamanhos. Então, em vez de usar int em Python, você tem acesso a tipos como uint8, int8, uint16, int16 e assim por diante, ao usar o NumPy.

Esses tipos são importantes porque todos os objetos que você cria (vetores, matrizes, tensores) acabam por armazenar escalares. E quando você cria uma matriz NumPy, você pode especificar o tipo (mas cada item na matriz deve ter o mesmo tipo). Nesse sentido, os arrays NumPy são mais como arrays C do que as listas em Python.

Se você quiser criar uma matriz NumPy que contenha um escalar, usamos a função array do NumPy:

In [12]:
s = np.array(8)

In [5]:
type(s)

numpy.ndarray

In [6]:
print(s)

8


In [7]:
s1 = 8

In [8]:
print(s1)

8


In [9]:
type(s1)

int

Você ainda pode realizar matemática entre ndarrays, escalares NumPy e escalares Python normais, como veremos mais adiante.

Você pode ver o shape da matriz usando o atributo shape, conforme abaixo. Esse comando retorna um () vazio, indicando que este objeto é um escalar.

In [10]:
s.shape

()

Mesmo que os escalares estejam dentro de arrays, você ainda os usa como um escalar normal, para operações matemáticas:

In [11]:
x = s - 3

In [12]:
x

5

Se você verificar o tipo de x, vai perceber que é numpy.int64, pois você está trabalhando com tipos NumPy, e não com os tipos Python.

Mesmo os tipos escalares suportam a maioria das funções de matriz. Então você pode chamar x.shape e retornaria () porque tem zero dimensões, mesmo que não seja uma matriz. Se você tentar usar o objeto como um escalar Python normal, você obterá um erro.

In [13]:
type(x)

numpy.int64

In [14]:
x.shape

()

## Vetores

Para criar um vetor, você passaria uma lista Python para a função array(), assim:

In [15]:
vec = np.array([1,2,3])

In [16]:
type(vec)

numpy.ndarray

In [17]:
print(vec)

[1 2 3]


In [18]:
vec.shape 

(3,)

In [19]:
vec_pp = [1,2,3]

In [20]:
type(vec_pp)

list

In [21]:
print(vec_pp)

[1, 2, 3]


Ao verificar o atributo de shape do vetor, ele retornará um único número representando o comprimento unidimensional do vetor. No exemplo acima, vec.shape retorna (3,), ou seja, tem 3 elementos em uma estrutura unidimensional.

Agora que há um número, você pode ver que a forma é uma tupla com os tamanhos de cada uma das dimensões do ndarray. Para os escalares, era apenas uma tupla vazia, mas os vetores têm uma dimensão, então a tupla inclui um número e uma vírgula 

(Python não entende (3) como uma tupla com um item, por isso requer a vírgula. Documentação oficial do Python sobre Tuplas: https://docs.python.org/3/tutorial/datastructures.html#tuples-and-sequences

Você pode acessar um elemento dentro do vetor usando índices, como este abaixo (como você pode ver, em Python a indexação começa por 0 e o índice 1 representa o segundo elemento do vetor).

In [22]:
vec2 = np.array([1,2,3,4])

In [23]:
vec2.shape 

(4,)

In [24]:
vec2[3]

4

NumPy também suporta técnicas avançadas de indexação. Por exemplo, para acessar os itens do segundo elemento em diante, você usaria:

In [25]:
vec2[1:]

array([2, 3, 4])

NumPy slicing é bastante poderoso, permitindo que você acesse qualquer combinação de itens em um ndarray. Documentação oficial sobre indexação e slicing de arrays: https://docs.scipy.org/doc/numpy/reference/arrays.indexing.html

## Matrizes

Você cria matrizes usando a função de array() NumPy, exatamente como você fez com os vetores. No entanto, em vez de apenas passar uma lista, você precisa fornecer uma lista de listas, onde cada lista representa uma linha. Então, para criar uma matriz 3x3 contendo os números de um a nove, você poderia fazer isso:

In [26]:
m = np.array( [ [1,2,3], [4,5,6], [7,8,9] ] )

In [27]:
print(m)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


In [28]:
type(m)

numpy.ndarray

In [29]:
m.shape

(3, 3)

Verificando o atributo shape, retorna a tupla (3, 3) para indicar que a matriz tem duas dimensões, cada dimensão com comprimento de 3 elementos.

Você pode acessar elementos de matrizes como vetores, mas usando valores de índice adicionais. Então, para encontrar o número 6 na matriz acima, você usaria:

In [30]:
# Linha x Coluna
m[1][2]

6

## Tensores

Os tensores são como vetores e matrizes, mas podem ter n dimensões. Por exemplo, para criar um tensor 3x3x2x1, você pode fazer o seguinte:

In [31]:
t = np.array([[[[1],[2]],[[3],[4]],[[5],[6]]],[[[7],[8]],\
    [[9],[10]],[[11],[12]]],[[[13],[14]],[[15],[16]],[[17],[18]]]])

In [32]:
print(t)

[[[[ 1]
   [ 2]]

  [[ 3]
   [ 4]]

  [[ 5]
   [ 6]]]


 [[[ 7]
   [ 8]]

  [[ 9]
   [10]]

  [[11]
   [12]]]


 [[[13]
   [14]]

  [[15]
   [16]]

  [[17]
   [18]]]]


In [33]:
t.shape

(3, 3, 2, 1)

Para acessar um elemento do tensor, usamos a indexação da mesma forma que fizemos com vetores e matrizes:

In [34]:
t[2][2][1][0]

18

## Alterando o Formato (shape)

Às vezes, você precisará alterar a forma de seus dados sem realmente alterar seu conteúdo. Por exemplo, você pode ter um vetor, que é unidimensional, mas precisa de uma matriz, que é bidimensional. Há duas maneiras pelas quais você pode fazer isso.

Digamos que você tenha o seguinte vetor:

In [35]:
vec = np.array([1,2,3,4])

In [36]:
print(vec)

[1 2 3 4]


In [37]:
vec.shape

(4,)

Chamando vec.shape retornaria (4,). Mas e se você quiser uma matriz 1x4? Você pode conseguir isso com a função de reshape, assim:

In [38]:
x = vec.reshape(1,4)

In [39]:
x.shape

(1, 4)

In [40]:
print(x)

[[1 2 3 4]]


In [41]:
type(vec)

numpy.ndarray

In [42]:
type(x)

numpy.ndarray

A função reshape pode ser usada para outras atividades com matrizes.

Imagine agora que você queira alterar sua estrutura de dados e trabalhar com um vetor ao invés de usar tensor. Veja os exemplos:

In [43]:
t = np.array([[[[1],[2]],[[3],[4]],[[5],[6]]],[[[7],[8]],\
    [[9],[10]],[[11],[12]]],[[[13],[14]],[[15],[16]],[[17],[18]]]])

In [44]:
type(t)

numpy.ndarray

In [45]:
# Convertendo para vetor usando flatten()
vetor_flatten = t.flatten()

In [46]:
type(vetor_flatten)

numpy.ndarray

In [47]:
print("Vetor usando flatten:", vetor_flatten)

Vetor usando flatten: [ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18]


In [48]:
t.shape

(3, 3, 2, 1)

In [49]:
vetor_flatten.shape

(18,)

In [50]:
# Convertendo para vetor usando ravel()
vetor_ravel = t.ravel()

In [51]:
type(vetor_ravel)

numpy.ndarray

In [52]:
print("Vetor usando ravel:", vetor_ravel)

Vetor usando ravel: [ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18]


E se quiser converter em Matriz?

In [53]:
matriz = t.reshape(6, 3)
print("Matriz 6x3:\n", matriz)

Matriz 6x3:
 [[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]
 [13 14 15]
 [16 17 18]]


In [54]:
matriz = t.reshape(3, 6)
print("Matriz 3x6:\n", matriz)

Matriz 3x6:
 [[ 1  2  3  4  5  6]
 [ 7  8  9 10 11 12]
 [13 14 15 16 17 18]]


## Operações Element-wise com Vetores

### Primeiro, como você faria usando apenas Linguagem Python.

Suponha que você tenha uma lista de números e que você deseja adicionar 5 a cada item da lista. Sem NumPy, você pode fazer algo como isto:

In [55]:
# Lista de valores
valores = [1, 2, 3, 4, 5]

In [56]:
print(valores)

[1, 2, 3, 4, 5]


In [57]:
# Loop for para adicionar 5 a cada elemento da lista
for i in range(len(valores)):
    valores[i] += 5

In [58]:
print(valores)

[6, 7, 8, 9, 10]


Isso faz sentido, mas é muito código para escrever e é mais lento, pois é Python puro.

### Agora sim, usando NumPy

In [59]:
valores = [1,2,3,4,5]

In [60]:
type(valores)

list

In [61]:
valores = np.array(valores) + 5

In [62]:
print(valores)

[ 6  7  8  9 10]


Bem mais simples, não? Perceba que usamos a função array() para converter o objeto Python para um objeto NumPy e então realizar o cálculo.

Mas isso pode ficar ainda mais simples. NumPy oferece funções prontas para operações matemáticas como essa. Por exemplo:

In [63]:
valores = [1,2,3,4,5]

In [64]:
type(valores)

list

In [65]:
valores = np.add(valores, 5)

In [66]:
print(valores)

[ 6  7  8  9 10]


In [67]:
type(valores)

numpy.ndarray

<!-- Projeto Desenvolvido na Data Science Academy - www.datascienceacademy.com.br -->
NumPy facilita muito nosso trabalho e vários frameworks de Deep Learning se baseiam no NumPy.

Um outro exemplo de operação element-wise com escalares e objetos ndarrays. Digamos que você tenha um objeto chamado "valores" e você queira reutilizá-lo, mas primeiro você precisa definir todos os seus valores em zero. Fácil, basta multiplicar por zero e atribuir o resultado de volta ao objeto, assim:

In [68]:
valores *= 0

In [69]:
print(valores)

[0 0 0 0 0]


## Operações Element-wise com Matrizes

As mesmas funções e operadores que trabalham com escalares e matrizes também funcionam com outras dimensões. Você só precisa se certificar de que os itens que você executa a operação possuem shapes compatíveis.

In [70]:
x = np.array([[1,3],[5,7]])
print(x)

[[1 3]
 [5 7]]


In [71]:
y = np.array([[2,4],[6,8]])
print(y)

[[2 4]
 [6 8]]


In [72]:
x + y

array([[ 3,  7],
       [11, 15]])

In [73]:
x + 5

array([[ 6,  8],
       [10, 12]])

In [74]:
x + y + 5

array([[ 8, 12],
       [16, 20]])

In [75]:
x + y / 5

array([[1.4, 3.8],
       [6.2, 8.6]])

In [76]:
(x + y) / 5

array([[0.6, 1.4],
       [2.2, 3. ]])

In [77]:
x.shape

(2, 2)

In [78]:
y.shape

(2, 2)

In [79]:
%reload_ext watermark
%watermark -a "Data Science Academy"

Author: Data Science Academy



In [80]:
#%watermark -v -m

In [81]:
#%watermark --iversions

## Fim