# <font color='blue'>Processamento de Linguagem Natural</font>

## Introdução ao Framework PyTorch

A computação em modelos de Deep Learning é feita com tensores, que são generalizações de uma matriz que pode ser indexada em mais de duas dimensões. O PyTorch é um framework que aplica operações matemáticas a tensores para então treinar modelos de Deep Learning.

https://pytorch.org/

**TorchScript**

O PyTorch TorchScript ajuda a criar modelos serializáveis e otimizáveis. Depois que treinamos esses modelos, eles também podem ser executados independentemente. Isso ajuda quando estamos no estágio de implantação do modelo de um projeto de Data Science.

Você pode treinar um modelo no PyTorch usando Python e depois exportá-lo via TorchScript para um ambiente de produção em que Python não esteja disponível. 

**Treinamento Distribuído**

O PyTorch também oferece suporte a treinamento distribuído que permite que pesquisadores e profissionais paralelizem seus cálculos. O treinamento distribuído possibilita o uso de várias GPUs para processar lotes maiores de dados de entrada. Isso, por sua vez, reduz o tempo de computação.

**Suporte para Python**

O PyTorch tem uma interação muito boa com o Python. De fato, a codificação no PyTorch é bastante semelhante ao que fazemos em Python. Portanto, se você se sentir confortável com o Python, vai adorar trabalhar com o PyTorch.

### O Que São Tensores?

![title](imagens/tensores.png)

In [None]:
!pip install pytorch==1.5.1 torchvision==0.6.1 cpuonly -c pytorch

In [1]:
# Imports
import numpy 
import torch
import torchvision

### Criando e Manipulando Tensores

A razão pela qual usamos o Numpy em Machine Learning é que é muito mais rápido do que as listas Python na execução de operações de matriz. 

Por quê? Internamente, NumPy faz a maior parte do trabalho pesado em Linguagem C, que é muito mais veloz que Python. 

Mas, no caso de treinar redes neurais profundas (<a href="http://www.deeplearningbook.com.br/">Deep Learning</a>), os arrays NumPy levariam meses para treinar algumas das redes de ponta. É aqui que os tensores entram em cena. O PyTorch nos fornece uma estrutura de dados chamada Tensor, que é muito semelhante à matriz ND do NumPy. Mas, diferentemente do último, os tensores podem aproveitar os recursos de uma GPU para acelerar significativamente as operações com matrizes.

In [2]:
# Criando um tensor
x = torch.tensor([1., 2.])

In [3]:
# Visualiza o tensor
print(x)

tensor([1., 2.])


In [4]:
# Shape
print(x.shape)

torch.Size([2])


In [5]:
# Criando um tensor
t = torch.tensor([[1,1,1,1],
                  [2,2,2,2],
                  [3,3,3,3]], dtype = torch.float32)

Para determinar a forma desse tensor, examinamos primeiro as linhas (3) e depois as colunas (4). Portanto, esse tensor é 3 x 4 de classificação (rank) 2. 

Rank é uma palavra comumente usada e significa apenas o número de dimensões presentes no tensor.

No PyTorch, temos duas maneiras de obter a forma (shape):

In [6]:
t.size()

torch.Size([3, 4])

In [7]:
t.shape

torch.Size([3, 4])

No PyTorch, o tamanho e a forma de um tensor significam a mesma coisa.

Normalmente, depois de conhecermos a forma de um tensor, podemos deduzir algumas coisas. Primeiro, podemos deduzir o rank do tensor. O rank de um tensor é igual ao comprimento da forma do tensor.

In [8]:
len(t.shape)

2

In [9]:
len(x.shape)

1

Também podemos deduzir o número de elementos contidos no tensor. O número de elementos dentro de um tensor (12 no nosso caso do tensor t e 2 no tensor x) é igual ao produto dos valores dos componentes da forma.

In [10]:
torch.tensor(t.shape).prod()

tensor(12)

In [11]:
torch.tensor(x.shape).prod()

tensor(2)

In [12]:
# Retornando um elemento de um tensor
z = torch.tensor([[1., 2.],[5., 3.],[0., 4.]])

In [13]:
print(z)

tensor([[1., 2.],
        [5., 3.],
        [0., 4.]])


In [14]:
# Shape
print(z.shape)

torch.Size([3, 2])


In [15]:
# Retornamos a primeira linha (índice 0) e segunda coluna (índice 1)
# O retorno é no formato de tensor
print(z[0][1])

tensor(2.)


In [16]:
# Retornamos a primeira linha (índice 0) e segunda coluna (índice 1)
# O retorno é no formato de escalar (apenas o valor)
print(z[0][1].item())

2.0


Quando criamos tensores com valores randômicos, passamos apenas o número de dimensões.

In [17]:
input1 = torch.randn([1, 4, 4, 2])

In [18]:
input2 = torch.randn(1, 4, 4, 2)

In [19]:
input1.shape

torch.Size([1, 4, 4, 2])

In [20]:
input2.shape

torch.Size([1, 4, 4, 2])

In [21]:
len(input1.shape)

4

In [22]:
len(input2.shape)

4

In [23]:
input1

tensor([[[[ 0.2416,  0.4447],
          [-2.2464,  0.6059],
          [-0.6340, -0.0094],
          [ 0.7513,  1.3534]],

         [[ 0.3300, -0.6282],
          [ 0.0740,  1.0578],
          [ 0.8492, -0.1076],
          [ 1.3228, -1.4576]],

         [[ 0.2832,  0.8284],
          [-0.2549,  2.1242],
          [-1.2353, -0.1085],
          [-2.9359, -1.4244]],

         [[ 0.1275,  1.1492],
          [ 1.0437,  0.0911],
          [-0.1464, -0.7834],
          [ 2.5736,  1.7374]]]])

In [24]:
input2

tensor([[[[-0.2923, -1.7987],
          [ 0.1195,  1.5497],
          [-1.8074, -1.9634],
          [-0.7972, -0.8220]],

         [[-0.7512,  0.4768],
          [-0.5396, -0.1104],
          [-2.0836,  0.4917],
          [-0.4216,  0.9083]],

         [[ 0.4967,  0.6270],
          [-0.9996, -0.0768],
          [-0.5799, -1.1515],
          [ 0.8963,  1.3111]],

         [[-0.9498, -0.5178],
          [ 0.1527,  0.5920],
          [ 0.5809,  0.5747],
          [ 1.1234,  0.5308]]]])

Considere tensores como o número de listas que uma dimensão contém. Por exemplo, um tensor (1, 4, 4, 2) terá:

1 lista contendo 4 elementos de 4 elementos de 2 elementos.

- A primeira dimensão pode conter 1 elemento.
- A segunda dimensão pode conter 4 elementos.
- A terceira dimensão pode conter 4 elementos.
- A quarta dimensão pode conter 2 elementos.

![title](imagens/tensor.jpg)

### Array NumPy x Tensor PyTorch

In [25]:
# Cria um array NumPy
a = numpy.array(1)

# Cria um tensor PyTorch
b = torch.tensor(1)

In [26]:
# Tipo
type(a)

numpy.ndarray

In [27]:
# Tipo
type(b)

torch.Tensor

In [28]:
# Print
print(a)
print(b)

1
tensor(1)


### Operações com Tensores

In [29]:
# Criamos 2 tensores
t1 = torch.tensor(12)
t2 = torch.tensor(4)
print(t1, t2)

tensor(12) tensor(4)


In [30]:
# Soma
print(t1 + t2)

tensor(16)


In [31]:
# Subtração
print(t1 - t2)

tensor(8)


In [32]:
# Multiplicação
print(t1 * t2)

tensor(48)


In [33]:
# Divisão
print(t1 // t2)

tensor(3)


### Operações com Matrizes

In [34]:
# Matriz (tensor rank 2) de números randômicos
t_rank2 = torch.randn(3,3)
t_rank2

tensor([[ 1.1875, -1.2850, -0.7241],
        [ 1.8550,  0.2061,  0.1011],
        [-0.0316, -0.8695, -0.2227]])

In [35]:
# Tensor rank 3 de números randômicos
t_rank3 = torch.randn(3,3,3)
t_rank3

tensor([[[-0.5327, -0.7128, -0.0724],
         [-1.3343,  0.2745,  0.4443],
         [ 0.0257,  1.8002, -1.3351]],

        [[-0.2030, -0.8793,  0.1153],
         [ 1.2662, -1.1914, -0.0072],
         [ 0.0698,  0.5949, -0.6539]],

        [[-0.2671, -1.3009,  0.8394],
         [-0.2227,  0.1148, -0.5619],
         [-1.4797, -1.0868, -0.3746]]])

In [36]:
# Tensor rank 4 de números randômicos
t_rank4 = torch.randn(3,3,3,3)
t_rank4

tensor([[[[ 3.1556e-01,  1.1568e+00,  4.0549e-01],
          [-9.0537e-01,  9.0246e-01, -2.1905e+00],
          [-4.3744e-01, -5.9295e-01,  2.0791e+00]],

         [[ 9.8483e-01,  4.6660e-01, -3.4870e-01],
          [ 1.0237e+00,  9.7468e-01,  5.3979e-01],
          [-8.7294e-01, -1.4675e+00,  1.1367e+00]],

         [[-1.3079e-01,  2.7042e-01, -1.6496e+00],
          [-3.5954e-01, -8.6916e-01, -8.6419e-01],
          [ 2.7682e-01,  3.7074e-01, -8.4851e-01]]],


        [[[-1.8897e-01,  1.1635e+00, -4.4198e-01],
          [ 5.9997e-01,  7.9128e-01,  7.9198e-01],
          [ 2.6512e+00,  5.7130e-01,  8.2847e-01]],

         [[ 2.2377e-03,  1.6406e+00, -4.8608e-01],
          [ 1.3313e+00,  4.6197e-01,  3.7833e-01],
          [-1.9358e+00,  3.9537e-01,  8.3544e-01]],

         [[-4.7711e-01,  3.5427e-01,  1.5526e-01],
          [-1.6875e+00, -1.0063e+00,  9.8315e-01],
          [ 1.5545e-01,  1.7374e+00, -3.7494e-01]]],


        [[[ 1.3704e-01, -1.1817e+00,  5.7570e-01],
          [ 3.3

In [37]:
# Multiplicação entre 2 tensores
A = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
B = torch.tensor([[9, 8, 7], [6, 5, 4], [3, 2, 1]])

In [38]:
A.shape

torch.Size([3, 3])

In [39]:
B.shape

torch.Size([3, 3])

In [40]:
len(A.shape)

2

In [41]:
len(B.shape)

2

In [42]:
A

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [43]:
B

tensor([[9, 8, 7],
        [6, 5, 4],
        [3, 2, 1]])

In [44]:
resultado1 = A * B

In [45]:
# Resultado
print(resultado1)

tensor([[ 9, 16, 21],
        [24, 25, 24],
        [21, 16,  9]])


In [46]:
resultado2 = torch.matmul(A, B)

In [47]:
# Resultado
print(resultado2)

tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])


In [48]:
resultado3 = torch.sum(A * B)

In [49]:
# Resultado
print(resultado3)

tensor(165)


![title](imagens/mat-mul.gif)

Para multiplicação de matrizes, fazemos assim em PyTorch:

In [50]:
AB1 = A.mm(B)
# ou
AB2 = torch.mm(A, B)
# ou
AB3 = torch.matmul(A, B)
# Ou assim (Python 3.5+)
AB4 = A @ B 

In [51]:
print(AB1)
print(AB2)
print(AB3)
print(AB4)

tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])
tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])
tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])
tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])


In [52]:
# Multiplicação de matrizes
A @ B

tensor([[ 30,  24,  18],
        [ 84,  69,  54],
        [138, 114,  90]])

Essa notação realiza multiplicação element-wise:

In [53]:
# Operação element-wise
A * B

tensor([[ 9, 16, 21],
        [24, 25, 24],
        [21, 16,  9]])

In [54]:
# Usando seed para iniciar 2 tensores com valores randômicos
torch.manual_seed(42)
a = torch.randn(3,3)
b = torch.randn(3,3)

In [55]:
# Adição de matrizes
print(torch.add(a, b))

tensor([[ 0.6040,  0.6637,  1.0438],
        [ 1.3406, -2.8127, -1.1753],
        [ 3.1662,  0.6841,  1.2788]])


In [56]:
# Subtração de matrizes
print(torch.sub(a, b))

tensor([[ 0.0693, -0.4061, -0.5749],
        [-0.8800,  0.5669,  0.8026],
        [ 1.2502, -1.9601, -0.3555]])


In [57]:
# Multiplicação de matrizes
print(torch.mm(a, b))

tensor([[ 0.4576,  0.2724,  0.3367],
        [-1.3636,  1.7743,  1.1446],
        [ 0.3243,  2.8696,  2.7954]])


In [58]:
# Divisão de matrizes
print(torch.div(a, b))

tensor([[ 1.2594,  0.2408,  0.2897],
        [ 0.2075,  0.6645,  0.1884],
        [ 2.3051, -0.4826,  0.5649]])


In [59]:
# Matriz Original
print(a, '\n')

# Matriz Transposta
torch.t(a)

tensor([[ 0.3367,  0.1288,  0.2345],
        [ 0.2303, -1.1229, -0.1863],
        [ 2.2082, -0.6380,  0.4617]]) 



tensor([[ 0.3367,  0.2303,  2.2082],
        [ 0.1288, -1.1229, -0.6380],
        [ 0.2345, -0.1863,  0.4617]])

# Fim