# 5. Vetores 

## 5.1. Criação de vetores

Em economia fazemos uso recorrente de matrizes e vetores. Em Python, precisamos de um pacote para isso. 

<div class="alert alert-warning">  
    
**Pacotes** são conjuntos ou bibliotecas de código utilizados para um fim específico. 

</div>

Para vetores, matrizes e suas operações, vamos utilizar o pacote **Numpy** *(Numerical Python)*. 

Na **Plataforma Anaconda** esse pacote já está previamente instalado (o mesmo vale para o **Google Colab**). Porém, se você estiver utilizando outra inferface, poderá instalar o **Numpy**, na janela de comando, utilizando: 

    pip install numpy
    
Ou ainda, utilizar diretamente no notebook utilizando:

    !pip install numpy

Mesmo com o pacote instalado, você irá precisar sempre importá-lo antes de usar. 

Na importação, é comum utilizar uma abreviação do nome do pacote, o que irá facilitar seu uso no restante do código. 

No caso do **Numpy**, vamos usar **np**, que é uma abreviação utilizada recorrentemente, por convenção (você pode escolher qualquer letra). Como é uma convenção muito utilizada, manter **np** permite que outras pessoas entendam melhor o seu código e facilita o uso de códigos prontos. 

Para importar o **Numpy** como **np** utilize: 

In [None]:
import numpy as np

Agora sim, você pode começar a criar vetores! 

Vamos criar o vetor **x** com os elementos [1, 5, 6] com auxílio da função **array**. Observe que **array** é uma função do pacote **Numpy**, sendo assim, sempre utilizaremos **np.array** para chamar essa função: 

In [None]:
x = np.array([1, 5, 6])

O vetor fica disponível apenas com o nome **x**:

In [None]:
x

Ou, você pode utilizar a função `print()` para visualizar o conteúdo da variável: 

In [None]:
print(x)

Vale observar que os vetores não precisam ser numéricos! 

Por exemplo, podemos criar o vetor **y** apenas com texto: 

In [None]:
y = np.array(["NEDUR", "UFPR", "Regional", "Urbana"])
print(y)

Observe que ao utilizar a função `type()` para verificar o tipo de variável, você terá como resposta *numpy.ndarray* (abreviação para *numpy N-dimensional array*) para ambos os vetores. Faça o teste, **completando as células abaixo**: 

In [None]:
print() # Para o vetor x
print() # Para o vetor y

Para sabermos o tipo dentro de um objeto do **Numpy**, podemos utilizar o *atributo* **dtype** do vetor. 

<div class="alert alert-warning"> 
    
**Atributos** são informações ou características relacionadas à determinada função, *dtype* (abreviatura de *data type*) é um atributo de um **array**.        
    
</div>    

In [None]:
print(x.dtype)
print(y.dtype)

A saída nos indica que temos um vetor com inteiros (int) e 32 caracteres para a variável *x*, enquanto *y* é vetor de texto *Unicode String* (U), com 8 caracteres. Esses tamanhos podem ser diferentes se você estiver utilizando outro ambiente, ou outra versão dos pacotes.  

<div class="alert alert-info"> 
    
**Observação:**
    
O formato **Unicode**(*Universal Character Encoding*) é um padrão de representação para texto universal. 

</div>  

Não vamos detalhar todas as combinações possíveis aqui, elas estão disponíveis na documentação do [Numpy](https://numpy.org/doc/stable/reference/arrays.dtypes.html)

Vetores lógicos (booleanos) também podem ser criados no **Numpy**:

In [None]:
v = np.array([True, False, True])

**Insira uma nova célula de código abaixo e, para o vetor v, verfique o tipo de dado utilizando o atributo `.dtype`.**

Diferente das listas, que podem conter qualquer tipo de dado ao mesmo tempo, um vetor pode ter apenas um tipo de dado. 

Se tentarmos colocar números e letras no mesmo vetor, todos os elementos serão convertidos para letras: 

In [None]:
z = np.array(["NEDUR", "UFPR", "Regional", "Urbana", 1])

**Insira uma nova célula de código abaixo e, primeiro vizualize o vetor z utilizando a função `print()`, em seguida, verfique o tipo de dado utilizando o atributo `.dtype`.**

Podemos criar uma vetor com uma sequência de números. 

Um vetor de 0 a 4, por exemplo, pode ser criado com auxílio da função *numpy arange*:

In [None]:
r = np.arange(5)
print(r)

Observe que ao informar que queremos um *array* com uma sequência até 5, o vetor começa em zero e possui cinco elementos.

No exemplo anterior usamos `np.arrange(5)`, em que o número `5` é chamado de **argumento da função**, e se refere ao valor final da sequência de números criada. A função *np.arange* possui vários argumentos, ou seja, vários outros parâmetros que podem ser alterados para formar sequências diferentes, como valor inicial, intervalos, entre outros. 

Para conhecer os argumentos da função, use a função `help()`:

In [None]:
help(np.arange)

In [None]:
?np.arrange

Observe que os dois primeiros argumentos da função são início (*start*) e fim (*stop*). Assim, para criar um vetor começando em 1, e terminando em 5, podemos utilizar:

In [None]:
r1 = np.arange(1, 6)
print(r1)

Observe que a sequência agora começa em 1 (incluso), e "termina" em 6 (não incluso)! O último número do intervalo não será incluído. 

Podemos ainda definir intervalos (argumento *step*). Por exemplo, criar uma sequência de 0.5 em 0.5, começando em 2 e terminando em 4. Para isso, podemos utilizar os três primeiros argumentos da função: número inicial (incluso), número final (não incluso) e intervalo.  

Observe que, para incluir o valor 4 e não incluir 4.5, o segundo argumento *(stop)* deve estar entre 4 e 4.5. Optamos por deixar 4.5. 

In [None]:
q = np.arange(2,4.5,0.5)
print(q)

Você pode mudar os parâmetros dos argumentos dentro da função. Teste os três próximos exemplos e observe os resultados:

In [None]:
np.arange(1, 10, 2)

In [None]:
np.arange(1, 11)

In [None]:
np.arange(1, 9, 3.141593)

Além dos exemplos acima, podemos criar sequências regulares dentro de um intervalo. Nesse caso, precisamos usar a função *linspace*. 

Vamos usar os quatro primeiros argumentos da função: Início, Fim, Número de intervalos, e inclusão ou não do ponto final (*endpoint*). 

Teste as opções abaixo e observe os resultados:

In [None]:
np.linspace(0, 1, num=2, endpoint=False)

In [None]:
np.linspace(0, 1, num=2, endpoint=True)

In [None]:
np.linspace(0, 1, num=3, endpoint=True)

In [None]:
np.linspace(0, 1, num=4, endpoint=True)

In [None]:
np.linspace(0, 1, num=5, endpoint=True)

**Experimente criar um vetor começando em 0 e terminando em 100, com intervalos de 10 em 10**

Alguns tipos de vetores são necessários em alguns cálculos. Você pode utilizar outras funções para criar um vetor de zeros (*np.zeros*), ou um vetor apenas com o número 1 (*np.ones*):

In [None]:
np.zeros(5)

In [None]:
np.ones(5)

Podemos verificar todas as variáveis criadas com o comando %whos: 

In [None]:
%whos

Observe que para as funções `linespace()`, `zeros()`, e `ones()` não salvamos variáveis, e, por isso, elas não estão disponíveis no ambiente. 

## 5.2. Indexação e subconjuntos de vetores

Após a criação de vetores, é possível selecionar um elemento específico (ou elementos) considerando a posição ou valor.

Crie um vetor **g** com os elementos ["Curso", "Python", "NEDUR", 2022]:

In [None]:
g = np.array(["Curso", "Python", "NEDUR", 2022, "Agosto"])

Observe que, nesse caso, todos os elementos do vetor serão salvos como *strings* (texto). 

Assim como nas listas, a primeira posição de um vetor é a posição zero. Sendo assim, considerando o vetor **g**, podemos verificar o terceiro elemento (localizado na posição 2) com a seguinte notação:

In [None]:
g[2]

Podemos também utilizar os índices começando do final do vetor. Por exemplo, "NEDUR" está na posição 2, ou -2: 

In [None]:
g[-2]

Similarmente, podemos verificar os elementos contidos entre as posições 1 e 3, ou, dito de outro forma, selecionar o subconjunto de elementos entre as posições 1 e 3:

In [None]:
g[1:4]

Novamente, repare que o último elemento (posição 4), não foi incluído, assim como, não foi incluído o elemento de índice zero. 
    
Podemos também, criar um novo vetor com uma seleção do anterior, atribuindo um novo nome para a variável, nesse caso *n*:

In [None]:
n = g[1:4]
n

No caso de vetores numéricos, podemos selecionar utilizando operadores. 

Por exemplo, vamos recuperar o vetor de 0 a 100, com múltiplos de 9:

In [None]:
m = np.arange(0, 100, 9)
m

Se quisermos selecionar apenas os elementos maiores do que 20 poderíamos tentar o código:

In [None]:
m > 20

No entando, o resultado mostra que os primeiros três números não são menores do que 20, mas não seleciona o que queremos. 

Para que o comando seja compreendido, precisamos informar que queremos *m > 20* dentro do vetor *m*. Ou seja: 

In [None]:
m[m > 20]

## 5.3. Operações com vetores

Assim como foi feito com as variáveis, é possível realizar operações aritméticas e lógicas com os vetores. Para tal, defina um vetor **k** com os seguintes elementos [2, 4, 6, 8, 10]: 

In [None]:
k = np.arange(2, 11, 2)
k

**Insira linhas de código abaixo e experimente realizar as seguintes operações:**
- Multiplicar o vetor **k** por 2;
- Dividir o vetor **k** por 2;
- Somar `1`;
- Subtrair `1`.

Além das operações acima, podemos realizar operações com mais de um vetor, como somar dois vetores. Para tal, defina um vetor **s** conforme abaixo:

In [None]:
s = np.array([1, 2, 3, 4, 5])

Em seguida, **insira uma célula de código abaixo e crie um novo vetor** **b** que seja dado pela soma de **k** e **s**. 

Além das operações aritméticas, **operações lógicas** também podem ser realizadas com os vetores. Considerando o vetor **b** criado acima, **insira uma célula de código abaixo e verifique quais elementos são maiores ou iguais a 9**:

Repare que o resultado encontrado foi True (verdadeiro) para os elementos maiores ou iguais a 9 e False (falso) caso contrário. Ou seja, a operação reporta um resultado lógico.

Como anteriormente, se o interesse for reportar os valores maiores ou iguais a 9, **como poderíamos selecionar esses elementos?**

Se o interesse for encontrar a posição desses valores maiores ou iguais a 9, você pode utilizar a função `np.where()`. Nesse caso, o resultado será "3 4 5", ou seja, os elementos maiores ou iguais a 9 são aqueles nas posições 3, 4 e 5, como mostra o código abaixo.  

In [None]:
np.where(b >= 9)

## 5.4. Funções com vetores  

Diversas funções matemáticas e estatísticas podem ser aplicadas aos vetores numéricos, como soma, média, valor máximo, mínimo, quantis, entre outras.

A tabela abaixo apresenta algumas dessas funções:

Função             | Descrição
:------------------|:------------
`np.sum()` 	       | Retorna a soma do vetor
`np.min()`	       | Retorna o valor mínimo do vetor
`np.max()`   	   | Retorna o valor máximo do vetor
`np.mean()`        | Retorna a média do vetor
`np.median()`      | Retorna a mediana do vetor
`np.var()` 	       | Retorna a variância do vetor
`np.std()`         | Retorna o desvio padrão do vetor

Para praticar alguns desses operadores vamos utilizar o vetor **k** definido anteriomente:

In [None]:
k

In [None]:
np.sum(k)

In [None]:
np.min(k)

In [None]:
np.max(k)

In [None]:
np.mean(k)

In [None]:
np.median(k)

In [None]:
np.var(k)

In [None]:
np.std(k)

Essas mesmas funções e outras podem ser utilizadas tanto para vetores quanto para matrizes, que serão o tema do próximo tópico. 