# Aula 1: Introdução ao Python

Para nossas aulas vamos utilizar o [Jupyter Notebook](https://pt.wikipedia.org/wiki/Projeto_Jupyter).

Ele permite misturar blocos de código e texto, sendo ideal para redigir suas notas de aula. Além disso ele também permite executar pequenos blocos de código separadamente e verificar seu resultado na mesma hora.

* [Clique aqui para saber mais do Jupyter Notebook](https://pt.wikipedia.org/wiki/Projeto_Jupyter)

Nesta primeira aula o objetivo é ter o primeiro contato com a linguagem e entender o básico do que chamamos de sintaxe da linguagem. Entender como a linguagem funciona vai nos permitir criar análises cada vez mais complexas. Esse é o primeiro passo em direção à analises complexas. 

## Primeiros passos

Dados são armazenados na forma de variáveis. Para declarar uma variável basta escrever o nome da variável e colocar um símbolo de igual `=` antes do valor. É melhor dar nomes autoexplicativos que se relacionam a variável armazenada.

In [1]:
cargo = "analista_de_dados"

Ao selecionar um bloco com o mouse, aperte `Shift + Enter` ou `Ctrl + Enter` para rodar o código.

Variáveis de texto (_string_) devem ser declaradas utilizando aspas simples `' '` ou duplas `" "`. Se você digitar `analista_de_dados` apenas, sem as aspas, o Python vai procurar na mémoria por uma variável chamada analista_de_dados, se você digitar `"cargo"` ela retorna um texto escrito "analista_de_dados".


```
Se tentar declarar algo como <cargo = analista_de_dados> um erro ocorrerá. Isso acontece pois omitimos as aspas, e ao invés de ler analista_de_dados como um texto (string), o Python busca por uma variável cujo nome é analista_de_dados.
```

Para acessar o valor guardado basta chamar novamente a variável.

In [2]:
cargo

'analista_de_dados'

```
Tente dar nomes autoexplicativos para suas variáveis. Fazer isso de forma consistente deixa seu código mais intuitivo.
```

Você também pode usar underline (`_`) para o nome das suas variáveis.

In [3]:
cargo_executivo = 'gerente'
cargo_executivo

'gerente'

Existem palavras que chamamos de reservadas, elas tem funções especiais e não é possível atribuir valores a elas. Para conhecer essas palavras entre com o seguinte código:

In [4]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


`False` (assim como `True`) fazem referência a um **valor lógico**, então não é possível atribuir (guardar) valores à palavras reservadas.

In [5]:
False = 10

SyntaxError: cannot assign to False (<ipython-input-5-892860a61661>, line 1)

Perceba que ao tentar atribuir valor a `False` obtemos um `SyntaxError` (erro de sintaxe). O mesmo aconteceria com qualquer outra palavra reservada, como `import` por exemplo.

Você também **não pode começar o nome da sua variável com número...**

In [6]:
1nome_invalido = 0
1nome_invalido

SyntaxError: invalid syntax (<ipython-input-6-dd83d45c8ebc>, line 1)

... mas **pode usar números do segundo carácter em diante:**

In [7]:
cargo_02 = "coordenador"
cargo_02

'coordenador'

Python é case sensitive então `Cargo` e `cargo` são variáveis diferentes:

In [8]:
Cargo = "especialista em TI"
Cargo

'especialista em TI'

In [9]:
cargo

'analista_de_dados'

É possível atribuir um novo valor a uma variável existente:

In [10]:
cargo = "Analista de Dados Sênior"
cargo

'Analista de Dados Sênior'

Não é possível chamar variáveis que ainda não foram declaradas:

In [11]:
chefe

NameError: name 'chefe' is not defined

## Tipos de variáveis

Falar de tipos de variáveis é o mesmo que falar de **tipos de dados**. Elas são importantes pois cada tipo tem comportamentos diferentes, além de ocupar espaços diferentes na memória. Conhecendo os tipos de dados sabemos quais operações estão disponíveis além de permitir otimizar a alocação de memória.

Tecnicamente falando, Python é uma linguagem dinamicamente e fortemente tipada. O que significa dizer que toda variável tem um tipo. Quase que sempre o Python adivinha qual o tipo pelo valor atribuído, mas sempre existe um tipo.

Os tipos mais comumns são:

* inteiro -- 1, 2, 10, -20 (int);
* ponto flutuante -- 2.4, 3.14, 9000.01 (float);
* string -- "cafe", "friends", "anime" (str);
* números complexos -- 3 - 5j, -9 + 2.3j, 23.98 + 29.9j (complex);
* booleanos -- False, True (bool);

In [12]:
receitas = 4000
receitas

4000

Por exemplo, se eu atribuir `receitas = 4000`, o interpretador vai armazenar como inteiro.

```
Digite type(<variavel ou nome da variavel>) para descobrir o tipo da variável.
```

In [13]:
type(receitas)

int

Se eu incluir um ponto no final do número, ele entende que se trata de uma variável do tipo ponto flutante (número com casas decimais).

In [14]:
despesas = 2000.
despesas

2000.0

In [15]:
type(despesas)

float

Ao realizar operações entre variáveis, o tipo resultado pode ser diferente dos tipos originais. É o que acontece por exemplo quando se divide um inteiro por outro número (inteiro ou ponto flutuante)

In [16]:
receitas / despesas

2.0

```
Note que podemos usar a função type() sem sequer atribuir valor a uma variável.
```

In [17]:
type(receitas / despesas)

float

Note que `receitas` é um inteiro e ao divirmos por `despesas` (_float_) resulta em um _float_.

In [18]:
type(receitas)

int

Ao dividir um inteiro por outro (como 2) o mesmo comportamento é observado.

In [19]:
receitas = receitas / 2
receitas

2000.0

Ao reatribuir `receitas`, ele se torna um fluatuante após a divisão.

In [20]:
type(receitas)

float

Também é possível atribuir multiplas variáveis ao mesmo tempo. Isso as vezes prejudica a legibilidade do código, então use com cuidado.

In [21]:
cargo_03, salario_03, bonus_03 = "advogado junior", 4724.30, 1

Verifique que todas variáveis foram atribuídas corretamente:

In [22]:
cargo_03

'advogado junior'

In [23]:
salario_03

4724.3

In [24]:
bonus_03

1

Algumas funções permitem trocar o tipo de uma variável (quando possível). As principais são:

* int()
* float()
* str()
* complex()
* bool()

Cada célula de código imprime apenas o valor da última variável chamada, com pequenas excessões, como valores que estão dentro do `print()`. 

```
Use print(<valor/função>) para imprimir valores distantes do fim do bloco.
```

In [25]:
print(type(bonus_03)) # bonus_03 é originalmente um inteiro

bonus_03 = float(bonus_03) # convertendo bonus_03 para float

print(type(bonus_03)) # verificando que é bonus_03 agora é fluantante

<class 'int'>
<class 'float'>


```
O jogo da velha (#) é utilizado para comentar o código.
Tudo que esta na mesma linha e vem depois de # é ignorado
```

É possível converter um texto para outro formato se ele obedecer a estrutura do tipo:

In [26]:
float("0.5")

0.5

A variável `cargo_03` guarda o texto `"advogado junior"`. Perceba que ao tentar converter para flutuante gera um erro.

In [27]:
print(cargo_03)

float(cargo_03)

advogado junior


ValueError: could not convert string to float: 'advogado junior'

Não foi possível converter "advogado junior" para ponto flutuante. Agora vamos falar dos operadores.

## Operadores

Python puro disponibiliza uma série de operações. Elas são em sua maioria bastante intuitiva. Até aqui já fizemos somas e divisões. Vamos conhecer mais alguns operadores.

Essas operações geram novas variáveis que podem ser do mesmo tipo ou do tipo diferente daquelas envolvidas. Os principais grupos de operadores são: 

### Aritméticos

* \+ adição
* \- subtração
* \* multiplicação
* \\ divisão
* \*\* exponenciação
* % resto da divisão

Quando se tratam de operações entre números, os resultados são bastante intuitivos:

In [28]:
receitas_t1 = 4100
receitas_t2 = 5200
numero_de_meses = 3
trimestres_no_ano = 4

# Usando print() para mostrar os resultados
print("receitas_t1 * trimestres_no_ano =", receitas_t1 * trimestres_no_ano)
print("receitas_t1 / numero_de_meses =", receitas_t1 / numero_de_meses)
print("receitas_t1 + receitas_t2 =", receitas_t1 + receitas_t2)
print("receitas_t1 - receitas_t2 =", receitas_t1 - receitas_t2)

receitas_t1 * trimestres_no_ano = 16400
receitas_t1 / numero_de_meses = 1366.6666666666667
receitas_t1 + receitas_t2 = 9300
receitas_t1 - receitas_t2 = -1100


Lembra-se da aula de matemática onde algumas operações (como multiplicação) acontecem antes de outras (como a soma) e tudo que esta entre parentêses acontece antes de mais nada? No Python também é assim! Na dúvida sempre use parênteses para separar a ordem das operações.
<br>
```
() > ** > * > / > + / -
```

In [29]:
taxa_de_crescimento = (receitas_t2 - receitas_t1) / receitas_t1
print('A taxa de crescimento foi de:', taxa_de_crescimento)

A taxa de crescimento foi de: 0.2682926829268293


O comportamento do operador pode funcionar de formas diferentes para tipos diferentes de variável. Por exemplo, para texto o sinal de mais (`+`) concatena os textos:

In [30]:
"Analista" + " " + "Pleno"

'Analista Pleno'

Ao multiplicar um texto por um número inteiro ele se repete diversas vezes:

In [31]:
"Python " * 4

'Python Python Python Python '

Aqui repetimos "Python " 4 vezes.

### Lógicos (ou booleanos)

Existem operadores lógicos, também chamados de booleanos.

* \< menor que
* \> maior que
* \>= maior igual que
* \<= menor igual que
* == igual
* != diferente
* not não
* and e
* or ou

Tome por exemplos os seguintes operações.

In [32]:
funcionarios_2021 = 40
funcionarios_2022 = 42

funcionarios_2021 > funcionarios_2022

False

Lê-se "funcionarios_2021 maior do que funcionarios_22 ?". A resposta para essa asserção é falsa. `False` e `True` são dados lógicos (ou booleanos, podem ser lidos como 0 ou 1) e podem ser atribuídos.

In [33]:
crescimento_2022 = funcionarios_2022 > funcionarios_2021
crescimento_2022

True

Alternativamente poderiamos ter entrado com `crescimento_2022 = True`.

`not` (não) inverte a asserção lógica:

In [34]:
not( funcionarios_2022 > funcionarios_2021 )

False

Quando você usa a palavra `and` (e), as duas lógicas tem de ser verdadeiras:

In [35]:
print('funcionarios_2021 > 39?', funcionarios_2021 > 39)
print('funcionarios_2022 < 40?', funcionarios_2022 < 40)

print('funcionarios_2021 > 2 e funcionarios_2022 < -10?')
funcionarios_2021 > 39 and funcionarios_2022 < 40

funcionarios_2021 > 39? True
funcionarios_2022 < 40? False
funcionarios_2021 > 2 e funcionarios_2022 < -10?


False

Imediatamente acima vemos o seguinte:
* `funcionarios_2021` maior do que 39? Sim, 40 é maior do que 39;
* `funcionarios_2022` menor do que 40? Não, 42 é maior do que 40;
* 39 é maior do que 40 e 42 é menor do que 40? Essa última resposta é não, `False`.

Porém, se tentarmos:

In [36]:
print('funcionarios_2021 >= 40?', funcionarios_2021 >= 40)
print('funcionarios_2022 < 50?', funcionarios_2022 < 50)

print('funcionarios_2021 >= 40 e funcionarios_2022 < 50?')
funcionarios_2021 >= 40 and funcionarios_2022 < 50

funcionarios_2021 >= 40? True
funcionarios_2022 < 50? True
funcionarios_2021 >= 40 e funcionarios_2022 < 50?


True

* `funcionarios_2021` maior ou igual a 40? Sim, 40 é igual a 40;
* `funcionarios_2022` menor do que 50? Sim, 42 é menor do que 50;
* 40 é menor ou igual a 40 e 42 é menor do que 50? Agora a resposta é sim, `True`.

Também é possível comparar textos (strings):

In [37]:
"How I Met Your Mother" > "F.R.I.E.N.D.S." 

True

Lê-se "How I Met Your Mother é maior do que F.R.I.E.N.D.S. é verdadeiro (_True_)". Brincadeiras à parte, interpretador está apenas comparando a posição da primeira letra de cada _string_ (texto), o que equivale perguntar "H vem depois de F?".

In [38]:
"H" > "F"

True

Essas comparações lógicas são muito comuns no dia a dia de um analista quando se trata de filtrar os dados ou de construir novas variáveis. Embora a simbologia mude ligeiramente (não se preocupe com isso agora, trataremos adiante), a lógica por traz permanece a mesma. É importante saber que o resultado é sempre verdadeiro ou falso e conhecer os tipos de comparações que estão disponíveis.

Agora vamos cuidar de um tema muito importante, o que chamamos de manipulação de strings (leia string como sendo texto).

## Manipulação de textos

Strings são tipos muito comuns de dados (variáveis). Nomes, documentos, e-mails, categorias não numéricas, endereços. A lista é enorme. É indispensável saber manipular esses dados.

Nessa manipulação estão inclusos transformações e comparações que são exclusivos dos dados do tipo `string` (ou `str`). Muito frequentemente iremos nos deparar com o que chamamos de limpeza (ou normalização) de texto. As operações que iremos aprender aqui, muito embora simplificadas, vão abrir um leque de possibilidades na hora de analisar dados do tipo texto.

```
Fique sempre atento para não ferir a Lei Geral de Proteção de Dados Pessoais. Frequentemente anomizar dados pessoais requer alguma manipulação de texto.
```

Vamos começar pela método `upper()`. Um método de classe pode ser chamado chamando `<nome do objeto>.<nome do método>()`. Além dos métodos de um objeto (em Python toda variável é um objeto), também existem os atributos que guardam valores próprios dele. Diferente dos métodos, atributos não são chamados com parentesis no final (`<nome do objeto>.<nome do atributo>`).

_Strings_ são objetos do tipo string e seus métodos desempenham papel fundamental na manipulação dos mesmos. Aqui estão uma dos principais métodos de string e suas alterações:

* .upper() = letras maísculas;
* .lower() = letras minúsculas;
* .capitalize() = primeira letra maiúscula;
* .title() = primeira letra de cada palavra maísculas;
* .strip() = remove espaços em branco no começo e final;
* .rstrip() = remove espaços em branco no final;
* .lstrip() = remove espaços em branco no começo.

Perceba que nenhum desses métodos realiza modificações _in-place_, ou seja, eles retornam valores novos mas não modificam as variáveis originais.

In [53]:
cargo_03 = '  aDvoGADO jUNIOR  '

print('cargo_03:', '"' + cargo_03 + '"')
print('cargo_03.upper():', '"' + cargo_03.upper() + '"')
print('cargo_03.lower():', '"' + cargo_03.lower() + '"')
print('cargo_03.capitalize():', '"' + cargo_03.capitalize() + '"')
print('cargo_03.capitalize():', '"' + cargo_03.title() + '"')
print('cargo_03.strip():', '"' + cargo_03.strip() + '"')
print('cargo_03.rstrip():', '"' + cargo_03.rstrip() + '"')
print('cargo_03.lstrip():', '"' + cargo_03.lstrip() + '"')

cargo_03: "  aDvoGADO jUNIOR  "
cargo_03.upper(): "  ADVOGADO JUNIOR  "
cargo_03.lower(): "  advogado junior  "
cargo_03.capitalize(): "  advogado junior  "
cargo_03.capitalize(): "  Advogado Junior  "
cargo_03.strip(): "aDvoGADO jUNIOR"
cargo_03.rstrip(): "  aDvoGADO jUNIOR"
cargo_03.lstrip(): "aDvoGADO jUNIOR  "


Quando queremos que modificações desse tipo afetem a variável original é preciso re-atribuir o valor da seguinte forma:

In [56]:
print('cargo_03 antes:', '"' + cargo_03 + '"')

cargo_03 = cargo_03.strip().title()

print('cargo_03 depois:', '"' + cargo_03 + '"')

cargo_03 antes: "Advogado Junior"
cargo_03 depois: "Advogado Junior"


É bastante comum na rotina do analista ter que tratar erros em variáveis do tipo texto, como erros de digitação. Existem ainda métodos como `.startswith()` (começa com) e `.endswith()` (termina com) que retornam verdadeiro ou falso.

In [57]:
cargo_03.startswith("a") # começa com "a" minúsculo ?

False

In [58]:
cargo_03.startswith("A") # começa com "A" maisúculo ?

True

Essas funções são _case sensitive_ e é possível encadear funções antes dela para facilitar o processo. Lembre-se que ela pode pode conter palavras e símbolos inteiros ao invés de só letras como no exemplo acima. Considere fazer o seguinte:

In [59]:
cargo_03.rstrip().lower().endswith("junior")

True

Outro processo muito comum é trocar letras, simbolos ou até mesmo palavras inteiras. O método utilizado então é o `.replace(<padrão a ser substituido>, <novo padrão>)`. Considere a seguinte `string`:

In [61]:
cargo_04 = "Adv,Júnior"
cargo_04

'Adv,Júnior'

Ela pode estar fora do padrão e queremos ajustar. Gostariámos que fosse "advogado junior", com espaço em branco no lugar de vírgula, "advogado(a)" no lugar de "Adv" e que "Júnior" não tivesse acento. Poderiámos proceder da seguinte forma:

```
Vou usar jogo da velha (#) para comentar o código e mostrar o que está sendo feito em cada etapa. Tudo que vem depois de # é ignorado pelo python.
```

In [62]:
cargo_04 = (  # esse parentese permite quebrar o código em linhas
    cargo_04. # chamamos a variável original
    lower().  # convertemos para minúsculo
    replace("adv", "advogado(a)"). # adv vira advogado(a)
    replace(",", " ").# a vírgula vira um espaço em branco
    replace("ú", "u") # troca do ú pelo u
)

cargo_04

'advogado(a) junior'

### Textos como listas

Textos tem recursos muito parecidos como o de listas. Ele pode ser entendido como uma lista de caractéres afinal de contas. Veremos listas em maiores detalhes a seguir mas vou adiantar algumas manipulações que podemos realizar com _strings_. Podemos querer saber quantos caractéres têm (tamanho) e para isso usamos a função `len()`.

```
len() não é um método de strings, e sim uma função cujo comportamento (implementação) pode mudar de acordo com o tipo de objeto de que elea recebe. Se len() um método de strings sua chamada seria <string>.len() e não len(<string>). 
```

In [73]:
len(cargo_04)

18

Note que ela conta o número de caractéres (espaços em branco, pontos, vírgulas, sinais especiais) e não apenas de letras. _Python_ atribui a cada letra da _string_ um índice (posição) começando do zero e indo até $n - 1$, sendo $n$ seu tamanho. Dessa forma é possivel acessar letras ou pedaços de uma _string_. Para acessar caracteres individualmente usamos os colchetes. Números positivos dentro do colchetes indicam sua posição (partindo do zero) enquanto números negativos indicam sua posição de traz para frente:

In [65]:
cargo_04

'advogado(a) junior'

In [63]:
cargo_04[0] # primeira letra

'a'

In [64]:
cargo_04[-2] # penúltima letra

'o'

Ainda usando os colchetes podemos requisitar um pedaço (fatia ou _slice_) da _string_ passando a posição inicial seguidas de dois pontos e a posição final, sendo que a posição final não é incluída. E.g. `<string>[<posição incial>:<posição final>]`. Quais são as 8 primeiras letras de `cargo_04`?

In [69]:
cargo_04[0:8]

'advogado'

```
Perceba que o caractere na posição 8 não aparece. Como o índice começa em ZERO, o oitavo caracter é na verdade aquele no índice (posição) 7.
```

Omitindo o número antes dos dois pontos a fatia parte do início, omitindo o número depois dos dois pontos é o mesmo que indicar o final. Ainda é possível usar números negativos (posição em relação ao fim da _string_) e também indicar o passo. Para indicar o passo adicione outros dois pontos e informe um número. Omitir o passo é o mesmo que informar 1.

In [85]:
cargo_04[7::-1]

'odagovda'

No último exemplo o que os números dentro dos colchetes dizem é:
 * comece na posição 7;
 * vá até o final;
 * caminhando um passo para traz por vez (-1).
 
Esse mesmo comportamento de fatias é que veremos em uma estrutura de dados chamada de lista. Mais detalhes sobre elas adiante. Por hora vou mostrar como transformar um texto em lista e vice-versa. Para transformar um texto em lista use `<string>.split(<caracter utilizado para separar o texto>)`. Por exemplo, podemos separar o texto de `cargo_04` pelos espaços em branco:

In [86]:
lista_cargos = cargo_04.split(" ")
lista_cargos

['advogado(a)', 'junior']

Pronto. Agora temos `cargo_04` separados em uma lista. Podemos desfazer isso usando `join()`. A sintaxe passa a ser `<caracter de união>.join(<lista de strings para unir>)`. Essa função ira unir uma lista em uma nova _string_ usando um caracter informado.

In [87]:
nova_string = "-".join(lista_cargos)
nova_string

'advogado(a)-junior'

Recapitulando, _strings_ são dados bem comumns e aqui estão as principais operações que precisamos fazer no dia a dia:

* limpar espaços em branco no começo e/ou no final com `.strip()`, `.rstrip()` (de _right strip_) e `.lstrip()` (_left strip_);
* trocar letras maísculas e minúsculas com `.lower()`, `.upper()`, `capitalize()` e `.title()`;
* trocar caracteres com `.replace()`;
* fatiar a _string_ usando colchetes (`[]`);
* quebrar usando `.split()` e juntar com `.join()`.

Por hora examimos as variáveis básicas do _Python_. Podemos pensar nelas como unidades de dados. Por hora, com excessão do resultado trazido por `.split()`, armazenamos um dado por vez nos nossos objetos. Agora vamos conhecer as estruturas de dados que nos permitem armazenar mais de uma unidade de dado em um único objeto.

## Estrutura de dados

Estruturas de dados nos permitem armazenar diversas variáveis de diferentes tipos em um único objeto. Conhecer quais os tipos disponíveis e como cada uma delas funcionam, nos ajuda a interagir adequadamente com os diversos tipos de dados além de ampliar nossas possibilidades em relação ao que fazer.

_Python_ puro tem três estruturas básicas muito utilizadas:

* as listas;
* os conjuntos;
* as tuplas;
* os dicionários.

Vamos conhecer suas principais características, como criar e manipular cada uma delas.  

### Listas

Essas são estruturas que chamamos de mutáveis pois podem ser alteradas. Listas associam seus elementos com um índice inteiro indciando sua posição na lista, iniciando por zero. Para declarar uma lista basta usar colchetes como no exemplo abaixo:

In [90]:
receitas_2020 = []
receitas_2020

[]

````
Assim como tinhamos as funções float() ou str() para converter o tipo das variáveis, analogamente existe a função list() que é capaz de converter algumas estruturas em listas.
````

Podemos verificar que é uma lista usando `type()`:

In [91]:
type(receitas_2020)

list

`receitas_2020` é uma lista vazia. Podemos verificar isso usando a função `len()`:

In [92]:
len(receitas_2020)

0

Para declarar uma lista com mais elementos, separe cada um deles usando uma vírgula dentro do colchetes.

In [116]:
receitas_2021 = [100, 150, "erro", 80]
receitas_2021

[100, 150, 'erro', 80]

Feito, `receitas_2021` é um objeto com 4 elementos. Note que nem todos elementos são do mesmo tipo. Todos os elementos da lista estão associados a um índice que indicam sua posição na lista, partindo do zero (primeira posição é a zero). É possível acessar elementos da lista chamando seu índice dentro de colchetes.

In [117]:
receitas_2021[2]

'erro'

Também é possível atribuir novos valores a elementos já existentes na lista.

In [118]:
receitas_2021[2] = 78
receitas_2021[2]

78

Para adicionar um elemento no fim da lista utilize o método `.append()`.

In [119]:
receitas_2021.append(30)
receitas_2021

[100, 150, 78, 80, 30]

Esse método promove uma modificação _in-place_. Também é possível concatenar uma lista à outra somando listas.

In [120]:
receitas_2021 + [90, 91]

[100, 150, 78, 80, 30, 90, 91]

Somas não são modificações _in-place_. Para esse mesmo fim, um método _in-place_ que é mais eficiente é o _.extend()_.

In [121]:
receitas_2021.extend([101, 102])
receitas_2021

[100, 150, 78, 80, 30, 101, 102]

Utileze `.pop()` para remover um elemento. Informe o índice do elemento para eliminar.

In [122]:
receitas_2021.pop(1)
receitas_2021

[100, 78, 80, 30, 101, 102]

Fatias (ou _slices_) são formas de selecionar partes da lista. Assim como fizemos como _string_, abra colchetes e informe o índice do primeiro elemento a ser incluído, dois pontos (`:`) e o índice do elemento final sendo este elemento não incluído.

In [123]:
receitas_2021[1:4]

[78, 80, 30]

No código acima estamos selecionando o segundo elemento da lista (índice 1) até o quarto elemento (índice 3). Lembre-se que o índice começa de zero e que o fim da fila é excluído da fatia. Também é possível usar números negativos. Negativos fazem referência ao índice de traz para frente (do fim ao início).

In [124]:
receitas_2021[-4:]

[80, 30, 101, 102]

Quando se omiti o ínicio da fatia é o mesmo que dizer "do começo" e quando se omiti o final é dizer "até o final". Também é possível incluir o passo da fatia incluindo mais dois pontos depois do fim da fila.

In [125]:
receitas_2021[::2]

[100, 80, 101]

A fatia acima diz pega uma fatia que começa no início, acaba no final, a cada dois elementos. Ele busca o primeiro, depois o terceiro e em seguida o quinto. Fique atento ao guardar uma fatia em um objeto e depois tentar modificá-lo.

In [126]:
ultimas_receitas = receitas_2021
ultimas_receitas

[100, 78, 80, 30, 101, 102]

Na verdade, `ultimas_receitas` funciona como apelido para um pedaço de `receitas_2021`. Qualquer alteração em `ultimas_receitas` impacta em `receitas_2021`.

In [127]:
ultimas_receitas[-1] = "elemento alterado"
receitas_2021

[100, 78, 80, 30, 101, 'elemento alterado']

Para evitar esse compartamento use `.copy()`.

In [128]:
novas_receitas = receitas_2021.copy()
novas_receitas[-2] = "não se altera"
novas_receitas

[100, 78, 80, 30, 'não se altera', 'elemento alterado']

Note como `receitas_2021` não se altera:

In [129]:
receitas_2021

[100, 78, 80, 30, 101, 'elemento alterado']

Outro método importante é o `.sort()` que reordena os elemntos dentro de uma lista.

In [133]:
receitas_2021[-1] = 30
print("receitas_2021 antes de reordenar:", receitas_2021)

receitas_2021.sort()
print("receitas_2021 depois de reordenar:", receitas_2021)

receitas_2021 antes de reordenar: [100, 78, 80, 30, 101, 30]
receitas_2021 depois de reordenar: [30, 30, 78, 80, 100, 101]


Por padrão `.sort()` reordena em ordem crescente, mas também é possível ordenar em ordem decrescente com `.sort(reverse=True)`.

In [135]:
receitas_2021.sort(reverse=True)
receitas_2021

[101, 100, 80, 78, 30, 30]

Até agora mostrei listas que no máximo misturam inteiros e flutuantes. Mas é possível ter qualquer tipo dentro de uma lista, inclusive outras listas. Pense em uma construção como:

In [130]:
cabecalho = ["Nome", "Função", "Salário"]
funcionario_01 = ["José", "Analista", 5000]
funcionario_02 = ["Maria", "Coordenadora", 7000]

funcionarios = [cabecalho, funcionario_01, funcionario_02]
funcionarios

[['Nome', 'Função', 'Salário'],
 ['José', 'Analista', 5000],
 ['Maria', 'Coordenadora', 7000]]

Agora `funcionarios` lembra muito uma tabela ou matriz. Podemos obter a função do segundo funcionário pedindo pelo segundo elemento do terceiro elemento de `funcionarios`.

In [131]:
funcionarios[2][1]

'Coordenadora'

Note que alterando `funcionario_02` não altera a lista dentro de `funcionarios`.

In [132]:
funcionario_02 = ["Sandra", "Advogada", 6000]
funcionarios

[['Nome', 'Função', 'Salário'],
 ['José', 'Analista', 5000],
 ['Maria', 'Coordenadora', 7000]]

Lembre-se de que listas são mutáveis e estão ligadas a um índice que começa em zero. Outra estrutura importante são as tuplas.

### Tuplas

Tuplas são tipos imutáveis. Para delcarar uma tupla use os parentesis.

In [137]:
despesas_2019 = ()
despesas_2019

()

Chame `len(<tupla>)` para medir o tamanho da tupla.

In [81]:
len(despesas_2019)

0

De forma análoga, é possível incluir elementos em uma tupla separando-os por vírgula. Eles podem ter tipos variados.

In [144]:
despesas_2019 = (10, 12, 14, 20, 12.1, "N/A")
despesas_2019

(10, 12, 14, 20, 12.1, 'N/A')

Bem como nas listas, elementos das tuplas têm indíces que podem ser usados para retornar um elemento:

In [139]:
despesas_2019[0]

10

E seguem as mesmas regras das listas e _strings_ quando se trata de fatiar:

In [141]:
despesas_2019[1:3]

(12, 14)

Tentar alterar um elemnto da tupla gera um erro:

In [143]:
despesas_2019[0] = 12

TypeError: 'tuple' object does not support item assignment

Pense em usar tuplas no lugar de listas se o dado não deve ser alterado.

## Dicionários

Dicionários são declarados usando chaves (`{}`). Elas funcionam com uma estrutura _chave-valor_. Grosseiramente, dicionários são listas com índices customizados.

In [1]:
salarios = {}
salarios

{}

`len()` aponta o tamanho do dicionário;

In [2]:
len(salarios)

0

Para colocar valroes dentro do dicionários precisamos escolher a chave, o valor e separar essa combinação por vírgula. Chave e valor são separados por dois pontos. A sintaxe fica a seguinte:

In [5]:
salarios_dados = { "Analista de Dados" : 5500, "Cientista de Dados" : 4600}
salarios_dados

{'Analista de Dados': 5500, 'Cientista de Dados': 4600}

Não é possível acessar dados pela posição no índice, mas sim pela chaves.

In [6]:
salarios_dados["Analista de Dados"]

5500

Ao tentar acessar a chave por meio da posição um erro será imprimido.

In [7]:
salarios_dados[0]

KeyError: 0

É possível no entanto ter um número inteiro como chave. Para adicionar uma nova chaves a um dicionário já existente use `<dicionario>.update({<novas entradas>})`: 

In [8]:
salarios_dados.update({1 : [0, 1, 3]})
salarios_dados

{'Analista de Dados': 5500, 'Cientista de Dados': 4600, 1: [0, 1, 3]}

Aqui mostro duas coisas: números inteiros podem ser chaves; listas podem ser valores.

In [10]:
salarios_dados[1]

[0, 1, 3]

Na verdade como chaves podemos ter qualquer tipo de variável que seja _hashable_. Exemplos dessas são: _strings_, tuplas, inteiros, flutuantes, booleanos, complexos.

```
Uma forma alterativa para tipar um dado é o que chamamos de tipagem de pato (ou duck typing). Nada mais é que tipar dados pelo o que ele pode fazer, algum comportamento do dado. "Se tem pena e faz quack, é um pato". Hashable é um exemplo disso. Todas esses tipos citados acima são variáveis do "tipo hashable". Como hashable é um comportomaneto e não um tipo propriamente dito, é o tal do duck typing.
```

Para valores, tudo é possível. Outros dicionários podem ser utilizados como valores. Em opsição ao método `.update()`, o método `.pop()` retira elementos do dicionário.

In [13]:
salarios_dados.pop(1)

[0, 1, 3]

Alternativamente poderíamos ter entrado com `del salarios_dados[1]`.

Perceba que esse método recebe a chave e retorna o valor retirado. `.pop()` faz uma modificação _inplace_.

In [14]:
salarios_dados

{'Analista de Dados': 5500, 'Cientista de Dados': 4600}

Outros méotods importantes importantes são o `.keys()` e `.values()` que retornam resctivamente as chaves e valores na mesma ordem.

In [18]:
print("salarios_dados.keys():", salarios_dados.keys())
print("salarios_dados.values():", salarios_dados.values())

salarios_dados.keys(): dict_keys(['Analista de Dados', 'Cientista de Dados'])
salarios_dados.values(): dict_values([5500, 4600])


Embora não seja possível chamar diretamente pela posição do item na chave, é possível chamar pela posição da chave no método `.keys()` da seguinte forma:

In [21]:
chaves = list(salarios_dados.keys())

salarios_dados[chaves[0]]

5500

Muito embora seja possível fatiar a lista `chaves`

In [23]:
chaves[:2]

['Analista de Dados', 'Cientista de Dados']

Não é possível retornar mais de uma chave do dicionário ao mesmo tempo:

In [24]:
salarios_dados[chaves[:2]]

TypeError: unhashable type: 'list'

Se atribuirmos valores para uma chave já existente, seu valor é alterado no dicionário. Caso a chave ainda não exista nele, ele é criada.

In [25]:
salarios_dados["Analista de Dados"] = "Valor Alterado"
salarios_dados["Coordenador"] = "Novo Valor"

salarios_dados

{'Analista de Dados': 'Valor Alterado',
 'Cientista de Dados': 4600,
 'Coordenador': 'Novo Valor'}

Uma construção muito comum é atribuir listas como valores de cada chaves. Nestes casos, podemos pensar nas chaves como colunas de uma tabela, sendo todos os métodos das listas acessíveis por meio da chave.

In [26]:
informacoes_rh = {
    "ano" : [],
    "unidade_de_negocio" :[],
    "headcount" : [],
}

informacoes_rh

{'ano': [], 'unidade_de_negocio': [], 'headcount': []}

Use `.append()` para acrescentar informações:

In [27]:
# informações de 2021
informacoes_rh["ano"].append(2021)
informacoes_rh["unidade_de_negocio"].append("Inteligencia de Mercado")
informacoes_rh["headcount"].append(150)

# informações de 2022
informacoes_rh["ano"].append(2022)
informacoes_rh["unidade_de_negocio"].append("Inteligencia de Mercado")
informacoes_rh["headcount"].append(20)

informacoes_rh

{'ano': [2021, 2022],
 'unidade_de_negocio': ['Inteligencia de Mercado', 'Inteligencia de Mercado'],
 'headcount': [150, 20]}

### Inputs do Usuário

Periamos querer interagir com os usuários. _Inputs_ permitem fazer isso.

In [28]:
nome = input("Qual o seu nome? ")

Qual o seu nome? Vitor


Combinando o que vimos anteriormente nos dicionários 

In [31]:
informacoes_rh["ano"].append(int(input("Insira o ano: ")))
informacoes_rh["unidade_de_negocio"].append(input("Unidade de negócio: "))
informacoes_rh["headcount"].append(int(input("Headcount: ")))
                                            
informacoes_rh

Insira o ano: 2019
Unidade de negócio: Inteligência de Mercado
Headcount: 10


{'ano': [2021, 2022, 2019],
 'unidade_de_negocio': ['Inteligencia de Mercado',
  'Inteligencia de Mercado',
  'Inteligência de Mercado'],
 'headcount': [150, 20, 10]}

É possível ainda formatar strings de diversas formas. As mais comumns são:

* digitar f antes das áspas, como em `f" "`;
* chamar o método `.format()` ao final da _string_;
* chamando ` % ` depois da _string_.

Para cada um desses existem formas diferentes de indicar o que será formatado e onde. Primeiro considerar as seguintes entradas e veja que existem diversas sintaxes levando ao mesmo resultado.

In [32]:
cargo = input("cargo=")
nivel = input("nível=")
salario = input("salário=")
salario = float(salario)

print(f"{cargo} {nivel} ; salário = R${salario : .2f}")
print("{} {} ; salário = R${:.2f}".format(cargo, nivel, salario))
print("%s %s ; salário = R$%.2f" %(cargo, nivel, salario))

cargo=Analista
nível=Júnior
salário=4500.23


[Mais informações](https://www.pythoncheatsheet.org/cheatsheet/string-formatting)

É possível verificar se uma chave faz parte de um dicionário:

In [46]:
"ano" in informacoes_rh

True

## Condições

Condições seguem um padrão "se verdaeiro, fazer algo". _Python_ é uma linguagem identada, então para usar o condicional comece com a palavra reservada `if` seguida de uma variável booleana ou uma condição, dois pontos. O que vem abaixo e identado (normalmente usam 4 espaços em branco ou _tab_) é o código que deve ser executado.

In [166]:
if True:
    # tudo aqui é executado
    print("Isso é executado")
    
    
if False:
    print("Esse não.")

É verdadeiro


Palavras reservadas `not`, `and`, `or` e `in` são bastante úteis no momento de construir condições. Considere o exemplo:

In [167]:
if 2019 not in informacoes_rh["ano"]:
    print("Insira informações de 2019")
    informacoes_rh["unidade_de_negocio"].append(2019)
    informacoes_rh["unidade_de_negocio"].append(input("Unidade de negócio: "))
    informacoes_rh["headcount"].append(int(input("Headcount: ")))

Os `if` podem vir seguidos de outras lógicas a serem testadas, essas são os `elif`. Por fim, se nenhuma condição que vem depois do `if` e/ou `elif`s são atendidas, então é possível encadear um `else` que só sera executado se nada depois do último `if` foi executado.

```
Uma linha não identada sinaliza o fim das condições. Não é possível inserir um elif ou else depois disso.
```

Considere o exemplo seguinte para ver como as condições podem ser encadeadas:

In [49]:
margen_2022 = 0.2
positiva = False

if margen_2022 >= 0.5 and positiva:
    print("Margem muito alta")
elif margen_2022 >= 0.3 and positiva:
    print("Margem alta")
elif margen_2022 >= 0.15 and positiva:
    print("Margem média")
elif abs(margen_2022) < 0.15:
    print("Margem baixa")
    if not positiva:
        print("e negativa")
    else:
        print("e positiva")
else:
    print("Margem muito baixa")

Margem muito baixa


Note que podemos ter `if`\\`elif`\\`else`s dentro de outros condicionais. Fique atente-se para o comportamento das palavras reservadas:

* `and` só resulta em verdadeiro se ambas condições forem verdadeiras;
* `or` resulta em verdadeiro se alguma das condiçõe for verdadeira;
* `not` inverte a lógica, verdadeiro vira falso e vice-versa;
* `in` verdadeiro se um objeto está dentro de outro.

Você pode testar as acerssões fora de condicionais para verificar seu retorno:

In [51]:
print("margen_2022:", margen_2022)
print("positiva:", positiva)

print("margen_2022 >= 0.3 and positiva?")
margen_2022 >= 0.3 and positiva

margen_2022: 0.2
positiva: False
margen_2022 >= 0.3 and positiva?


False

## Estruturas de Repetição

Estruturas de repetição executam códigos repetidamente. As principais estruturas de repetição em _Python_ são o `while` e o `for`. O primeiro executa uma repetição enquanto certa condição é atendida (cuidado para não executar um código eternamente). Normalmente eles são executados com contadores. A palavra reservada `break` quebra a repetição.

In [52]:
contador = 0

while contador < 5:
    print("Contador atual:", contador)
    contador = contador + 1

Contador atual: 0
Contador atual: 1
Contador atual: 2
Contador atual: 3
Contador atual: 4


`for` pega um elemento por vez de um objeto iterável (muitos são) e executa o código para cada iterador até que todos sejam percorridos ou um condição de parada atingida. Você pode usar `break` para definir uma condição de parada. Outra palavra importante para `while` e `for` é o `continue` que pula para o próximo laço de repetição.

A função `range()` permite criar um interlavo. Por padrão ele começa de zero e vai até o número informado. Também é possível informar a posição incial, final (sendo final não incluso) e o passo. Por exemplo, `range(5)` cria um intervalo do zero ao quatro, incrimentando um número por vez. `range(1,6,2)` cria um intervalo indo de 1 até 5 com passos incrimentais de dois por vez.

Para percorrer todos os elementos de `range(1,6,2)` podemos usar um `for`:

In [53]:
for numero in range(1,6,2):
    print(numero)

1
3
5


Eu poderia ter dado qualquer outro nome válido em lugar de `numero`, que é uma espécie de apelido para cada elemento retirado por vez. Tente compreender o que ocorre abaixo:

In [58]:
for i in range(3, 31, 3):
    # se o resto da divisão por 6 é zero
    if i % 6 == 0:
        print(i, "é múltiplo de 2 e 3.")
    # do contrário, se o resto da divisão por 2 é zero
    elif i % 2 == 0:
        print(i, "é múltiplo de 2.")
    # do contrário, se o resto da divisão por 3 é zero
    elif i % 3 == 0:
        print(i, "é múltiplo de 3.")

3 é múltiplo de 3.
6 é múltiplo de 2 e 3.
9 é múltiplo de 3.
12 é múltiplo de 2 e 3.
15 é múltiplo de 3.
18 é múltiplo de 2 e 3.
21 é múltiplo de 3.
24 é múltiplo de 2 e 3.
27 é múltiplo de 3.
30 é múltiplo de 2 e 3.


Ou então:

In [61]:
j = 0
while True:
    j = j + 1
    # se j for 10, pulamos para o iterador seguinte
    if j == 10:
        continue    
    elif j % 5 == 0:
        print(j)
    elif j == 31:
        print("j =", j)
        print("Condição de parada")
        break
    

5
15
20
25
30
j = 31
Condição de parada


## Funções

Para criar funções novas use a palavra reservada `def() <nome_da_função>()` seguido de `:` e identação.

In [5]:
def promover():
    print("Você é uma máquina de vencer!")

Depois é só chamar pelo nome:

In [6]:
promover()

Você é uma máquina de vencer!


Funções podem ter nenhum ou vários argumentos.

In [8]:
def calcula_valor_futuro(capital_inicial, tempo, juros):
    return capital_inicial * (1 + juros) ** tempo
    
calcula_valor_futuro(1000, 12, .01)

1126.8250301319697

Ao chamar por uma função existente é possível informar os argumentos na mesma ordem em que eles foram criados. Note que eu não avisei qual dos números era o _capital_incial_ e _etc_. Eu apenas informei eles na ordem "correta". Também era perfeitamente possível executar `calcula_valor_futuro(capital_inicial=1000, tempo=12, juros=.01)`. Quando eu dou nome para os argumentos a ordem não importa.

Para que a função devolva um valor é preciso usar a palavra reservada `return`. Assim que você uma linha com `return` é executado, a função termína e nada mais abaixo é executado. Preste atenção no exemplo.

In [10]:
def soma(a, b):
    print("esse bloco é executado")
    soma_ab = a + b
    return soma_ab
    print("isso não é executado")
    
    
soma(2,3)

esse bloco é executado


5

O efeito do `return` para uma função é semelhante ao `break` de um _loop_, sendo que para a função ele pede que um valor seja devolvido pela função. Para informar argumentos padrões na criação da função use um sinal de igual para atribuir um valor padrão para o argumento. Todos os argumentos com valores devem ser deixados para o final da função.

In [11]:
def valor_futuro(vp, tempo, i=0.01):
    return vp * (1 + i) ** tempo

valor_futuro(tempo=12, vp=100)

112.68250301319698

Perceba que inverti a ordem dos argumentos (com o nome) na hora de chamar a função, e omiti o último argumento, que por padrão tinha valor $0.01$ (1%).

### Escopo da função

Funções tem escopo próprio. Isso quer dizer ainda que tenham o mesmo nome, elas não alteram variáveis que estão fora dela, fora do seu escopo. É possível alterar variáveis que estão fora da fução se a palavra `global` for utilizada.

In [15]:
x = 10
y = 4

def troca_x(a):
    x = a # por enquanto x só existe na função
    
    global y # usar global altera o escopo da variavel
    y = a
    
print("x antes", x)
print("y antes", y)
troca_x(2)
print("x depois", x)
print("y depois", y)

x antes 10
y antes 4
x depois 10
y depois 2


Outras funcionalidades úteis são os símbolos coringa `*` e `**`. Com eles as funções passam a aceitar argumentos extras:

In [20]:
def coringa(*kw):
    print(*kw)
    
coringa(1,2,3)

1 2 3
