# Introdução

Este tutorial tem como principal objetivo ser um primeiro contato para quem nunca programou em Python, mas já tem noções de como programar. Os exemplos serão simples e não esperamos que você saia daqui sabendo *algoritmos* de forma aprofundada, a ideia é apresentar de forma simples a sintaxe da linguagem.


***
## Lista de conteúdos:
- [1 - Estruturas básicas da linguagem](#pt1)
 - [1.1 - Variáveis, expressões, comandos e operadores](#pt1.1)
 - [1.2 - Funções](#pt1.2)

- [2 - Controle de fluxo](#pt2)
  - [2.1 - Estrutura de seleção](#pt2.1)
  - [2.2 - Estruturas de repetição for](#pt2.2)
  - [2.3 - Estruturas de repetição while](#pt2.3)
  
- [3 - Estruturas de dados nativas](#pt3)
  - [3.1 - Stings](#pt3.1)
  - [3.2 - Listas](#pt3.2)
  - [3.3 - Conjuntos](#pt3.3)
  - [3.4 - Dicionários](#pt3.4)

- [4 - Dicas e truques](#pt4)
  - [4.1 - Operador unpack](#pt4.1)
  - [4.2 - List comprehension](#pt4.2)
***

## Motivação

Os trabalhos relacionados com processamento de linguagem natural (PLN) envolvem, em essência, strings e matrizes. Estes tipos de estruturas de dados podem ser encontradas em qualquer linguagem de programação moderna, mas, nem todas permitem uma interface amigável com o programador; qualquer pessoa que já precisou processar strings em C já percebeu que não é uma tarefa tão fácil, ainda que o resultado seja executado de forma bem rápida. Em Python, o interpretador toma conta de vários detalhes em nome do programador para que ele não precise se preocupar com minúcias ao longo do desenvolvimento do algoritmo. Este tipo de comportamento em *run-time* acaba consumindo um certo processamento da máquina, tornando sua execução mais lenta, entretanto, o objetivo das aulas reside no entendimento da matéria e não na criação de processos super eficientes e escaláveis. Portanto, nossos exemplos não serão grandes o suficiente para que a performance da linguagem seja algo que precise ser levada em conta.


### Um pouco sobre Python
Python é uma linguagem de programação alto nível, interpretada, de propósito geral e multi-paradigma criada por Guido van Rossum sendo lançada em 1991. É dinamicamente tipada, os blocos são indicados por espaços em branco (“*tabs*”), ao invés de chaves e possui uma sintaxe simples de ser utilizada. Os valores são passados por referência nas funções e é majoritariamente orientado a objetos.


### Um pouco sobre o Jupyter
O Jupyter é um programa derivado do IPython que pode ser utilizado para programar em Python, te possibilitando escrever código junto com textos no mesmo arquivo, organizando o fluxo de ideias ao longo do documento. O nome Jupyter é uma referência das 3 principais linguagens que ele suporta, [**Ju**lia](https://julialang.org/), **pyt**hon e **R**


## Instalação do ambiente
Se voçẽ usa Windows, é recomendado instalar alguma distribuição linux em *dualboot* ou máquina virtual para cumprir as atividades da disciplina. Mas, existe a possibilidade de instalar o Anaconda no windows para usar o jupyter.

Em Linux, o python já vem instalado pois várias coisas do SO utilizam esta linguagem, e nada precisa ser feito. Para instalar o Jupyter, basta usar seu gerenciador de pacotes para carregar o necessário. O nome do pacote costuma ser jupyter-notebook, então se você rodar num terminal algo como: “sudo apt install jupyter-notebook” para derivados do Debian, deveria funcionar. O mesmo para derivados do Arch, Fedora, dentre outros, apenas trocando pelo gerenciador de pacotes específico.

Assim que você conseguir instalar o Jupyter no seu computador, pode clonar este repositório no seu ambiente local para ter todos os arquivos à mão. a execução do Jupyter é simples, basta rodar "jupyter-notebook" num terminal que uma aba será aberta no seu navegador padrão; então navegue onde o repositório está clonado (ou onde você quer criar os arquivos das atividades) e abra/crie os arquivos com a extensão ipynb.


### Utilização do Jupyter
O Jupyter te permite, dentre inúmeras outras coisas, criar células de texto que podem ser interpretadas como [Markdown](https://pt.wikipedia.org/wiki/Markdown) (como esta celula, por exemplo) um tipo de linguagem de marcação que possibilita a formatação simples de texto com alguns tokens, assim como LaTeX e HTML. Se este notebook estiver aberto no seu jupyter local, dê dois cliques nesta célula e veja como a formatação em Markdow funciona.

O outro tipo de célula que pode ser utilizada, são as de código, onde programas em python são escritos e o Kernel do Jpupyter consegue executar e te entregar o resultado do programa na tela.

 - Para **editar** uma célula, basta dar dois cliques em qualquer lugar dentro de sua região
 - Para **executar** uma célula, basta utilizar o atalho `Ctrl + Enter` com a célula desejada em foco.
 
O Jupyter possui um comportamento parecido com o [Vim](https://pt.wikipedia.org/wiki/Vim), com um modo "normal" e outro de "edição". Se estiver no modo normal, é possível navegar com as setas -hjkl não funcionam- e para começar a editar é só apertar `Enter` com a célula em foco (a célula em foco no modo normal fica com a linha
<font color="blue">azul</font> e no modo de edição <font color="green">verde</font>). Para sair do modo de edição, basta apertar `Esc`. No modo normal, os comandos mais úteis são:
 - Adicionar célula acima(above): `A`
 - Adicionar célula abaixo(below): `B`
 - Remover uma célula: `X`
 - Transformar a célula para markdow: `M`
 - Transformar a célula para código: `Y`
 - Adicionar número das linhas para todas as células `Shift+L`
 - MOstrar o menu com todos os atalhos `H`
 
Um detalhe particularmente curioso sobre o Jupyter é que cada vez que uma célula de código é executada, todo seu conteúdo é armazenado num buffer. Então todas as variáveis iniciadas numa célula podem ser acessadas por uma outra célula que foi executada depois.


***

<a id="pt1"></a>

# Parte 1: Estruturas básicas da linguagem


<a id="pt1.1"></a>
## 1.1 Variáveis, expressões , comandos e operadores
   
Em qualquer linguagem [Turing completa](https://pt.wikipedia.org/wiki/Turing_completude), algum tipo de estrutura que guarde informação se faz necessária, e, em python, estas são as *variáveis*. Como a linguagem é dinamicamente tipada, não existe a necessidade de declarar variáveis com um tipo já determinado, já que elas podem mudar o conteúdo a qualquer momento.

In [1]:
variavel_qualquer = "Batata"
print(variavel_qualquer)

variavel_qualquer = 1
print(variavel_qualquer)

variavel_qualquer = 0.5
print(variavel_qualquer)

variavel_qualquer = ["Batata-frita", "Batata-corada"]
print(variavel_qualquer)

variavel_qualquer = 1.5E10

print(variavel_qualquer)
print("O tipo da variavel_qualquer é: ", type(variavel_qualquer))

Batata
1
0.5
['Batata-frita', 'Batata-corada']
15000000000.0
O tipo da variavel_qualquer é:  <class 'float'>


No exemplo acima, `variavel_qualquer` recebeu diversos tipos de dados diferentes ao longo da execução e em nenhum momento o interpretador reclamou que você estava misturando tipos diferentes na mesma variável.

Ainda que seja permitido este tipo de comportamento, não é bem visto misturar tipos diferentes numa mesma variável, pois o código acaba ficando semanticamente confuso. Uma pessoa (inclusive você no futuro) pode acabar se confundindo sobre o que está sendo operado naquela linha.

A função utilizada na última linha, `type()`, recebe como argumento uma variável ou expressão e te retorna o tipo da variável ou do resultado da expressão.
    
Uma **expressão** é uma combinação de operadores, valores e variáveis que pode ser avaliado pelo interpretador. O exemplo abaixo mostra como uma expressão pode ser construída.

In [2]:
1 + 2

3

Python suporta diversos tipos de **operadores** e existe sobrecarga de operador com comportamentos diferentes dependendo do tipo de dado que está sendo utilizado. Este é um dos argumentos que sustenta o acordo de não mudar o tipo de uma variável ao longo da execução. Os principais são:

In [3]:
print("Soma simples:", 1+2)
print("Mubtração simples:", 1-2)
print("Multiplicação simples:", 3*4)
print("Divisão inteira:", 10//3)
print("Divisão em ponto flutuante:", 10/3) # A precisão padrão do ponto flutuamte é 17 bits significativos
print("Resto da divisão inteira:", 10%3)
print("Potencia:", 2**10)
print("Raíz usando potencia:", 1024**0.5) # Neste caso, raíz quadrada

# Os mesmos operadores também podem ser usados com outros tipos de dados,
# por isso, cuidado
print("\nSoma de uma string" + " com outra")
print("Multiplicação com string " * 4)
print(4 * "Multiplicação com string ")

Soma simples: 3
Mubtração simples: -1
Multiplicação simples: 12
Divisão inteira: 3
Divisão em ponto flutuante: 3.3333333333333335
Resto da divisão inteira: 1
Potencia: 1024
Raíz usando potencia: 32.0

Soma de uma string com outra
Multiplicação com string Multiplicação com string Multiplicação com string Multiplicação com string 
Multiplicação com string Multiplicação com string Multiplicação com string Multiplicação com string 


Um **comando** é uma instrução enviada ao interpretador para que ele execute algum tipo de atividade específica. Exemplos de comando podem ser a função `print()`, que utilizamos anteriormente, e atribuições. Comandos podem ou não retornar retornar informações, e cabe ao programador/a decidir o que fazer em cada um dos casos. 

In [4]:
# O print é um comando
print("Isto é um comando!")

# Atribuição também é um comando
variavel = "Este é outro comando que não indica ao usuário que foi executado"

Isto é um comando!


Sempre que queremos imprimir algo na tela, precisamos utilizar a função `print`; que recebe uma variável, valor ou expressão como argumento. A função recebe zero ou mais elementos separados por vírgula, e imprime cada um deles com uma espaço entre cada e termina a frase com uma quebra de linha.

Existem caracteres reservados que são utilizados para a formatação da saída nos prints e não são mostrados na tela, o `\n` quebra a linha enquanto o `\t` é a tabulação.

In [5]:
print("Primeira string", "e segunda string", "todas na primeira linha")
print()  # apenas imprime uma linha em branco
print("Quarta string que está na terceira linha impressa")
print("Exemplo de print com uma expressão:\nO resultado de 1+2 é: ", 1+2)

Primeira string e segunda string todas na primeira linha

Quarta string que está na terceira linha impressa
Exemplo de print com uma expressão:
O resultado de 1+2 é:  3


<a id="pt1.2"></a>
## 1.2 Funções

No contexto de programação, função é uma sequência nomeada de instruções ou comandos, que realizam uma operação desejada. Esta operação é especificada numa definição de função. Existe, as funções nativas da linguagem que já estão implementadas e podemos apenas utilizá-las. Até o momento já vimos duas, a `type` que retorna o tipo de seu argumento e a `print` que imprime na tela, entretanto existem diversas outras.

Uma tarefa comum ao longo da programação é a conversão de diferentes tipos, quando um operador tem comportamentos distintos dependendo do que se é operado. Suponha que você deseja concatenar uma string $A$ com um número inteiro $B$. O operador da concatenação de strings é o `+`, que também é usado para adição aritmética, e por isso não podemos executar a concatenação logo de cara senão obtemos um erro:

In [6]:
A = "Uma string que vai anteceder um inteiro: "
B = 1
print(A+B)

TypeError: can only concatenate str (not "int") to str

É necessário converter a variável `B` para string antes de concatenar as duas no print

In [7]:
B_str = str(B)
print(A+B_str)

Uma string que vai anteceder um inteiro: 1


Nestes casos em que o propósito é montar strings a partir de valores de variáveis, pode ser chato ter que ficar convertendo tudo para string no momento de concatenar, e, por isso, na versão 3.6 do python foi introduzido uma funcionalidade chamada de *f-strings*, uma forma de criar strings "formatadas" incluindo código dentro da definição das aspas. A sintaxe é simples e basta, antes da primeira aspa, adicionar um `f` e, dentro da string, tudo que estiver entre chaves será interpretado como uma expressão.

In [8]:
print(f"Posso colocar um texto aqui e antes do que queríamos -> {A}{B}")
print(f"A soma de 1 e 3 é {1+3}")

frutas = ["banana", "abacate", "maçã", "kiwi"]
print(f"Minhas frutas favoritas são {', '.join(frutas)}")  # Vamos falar melhor sobre o join em strings

Posso colocar um texto aqui e antes do que queríamos -> Uma string que vai anteceder um inteiro: 1
A soma de 1 e 3 é 4
Minhas frutas favoritas são banana, abacate, maçã, kiwi


Ainda sobre funções de conversão de tipos, temos a `float` e `int`

In [9]:
print("string para int:   ", int("123"))
print("string para float: ", float("3.14"))
print("float para int:    ", int(5.1))
print("int para float:    ", float(6))

string para int:    123
string para float:  3.14
float para int:     5
int para float:     6.0


Se a conversão for entre elementos inválidos, o interpretador retornará um erro e não fará a conversão

In [10]:
print("string para int:   ", int("qualquer coisa que não da pra transformar em int"))

ValueError: invalid literal for int() with base 10: 'qualquer coisa que não da pra transformar em int'

Além das funções que já vem por padrão, é possível criar as nossas da forma como quisermos. A sintaxe base da assinatura das funções em python podem ser as seguintes:
```py
def f1(arg1, arg2):

def f2(arg1 = "", arg2 = 0):

def f3(arg1, arg2 = 0):
```
 - Quando queremos uma função chamada `f1` que recebe dois argumentos, `arg1` e `arg2`, que podem ser qualquer de qualquer tipo, já que python é dinamicamente tipado.
 - A função `f2` também recebe dois argumentos, mas, desta vez, cada um deles possui um valor *default* associado a elas. Portanto, se na chamada da função não for passado seus argumentos, estes serão uma string vazia e zero.
 - A função `f3` Mistura elementos da função  `f1` e `f2`, tendo um de seus argumentos com um valor *default* e o outro não. Esta forma é válida, mas neste caso a ordem é importante.

```py
def f4(arg1 = 0, arg2):
```
A função `f4` retorna um erro, já que um argumento sem valor *default* não pode vir depois de um que possui.


In [11]:
def f4(arg1 = 0, arg2):
    return arg1 * arg2

f4(2)

SyntaxError: non-default argument follows default argument (<ipython-input-11-cfa39b0a4c95>, line 1)

Mas, um detalhe não pode passar despercebido aqui: definir um valor *deault* no argumento da função não quer dizer que ele só poderá ser daquele tipo. O ponto é que este valor só será utilizado se na chamada ele for omitido.

In [12]:
def f1(arg1 = ""):
    return arg1

print("Tipo de retorno de f1 sem passar argumento:        ", type( f1()   ))
print("Tipo de retorno de f1 passando int como argumento: ", type( f1(10) ))

Tipo de retorno de f1 sem passar argumento:         <class 'str'>
Tipo de retorno de f1 passando int como argumento:  <class 'int'>


O valor de um argumento default pode ser tanto um literal, quanto um objeto, como uma função. Todos estes tipos de assinatura são válidos e podem variar dependendo do que você deseja fazer.

In [13]:
def f1(valor="10", funcao_para_casting=int):
    return funcao_para_casting(valor)

print("Passando os argumentos:", type(f1("10", int)))

print("Utilizando os valores default:", type(f1()))

Passando os argumentos: <class 'int'>
Utilizando os valores default: <class 'int'>


<a id="pt2"></a>
# Parte 2: Controle de fluxo

<a id="pt2.1"></a>
## 2.1 Estrutura de seleção

Estruturas de seleção, ou expressão condicional ou ainda construção condicional, é a forma como podemos decidir no *runtime* qual parte de código será executada dependendo do resultado de uma expressão booleana.

Em python, não é necessário incluir os parêntesis na sintaxe do `if`, mas se você se sente mais confortável o usando, fique a vontade.

In [14]:
frutas = ["banana", "abacate", "maçã", "kiwi"]

if "abacate" in frutas:
    print("Abacate é uma fruta!")
else:
    print("Abacate não é uma fruta")
    

    
if True:
    print("True é sempre verdadeiro, False não.")
    
    
    
if 826423 % 23 == 0:
    print("O resto da divisão inteira de 826423 por 23 é zero")
else:
    print("O resto da divisão inteira de 826423 por 23 não é zero")

Abacate é uma fruta!
True é sempre verdadeiro, False não.
O resto da divisão inteira de 826423 por 23 não é zero


Se você está acostumado a programar em C ou Java, deve ter visto que existe um tipo de dado chamado `Null` que serve para representar que uma determinada variável "não tem um valor" associado a ela. Em python é o `None`.

Como o `None` tem a semântica de "não ser nada", podemos compará-lo utilizando o sinal de igualdade ou desigualdade, mas a forma idiomática (como quem utiliza a linguagem prefere usar) é comparar usando o `is`.

In [15]:
a = None
if a == None:
    print("a é None com igual")
    
if a is None:
    print("a é None com is")

b = "Qualauqer coisa não None"
if b is not None:
    print("b não é None com is")
    

a é None com igual
a é None com is
b não é None com is


A diferença entre o `==` e `is` é que o sinal de igualdade avalia se o **valor** sendo comparado é igual enquanto o `is` verifica se a **referência** de ambas as variáveis é igual.

In [16]:
A = [1, 2, 3]
B = [1, 2, 3]

if A == B: print("A == B")
if A is B: print("A is B")

print(id(A), id(B))

A == B
139915809175176 139915808378184


O segundo `if` não imprime nada na tela já que ambas as variáveis são diferentes (ainda que possuem o mesmo valor) pois elas ocupam posições de memória distintas. Podemos conferir isso olhando que o `id` de cada uma é distinto.

O que você esperaria como resposta se o seguinte código for executado?
```py
A = 10
B = 10

if A == B: print("A == B")
if A is B: print("A is B")
```
É esperado que o comportamento seja igual do exemplo anterior, mas aqui ocorre uma peculiaridade da linguagem

In [17]:
A = 10
B = 10

if A == B: print("A == B")
if A is B: print("A is B")

print(id(A), id(B))

A == B
A is B
139915886990848 139915886990848


Tipos primitivos (inteiros, floats, strings e booleanos) são todos armazenados na mesma posição de memória e cada variável com este conteúdo possui a mesma referência (para economizar espaço). Qualquer outro tipo de tipo não primitivo possui o comportamento usual.

Comparação de grandeza funciona de forma similar a C ou Java:

In [18]:
if 20 > 3: print("20 é maior que 3")

if 3 <= 20: print("3 é menor ou igual a 20")

20 é maior que 3
3 é menor ou igual a 20


Operadores lógicos $e$ e $ou$ são implementados com a *keyword* `and` e `or`. Para aninhar um outro `if` dentro do `else`, utilizamos a notação `elif`

In [19]:
a = 10

if a == 10 and a is 10:
    print(a)
    
elif a != 10 or a is not 10:
    print("A primeira expressão é falsa e a segunda verdadeira")
    
else:
    print("Todas as expressões foram falsas")
    

10


<a id="pt2.2"></a>
## 2.2 Estruturas de repetição for

Uma das estruturas de repetição mais utilizadas na linguagem é o `for` e podemos utilizá-lo de diferentes maneiras.

Qualquer *container* em python é iterável, ou seja, podemos colocá-lo direto no laço.

A sintaxe base é:
```py
for variavel_do_laço in container:
    logica de programação
```

In [20]:
frutas = ["banana", "abacate", "maçã", "kiwi"]
for fruta in frutas:
    print(fruta)

banana
abacate
maçã
kiwi


Sempre que for necessário iterar em cima de uma sequencia, temos que utilizar a função `range` que possui 3 argumentos:
```py
range(inicio, fim, passo)
```
Em que `inicio` é incluído e `fim` não.

In [21]:
print("Numeros pares de 0 a 10 usando for")
for i in range(0, 10, 2):
    print(i)

Numeros pares de 0 a 10 usando for
0
2
4
6
8


In [22]:
print("Numeros pares de 10 a 0 ao contrário")
for i in range(10, 0, -2):
    print(i)

Numeros pares de 10 a 0 ao contrário
10
8
6
4
2


Pode ser tentador programar como se estivesse utilizando a linguagem C, acessando cada elemento da lista pelo seu índice e imprimindo-o

In [23]:
for i in range(len(frutas)): # A função len() retorna o comprimeiro da lista
    print(frutas[i])

banana
abacate
maçã
kiwi


O resultado final pode ser o mesmo, mas além de não ser a forma mais idiomática (ou pythonica), este tipo de estrutura consome mais processamento do interpretador do que o formato anterior.


<a id="pt2.3"></a>
## 2.3 Estruturas de repetição while

A estrutura de repetição `while` executa uma tarefa enquanto uma expressão booleana for verdadeira.


In [24]:
print("Números pares de 0 a 10 usando while")
a = 0
while a < 10:
    print(a)
    a += 2

Números pares de 0 a 10 usando while
0
2
4
6
8


Em qualquer tipo de laço, podemos quebrar a iteração a qualquer momento com o `break` ou então continuar para a próxima iteração (sem rodar o resto do comando que está dentro do laço) usando o `continue`.

In [25]:
frutas = ["banana", "abacate", "maçã", "kiwi"]
print("Frutas que eu gosto usando BREAK:", end=" ")
for fruta in frutas:
    if fruta is "abacate":
        break  # Quebra todas as proximas iterações
    print(fruta, end=" ")
    
    
    
print("\nFrutas que eu gosto usando CONTINUE:", end=" ")
for fruta in frutas:
    if fruta is "abacate":
        continue # Apenas acaba com a iteração atual, e passa para a próxima
    print(fruta, end=" ")

Frutas que eu gosto usando BREAK: banana 
Frutas que eu gosto usando CONTINUE: banana maçã kiwi 

<a id="pt3"></a>
## Parte 3: Estruturas de dados nativas
Existem diversos tipos/estruturas de dados que podem ser carregados a partir da biblioteca padrão. Aqui veremos as principais e mais úteis no dia a dia.

<a id="pt3.1"></a>
### 3.1: Strings
Strings em python são cadeias de caracteres e podem funcionar de forma parecida como vemos em listas. Então é possível acessar seu conteúdo pelo índice do caractere. Python é 0-indexado e valores negativos são lidos do final.

In [26]:
fruta = "BananA"
print(fruta[0])
print(fruta[-1])

B
A


Por conta disso, string são considerados containers, então podemos iterá-las

In [27]:
alfabeto_latino = "abcdefghijklmnopqrstuvwxyz"
for letra in alfabeto_latino:
    print(letra, end=" ")
    
# A função print pode receber outros argumentos modificando seu comportamento.
# o argumento `end` insica qual caractere será usado ao final de cada execução
# da função. O padrão é \n (quebra de linha).


a b c d e f g h i j k l m n o p q r s t u v w x y z 

Existem alguns métodos da classe string que são super úteis no dia a dia.
 - `str.split(separador)` : Transforma os elementos de uma string numa lista, separada pelo seu argumento "separador";
 - `str.lower()` ou `str.upper()` : Transformam todos os caracteres em caixa baixa ou alta;
 - `str.strip(r_string)` : Remove das bordas a string "r_string";
 - `str.rstrip` e `str.lstrip`: Igual a strip, mas só remove da borda direita ou esquerda;
 - `str.replace(remover, substituir)` : Substitui um caractere (ou cadeia) por outro;
 - `str.count(elem)` : Conta a quantidade de ocorrências de um elemento em uma string;
 - `str.find(string)` : Encontra o índice da primeira ocorrência (da esquerda para a direita) de uma string;
 - `str.join(container)` : "junta" cada elemento de container com o valor de str;
 - `len(str)` : Retorna o comprimento da string;


Mas existem diversos outros métodos que podem ser encontrados na [documentação oficial](https://docs.python.org/3/library/string.html).

In [28]:
lista_de_palavras = "p1 p2 p3 p4 p5 p6".split(" ")
print(lista_de_palavras)

print("lower case para upper case".upper())

print("inicio-->"+ "   Remover  os espaços em branco das bordas  ".strip(" ") + "<--fim")

print("string de espaços para underline".replace(" ", "_"))

print("A quantidade de 'ta' dentro de batata: ", "batata".count('ta'))

print("A posião da primeira ocorrência de 'a' dentro de 'farofa': ", "farofa".find("a"))

print("_".join(lista_de_palavras))

# Cada um dos métodos podem ser utiliados aninhados.
# strip sem argumento remove espaço, quebra de linha e tabs das bordas
print("\t   P1 P2 P3 P4 P5 P6   \n".lower().strip().replace(" ", "_") )

['p1', 'p2', 'p3', 'p4', 'p5', 'p6']
LOWER CASE PARA UPPER CASE
inicio-->Remover  os espaços em branco das bordas<--fim
string_de_espaços_para_underline
A quantidade de 'ta' dentro de batata:  2
A posião da primeira ocorrência de 'a' dentro de 'farofa':  1
p1_p2_p3_p4_p5_p6
p1_p2_p3_p4_p5_p6


Podemos selecionar fatias da lista para podermos trabalhar com uma amostra delimitada. A sintaxe é algo como:
```py
str[i:h]
```
Retorna uma str com os elementos do índice `i`(incluso) até `h`(excluso). Se `i` é omitido, por padrão será zero (do começo). Se `h` é omitido, o padrão será o comprimento da lista (até o final).

In [29]:
alfabeto_latino = "abcdefghijklmnopqrstuvwxyz"

n = alfabeto_latino[1:]   # Todos os elementos de 'alfabeto_latino' do indice 1 até o ultimo
m = alfabeto_latino[:5]   # Todos os elementos de 'alfabeto_latino' do começo até o indice 5

s = alfabeto_latino[:]    # Operador do slice sem argumentos retorna a string inteira
k = alfabeto_latino[:-2]  # Os elementos do começo até o penúltimo (excluso)
r = alfabeto_latino[-5:]  # Os 5 últimos elementos

print(f"""
    String original:
    {alfabeto_latino}
    
    Elementos de 'alfabeto_latino' do indice 1 até o ultimo:
    {n}
    
    Elementos de 'alfabeto_latino' do começo até o indice 5:
    {m}

    Operador do slice sem argumentos retorna a string inteira:
    {s}
    
    Os elementos do começo até o penúltimo (excluso):
    {k}
    
    Os 5 últimos elementos:
    {r}
    """)


    String original:
    abcdefghijklmnopqrstuvwxyz
    
    Elementos de 'alfabeto_latino' do indice 1 até o ultimo:
    bcdefghijklmnopqrstuvwxyz
    
    Elementos de 'alfabeto_latino' do começo até o indice 5:
    abcde

    Operador do slice sem argumentos retorna a string inteira:
    abcdefghijklmnopqrstuvwxyz
    
    Os elementos do começo até o penúltimo (excluso):
    abcdefghijklmnopqrstuvwx
    
    Os 5 últimos elementos:
    vwxyz
    


<a id="pt3.2"></a>
### 3.2: Listas e Tuplas

Quando é desejado criar uma estrutura de dados que guarde diversos itens, costumamos usar listas em python. A vantagem desta estrutura de dados é que seus elementos são guardados na ordem que são inseridos, não tem tamanho fixo (enquanto for inserido elementos, ela vai crescendo automaticamente) e ela não precisa ser homogênea em seus elementos (ainda que isto seja desejável).

Nos exemplos anteriores, já usamos listas, como a de frutas.
```py
frutas = ["banana", "abacate", "maçã", "kiwi"]
```
Tuplas são muito parecidas com listas, porém, imutáveis; então não podemos adicionar, remover ou alterar seus elementos. A sintaxe da tupla é delimitada por parênteses.
```py
uma_tupla = ("banana", "abacate", "maçã", "kiwi")
```

A sintaxe das listas é bem simples e se resume a utilizar os colchetes, separando os elementos por vírgula. Também é possível criar uma lista chamando o construtor do objeto.
```py
frutas = list() # Inicializando uma lista vazia
```
A utilização do construtor costuma ser útil quando queremos converter um outro tipo de container numa lista. Veja o próximo exemplo.

In [30]:
print(list("abcdefghijklmnopqrstuvwxyz"))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']


Existem diversos métodos para se trabalhar com listas, os principais são:

 - `list.append(var)`: Adiciona na lista um elemento "var"
 - `list.pop(i)`: Remove (e retorna) o elemento de índice "i" da lista. Se o índice for omitido, remove o mais a direita
 - `list.extend(iter)`: Estende os elementos da lista pelos elementos de um objeto iterável "iter"
 - `list.remove(var)`: Remove o primeiro item de valor "var" da lista. Retorna erro se não encontrar.
 - `list.insert(i, var)`: Insere o elemento "var" na posição "i" (Se existir elemento nesta posição, todos os próximos são deslocados 1 posição para frente)
 - `list.index(var)`: Retorna o índice do primeiro elemento de valor "var"
 - `list.count(var)`: Retorna a quantidade de vezes que "var" aparece na lista
 - `list.sort(key=f, reverse=False)`: Ordena a lista. "Key" é um argumento que pode ser passada uma função "f" para indicar como a lista será ordenada. "reverse" indica como será ordenado.
 - `len(list)`: Retorna o comprimento da lista "list". As listas não possuem um método/atributo que indique seu comprimento. Precisamos usar uma função externa à classe que faça isso.
 
Mais detalhes sobre métodos de listas na [documentação oficial](https://docs.python.org/3/library/stdtypes.html#list)

In [31]:
frutas = ["banana", "abacate", "maçã", "kiwi"]
frutas.append("Pêra") # Adiciona Pêra no final da lista
frutas.pop()          # Remove o ultimo elemento da lista
frutas.sort()         # Quando key omitido, ordena alfabeticamente
print(frutas)

['abacate', 'banana', 'kiwi', 'maçã']


In [32]:
lista_maluca = [1, 2, "string", [3, 10], "a", 3.0, 1.0E-23]
print(lista_maluca)

[1, 2, 'string', [3, 10], 'a', 3.0, 1e-23]


Note que podemos fazer uma lista com elementos distintos, cada um de um tipo que não temos nenhum erro. Mas, este tipo de comportamento deve ser evitado pois comportamentos inesperados podem ocorrer, veja o exemplo:

In [33]:
numeros = [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
letras  = ['a', 'n', 'b', 'i', 'r', 'c', 'c']

numeros.sort() # Ordenou os numeros corretamene
letras.sort()  # Ordenou as letras corretamene

print(numeros)
print(letras) 

numeros_e_letras = [5, 10, -1, 0, 'b', 'i', 'r']
numeros_e_letras.sort()
print(numeros_e_letras)

[-1, 0, 0, 0.1, 1, 2, 3, 5, 8, 9, 10]
['a', 'b', 'c', 'c', 'i', 'n', 'r']


TypeError: '<' not supported between instances of 'str' and 'int'

Isto ocorre pois o operador `<` não possui uma implementação que consegue lidar com estes tipos de dados. Mas, podemos implementar nossa própria função de comparação que faz este trabalho. Suponha que queremos ordenar esta lista, mas as strings serão avaliadas pelo seu código ASCII, que é um inteiro.

In [34]:
def compara(x):
    if isinstance(x, str): # Retorna True se 'x' for um objeto da classe 'str'
        return ord(x)
        
    return x 

numeros_e_letras = [5, 10000, -1, 0, 'b', 'i', 'r', 'a']
numeros_e_letras.sort(key=compara)
numeros_e_letras

[-1, 0, 5, 'a', 'b', 'i', 'r', 10000]

Mas, ainda que agora temos um comportamento bem definido, não é boa prática misturar tipos distintos em listas, a não ser que o objetivo seja muito bem definido e faça sentido.

Listas são estruturas que podem ser acessadas por índice de forma explícita.
```py
numeros = [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
numero = numeros[2]
```
`numero` receberia o elemento 9, que está na posição de índice 2 da lista. É possível acessar elementos de trás pra frente com índices negativos.

In [35]:
numeros = [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
numero1 = numeros[-1]
numero2 = numeros[-6]

print(numero1, numero2)

0 5


Podemos retirar fatias de strings exatamente da mesma forma como fizemos com strings:

In [36]:
numeros = [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]

n = numeros[1:]   # Todos os elementos de 'numeros' do indice 1 até o ultimo
m = numeros[:5]   # Todos os elementos de 'numeros' do começo até o indice 5

s = numeros[:]    # Operador do slice sem argumentos retorna a lista inteira
k = numeros[:-2]  # Os elementos do começo até o penúltimo (excluso)
r = numeros[-5:]  # Os 5 últimos elementos

print(f"""
    Lista original:
    {numeros}
    
    Elementos de 'numeros' do indice 1 até o ultimo:
    {n}
    
    Elementos de 'numeros' do começo até o indice 5:
    {m}

    Operador do slice sem argumentos retorna a lista inteira:
    {s}
    
    Os elementos do começo até o penúltimo (excluso):
    {k}
    
    Os 5 últimos elementos:
    {r}
    """)


    Lista original:
    [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
    
    Elementos de 'numeros' do indice 1 até o ultimo:
    [2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
    
    Elementos de 'numeros' do começo até o indice 5:
    [1, 2, 9, 3, 8]

    Operador do slice sem argumentos retorna a lista inteira:
    [1, 2, 9, 3, 8, 5, 10, -1, 0, 0.1, 0]
    
    Os elementos do começo até o penúltimo (excluso):
    [1, 2, 9, 3, 8, 5, 10, -1, 0]
    
    Os 5 últimos elementos:
    [10, -1, 0, 0.1, 0]
    


Para verificar se algum elemento está na lista, podemos usar o operador `in` num `if`. Porém, tome cuidado pois esta operação é linear na quantidade de elementos da lista.

In [37]:
frutas = ["banana", "abacate", "maçã", "kiwi"]
if "banana" in frutas:
    print("Banana está em frutas")

Banana está em frutas


<a id="pt3.3"></a>
### 3.3: Conjuntos

Conjuntos em python são containers e seguem a mesma filosofia dos conjuntos na matemática. Uma estrutura que possui apenas elementos distintos, finitos e sem ordem estabelecida. A utilidade destas restrições é que podemos utilizar uma tabela *hash* para guardar os elementos, e portanto, a consulta é constante. A sintaxe de um conjunto (set) é delimitada pelas chaves.

```py
conjunto = {1, 2, 3, 4, 5, "banana"}
conjunto2 = set() # Instancia um conjunto vazio usando o construtor.
```

Cresce dinamicamente conforme o necessário e pode conter qualquer tipo (embora não seja boa prática). Como os elementos não possuem ordem, não conseguimos acessar seus elementos por índice, apenas iterá-los.

In [38]:
conjunto = {1, 2, 3, 4, 5, "banana"}
for elemento in conjunto:
    print(elemento)

1
2
3
4
5
banana


Existem diversos métodos para usar conjuntos, os principais são:
 - `set.add(var)` : Adiciona o elemento 'var' no conjunto
 - `set.remove(var)` : Remove do conjunto o elemento de valor 'var'
 - `set.pop()` : Remove um elemento arbitrário do conjunto, ou uma exception se vazio.
 - `set.union(set2)` : Retorna um conjunto novo com a união de 'set' com 'set2'
 - `set.intersection(set2)` : Retorna um novo conjunto com a intersecção de 'set' e 'set2'
 - `set.difference(set2)` : Retorna um novo conjunto com os elementos de set que não estão em 'set2'
 - `set.symmetric_difference(set2)` : Retorna um novo conjunto com os elementos que estão em um dos dois conjuntos, mas não em ambos.
 
- `set.isdisjoint(set2)` : Retorna True se set não possui elementos em comum com 'set2' (se são disjuntos)
- `set.issubset(set2)` : True se TODOS os elementos de 'set' estão em 'set2'
- `set.issuperset(set2)` : True se TODOS os elementos de 'set2' estão em 'set'

Mais informações sobre sets na [documentação oficial](https://docs.python.org/3/library/stdtypes.html#set)

Pertinência em conjuntos segue a mesma ideia dos outros exemplos abordados acima utilizando o `in`


In [39]:
conjunto = {1, 2, 3, 4, 5, "banana"}
if "banana" in conjunto:
    print("Banana está no conjunto")

Banana está no conjunto


In [40]:
import time

conjunto_enorme = set()
lista_enorme = list()

for x in range(10_000_000):
    conjunto_enorme.add(f"aaa{x}")
    lista_enorme.append(f"aaa{x}")

t0 = time.time()
if "aaa5649995" in conjunto_enorme:
    print("Encontrei no conjunto")
    
t1 = time.time()
print(f"Tempo usando sets em {(t1 - t0) * 1000} s")


t0 = time.time()
if "aaa5649995" in lista_enorme:
    print("\nEncontrei na lista")
    
t1 = time.time()
print(f"Tempo usando lists {(t1 - t0) * 1000} s")

Encontrei no conjunto
Tempo usando sets em 0.11205673217773438 s

Encontrei na lista
Tempo usando lists 68.58110427856445 s


Performance em buscas $O(1)$ comparados com $O(n)$ nas listas é o principal motivo que torna os sets tão úteis.

Inserir elementos iguais não duplica valores, e a função para o cálculo das chaves é a `hash()`. O interpretador assumirá que valores com o mesmo retorno da função hash são iguais, então fique atento.


In [41]:
hash("batata")

-8310370370016646700

<a id="pt3.4"></a>
### 3.4 Dicionários

Dicionário é uma estrutura de dado que mapeia uma chave à um valor. É parecido com lista, mas que podemos usar **_qualquer coisa_** (que podemos calcular sua hash) como índice, portanto a busca por uma chave é $O(1)$.

Imagine que queremos mapear os conceito dos alunos de PLN aos seus nomes:
 - Joao : A
 - Beatriz : A
 - Ricardo : A
 - Ana : A

*só tem aluno/a inteligente e esforçado/a*

A melhor estrutura de dados que podemos usar para representar este tipo de informação são os Dicionários.

A sintaxe para a instanciar o objeto é
```py
dicionario = dict()
```

Também é possível criar um dicionário utilizando esta notação mais concisa

```py
alunos_notas = {
    "Joao"    : "A",
    "Beatriz" : "A",
    "Ricardo" : "A",
    "Ana"     : "A"
    }
```

Para inserir elementos num dicionário já existente, basta atribuir um valor à uma chave:
```py
dicionario[chave] = valor
```

Alguns métodos que podem ser úteis:
 - `dict.values()` : Retorna uma *view* 'dict_values' com todos os valores de 'dict'
 - `dict.keys()` : Retorna uma *view* 'dict_keys' com todas as chaves de 'dict'
 - `dict.items()` :  Retorna uma *view* 'dict_items' com todas as `chave:valor` de 'dict'
 - `dict.pop(key)` : Remove o par `chave:valor` de chave 'key'
 - `dict.update(dict2)` : Atualiza os pares `chave:valor` de 'dict' com 'dict2'
 
Mais métodos na [documentação oficial](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict)

Uma *view* representa as referências para aqueles valores, então quando o objeto origem muda, a *view* muda também.


In [42]:
alunos_notas = dict()
alunos_notas['Joao'] = 'A'
alunos_notas['Beatriz'] = 'A'
alunos_notas['Ricardo'] = 'A'
alunos_notas['Ana'] = 'A'

notas1 = alunos_notas.items()
print(notas1)

alunos_notas['Joao'] = 'F' # Infelizmente, descobriu-se que Joao colou na prova

print(notas1) # A view muda junto com o dicionario de origem

dict_items([('Joao', 'A'), ('Beatriz', 'A'), ('Ricardo', 'A'), ('Ana', 'A')])
dict_items([('Joao', 'F'), ('Beatriz', 'A'), ('Ricardo', 'A'), ('Ana', 'A')])


In [43]:
alunos_notas = {
    "Joao"    : "A",
    "Beatriz" : "A",
    "Ricardo" : "A",
    "Ana"     : "A"
    }
print(alunos_notas)

{'Joao': 'A', 'Beatriz': 'A', 'Ricardo': 'A', 'Ana': 'A'}


Como dicionários são containers, podemos iterá-los

In [44]:
# Iterar sobre o dicionario em si, é iterar sobre as chaves
print("Alunos com o dicionario:", end='\t')
for aluno in alunos_notas:
    print(aluno, end='\t')

    
print("\nTodos os alunos com a view:", end='\t')
for aluno in alunos_notas.keys():
    print(aluno, end='\t')
    

print("\nTodas as notas com a view:", end='\t')
for aluno in alunos_notas.values():
    print(aluno, end='\t')
    

print("\n\nTodos os pares aluno:nota com a view:")
for aluno, nota in alunos_notas.items():
    print(f"{aluno} : {nota}")

Alunos com o dicionario:	Joao	Beatriz	Ricardo	Ana	
Todos os alunos com a view:	Joao	Beatriz	Ricardo	Ana	
Todas as notas com a view:	A	A	A	A	

Todos os pares aluno:nota com a view:
Joao : A
Beatriz : A
Ricardo : A
Ana : A


Pertinência em dicionários ocorre com base nas chaves, então:

In [45]:
if "Beatriz" in alunos_notas:
    print("Beatriz está na turma")

Beatriz está na turma


funciona como o esperado.

Recuperar um valor sabendo sua chave pode ser feito da seguinte forma:

In [46]:
alunos_notas['Beatriz']

'A'

<a id="pt3.4"></a>
### 3.5 Matrizes

Matrizes em Python (do ponto de vista inicial que este tutorial aborda) se resume a listas dentro de listas. Isto quer dizer que não é possível declarar uma estrutura já com o tamanho bem definido, temos que construir as linhas e colunas "na mão". 


In [47]:
matriz = []
qtd_de_linhas = 10

for i in range(qtd_de_linhas):
    matriz.append([])
    
print(f"A matriz vazia {matriz}")

A matriz vazia [[], [], [], [], [], [], [], [], [], []]


In [48]:
matriz = []
qtd_de_linhas = 10
qtd_colunas = 10

for i_linha in range(qtd_de_linhas):
    linha = []
    for j_coluna in range(qtd_colunas):
        linha.append(i_linha+j_coluna)
        
    matriz.append(linha)
    
print(matriz)

[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [2, 3, 4, 5, 6, 7, 8, 9, 10, 11], [3, 4, 5, 6, 7, 8, 9, 10, 11, 12], [4, 5, 6, 7, 8, 9, 10, 11, 12, 13], [5, 6, 7, 8, 9, 10, 11, 12, 13, 14], [6, 7, 8, 9, 10, 11, 12, 13, 14, 15], [7, 8, 9, 10, 11, 12, 13, 14, 15, 16], [8, 9, 10, 11, 12, 13, 14, 15, 16, 17], [9, 10, 11, 12, 13, 14, 15, 16, 17, 18]]


<a id='pt4'></a>
## 4 Dicas e truques

<a id='pt4.1'></a>
### 4.1 Operador unpack
Este operador nos permite "desempacotar" algumas estruturas de dados para trabalharmos melhor com seus valores de forma individual, e é denotado pelo caractere `*`.
Com ele, é possível transformar todos os elementos de uma lista em valores separados para utilizar no `print`, por exemplo.
Veja como podemos imprimir esta lista de uma forma um pouco mais bonita

In [49]:
letras = ['a', 'b', 'c', 'd']
print(*letras, sep=" - ") # Lembrando que sep é o caractere usado para separar cada elemento printado
# É equivalente a
print('a', 'b', 'c', 'd', sep=' - ') # Por baixo dos panos, o que o interpretador faz é isso

a - b - c - d
a - b - c - d


A matriz que fizemos no capítulo anterior pode ser printada de uma forma mais elegante usando o unpack 

In [50]:
print(*matriz, sep='\n')

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
[3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
[4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
[5, 6, 7, 8, 9, 10, 11, 12, 13, 14]
[6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
[7, 8, 9, 10, 11, 12, 13, 14, 15, 16]
[8, 9, 10, 11, 12, 13, 14, 15, 16, 17]
[9, 10, 11, 12, 13, 14, 15, 16, 17, 18]


<a id='pt4.2'></a>
### 4.2 List comprehension

Sempre que queremos construir uma lista, precisamos percorrer, de alguma forma, uma quantidade de elementos para incluí-los na lista original.

In [51]:
numeros_pares = []
for numero in range(10):
    if numero % 2 == 0:
        numeros_pares.append(numero)
        
print(numeros_pares)

[0, 2, 4, 6, 8]


Mas, em python existe uma forma mais concisa de se fazer isso, e chamamos de de *list comprehension*, e esta é a sintaxe:
```py
[comando for v_laço in container if expressão_booleana]
```

In [52]:
numeros_pares = [numero for numero in range(10) if numero % 2 == 0]
print(numeros_pares)

[0, 2, 4, 6, 8]


Também podemos fazer coisas mais elaboradas

In [53]:
def normalize(x):
    return x.strip().upper().replace(" ", "_")

texto = """
A capivara (nome científico: Hydrochoerus hydrochaeris) é uma espécie de mamífero 
roedor da família Caviidae e subfamília Hydrochoerinae. Alguns autores consideram
que deva ser classificada em uma família própria. Está incluída no mesmo grupo de
roedores ao qual se classificam as pacas, cutias, os preás e o porquinho-da-índia.
Ocorre por toda a América do Sul ao leste dos Andes em habitats associados a rios,
lagos e pântanos, do nível do mar até 1 300 m de altitude. Extremamente adaptável,
pode ocorrer em ambientes altamente alterados pelo ser humano."""

lista_de_frases = [normalize(linha) for linha in texto.split('\n')]

print(*lista_de_frases, sep="\n")


A_CAPIVARA_(NOME_CIENTÍFICO:_HYDROCHOERUS_HYDROCHAERIS)_É_UMA_ESPÉCIE_DE_MAMÍFERO
ROEDOR_DA_FAMÍLIA_CAVIIDAE_E_SUBFAMÍLIA_HYDROCHOERINAE._ALGUNS_AUTORES_CONSIDERAM
QUE_DEVA_SER_CLASSIFICADA_EM_UMA_FAMÍLIA_PRÓPRIA._ESTÁ_INCLUÍDA_NO_MESMO_GRUPO_DE
ROEDORES_AO_QUAL_SE_CLASSIFICAM_AS_PACAS,_CUTIAS,_OS_PREÁS_E_O_PORQUINHO-DA-ÍNDIA.
OCORRE_POR_TODA_A_AMÉRICA_DO_SUL_AO_LESTE_DOS_ANDES_EM_HABITATS_ASSOCIADOS_A_RIOS,
LAGOS_E_PÂNTANOS,_DO_NÍVEL_DO_MAR_ATÉ_1_300_M_DE_ALTITUDE._EXTREMAMENTE_ADAPTÁVEL,
PODE_OCORRER_EM_AMBIENTES_ALTAMENTE_ALTERADOS_PELO_SER_HUMANO.


Também podemos fazer set comprehension e dict comprehensions, mas neste caso usamos as chaves no lugar dos colchetes.

In [54]:
set_c = {x for x in range(10) if x % 2}
print(set_c)


{1, 3, 5, 7, 9}


In [55]:
alunos = ["Luiza", "Carlos", "Eduardo", "Clotilde"] # Mais alunos de PLN
alunos_notas = {aluno:'A' for aluno in alunos}
print(alunos_notas)

{'Luiza': 'A', 'Carlos': 'A', 'Eduardo': 'A', 'Clotilde': 'A'}
