# Introdução

Este tutorial tem como principal objetivo ser um primeiro contato para quem nunca programou em Python, mas já tem noções de como programar. Os exemplos serão simples e não esperamos que você saia daqui sabendo *algoritmos* de forma aprofundada, a ideia é apresentar de forma simples a sintaxe da linguagem.


***
## Lista de conteúdos:
- [1 - Estruturas básicas da linguagem](#pt1)
 - [1.1 - Variáveis, expressões, comandos e operadores](#pt1.1)
 - [1.2 - Funções](#pt1.2)

- [2 - Controle de fluxo](#pt2)
  - [2.1 - Estrutura de seleção](#pt2.1)
  - [2.2 - Estruturas de repetição for](#pt2.2)
  - [2.3 - Estruturas de repetição while](#pt2.3)
  
- [3 - Estruturas de dados nativas](#pt3)
  - [3.1 - Stings](#pt3.1)
  - [3.2 - Listas](#pt3.2)
  - [3.3 - Conjuntos](#pt3.3)
  - [3.4 - Dicionários](#pt3.4)
***

## Motivação

Os trabalhos relacionados com processamento de linguagem natural (PLN) envolvem, em essência, strings e matrizes. Estes tipos de estruturas de dados podem ser encontradas em qualquer linguagem de programação moderna, mas, nem todas permitem uma interface amigável com o programador; qualquer pessoa que já precisou processar strings em C já percebeu que não é uma tarefa tão fácil, ainda que o resultado seja executado de forma bem rápida. Em Python, o interpretador toma conta de vários detalhes em nome do programador para que ele não precise se preocupar com minúcias ao longo do desenvolvimento do algoritmo. Este tipo de comportamento em *run-time* acaba consumindo um certo processamento da máquina, tornando sua execução mais lenta, entretanto, o objetivo das aulas reside no entendimento da matéria e não na criação de processos super eficientes e escaláveis. Portanto, nossos exemplos não serão grandes o suficiente para que a performance da linguagem seja algo que precise ser levada em conta.


### Um pouco sobre Python
Python é uma linguagem de programação alto nível, interpretada, de propósito geral e multi-paradigma criada por Guido van Rossum sendo lançada em 1991. É dinamicamente tipada, os blocos são indicados por espaços em branco (“*tabs*”), ao invés de chaves e possui uma sintaxe simples de ser utilizada. Os valores são passados por referência nas funções e é majoritariamente orientado a objetos.


### Um pouco sobre o Jupyter
O Jupyter é um programa derivado do IPython que pode ser utilizado para programar em Python, te possibilitando escrever código junto com textos no mesmo arquivo, organizando o fluxo de ideias ao longo do documento. O nome Jupyter é uma referência das 3 principais linguagens que ele suporta, [**Ju**lia](https://julialang.org/), **pyt**hon e **R**


## Instalação do ambiente
Se voçẽ usa Windows, é recomendado instalar alguma distribuição linux em *dualboot* ou máquina virtual para cumprir as atividades da disciplina. Mas, existe a possibilidade de instalar o Anaconda no windows para usar o jupyter.

Em Linux, o python já vem instalado pois várias coisas do SO utilizam esta linguagem, e nada precisa ser feito. Para instalar o Jupyter, basta usar seu gerenciador de pacotes para carregar o necessário. O nome do pacote costuma ser jupyter-notebook, então se você rodar num terminal algo como: “sudo apt install jupyter-notebook” para derivados do Debian, deveria funcionar. O mesmo para derivados do Arch, Fedora, dentre outros, apenas trocando pelo gerenciador de pacotes específico.

Assim que você conseguir instalar o Jupyter no seu computador, pode clonar este repositório no seu ambiente local para ter todos os arquivos à mão. a execução do Jupyter é simples, basta rodar "jupyter-notebook" num terminal que uma aba será aberta no seu navegador padrão; então navegue onde o repositório está clonado (ou onde você quer criar os arquivos das atividades) e abra/crie os arquivos com a extensão ipynb.


### Utilização do Jupyter
O Jupyter te permite, dentre inúmeras outras coisas, criar células de texto que podem ser interpretadas como [Markdown](https://pt.wikipedia.org/wiki/Markdown) (como esta celula, por exemplo) um tipo de linguagem de marcação que possibilita a formatação simples de texto com alguns tokens, assim como LaTeX e HTML. Se este notebook estiver aberto no seu jupyter local, dê dois cliques nesta célula e veja como a formatação em Markdow funciona.

O outro tipo de célula que pode ser utilizada, são as de código, onde programas em python são escritos e o Kernel do Jpupyter consegue executar e te entregar o resultado do programa na tela.

 - Para **editar** uma célula, basta dar dois cliques em qualquer lugar dentro de sua região
 - Para **executar** uma célula, basta utilizar o atalho `Ctrl + Enter` com a célula desejada em foco.
 
O Jupyter possui um comportamento parecido com o [Vim](https://pt.wikipedia.org/wiki/Vim), com um modo "normal" e outro de "edição". Se estiver no modo normal, é possível navegar com as setas -hjkl não funcionam- e para começar a editar é só apertar `Enter` com a célula em foco (a célula em foco no modo normal fica com a linha
<font color="blue">azul</font> e no modo de edição <font color="green">verde</font>). Para sair do modo de edição, basta apertar `Esc`. No modo normal, os comandos mais úteis são:
 - Adicionar célula acima(above): `A`
 - Adicionar célula abaixo(below): `B`
 - Remover uma célula: `X`
 - Transformar a célula para markdow: `M`
 - Transformar a célula para código: `Y`
 
Um detalhe particularmente curioso sobre o Jupyter é que cada vez que uma célula de código é executada, todo seu conteúdo é armazenado num buffer. Então todas as variáveis iniciadas numa celula podem ser acessadas por uma outra célula que foi executada depois.


***

<a id="pt1"></a>

# Parte 1: Estruturas básicas da linguagem


<a id="pt1.1"></a>
## 1.1 Variáveis, expressões , comandos e operadores
   
Em qualquer linguagem [Turing completa](https://pt.wikipedia.org/wiki/Turing_completude), algum tipo de estrutura que guarde informação se faz necessária, e, em python, estas são as *variáveis*. Como a linguagem é dinamicamente tipada, não existe a necessidade de declarar variáveis com um tipo já determinado, já que elas podem mudar o conteúdo a qualquer momento.

In [6]:
variavel_qualquer = "Batata"
print(variavel_qualquer)

variavel_qualquer = 1
print(variavel_qualquer)

variavel_qualquer = 0.5
print(variavel_qualquer)

variavel_qualquer = ["Batata-frita", "Batata-corada"]
print(variavel_qualquer)

variavel_qualquer = 1.5E10

print(variavel_qualquer)
print("O tipo da variavel_qualquer é: ", type(variavel_qualquer))

Batata
1
0.5
['Batata-frita', 'Batata-corada']
15000000000.0
O tipo da variavel_qualquer é:  <class 'float'>


No exemplo a cima, `variavel_qualquer` recebeu diversos tipos de dados diferentes ao longo da execução e em nenhum momento o interpretador reclamou que você estava misturando tipos diferentes na mesma ariável. 

Ainda que seja permitido este tipo de comportamento, não é bem visto misturar tipos diferentes numa mesma variável, pois o código acaba ficando semanticamente confuso. Uma pessoa (inclusive você no futuro) pode acabar se confundindo sobre o que está sendo operado naquela linha.

A função utilizada na ultima linha, `type()`, recebe como argumento uma variável ou expressão e te retorna o tipo da váriavel ou do resultado da expressão.
    
Uma **expressão** é uma combinação de operadores, valores e variáveis que pode ser avaliado pelo interpretador. O exemplo abaixo mostra como uma expressão pode ser construída.

In [14]:
1 + 2

3

Python suporta diversos tipos de **operadores** e existe sobrecarga de operador com comportamentos diferentes dependendo do tipo de dado que está sendo utilizado. Este é um dos argumentos que sustenta o acordo de não mudar o tipo de uma variável ao longo da execução. Os principais são:

In [26]:
print("Soma simples: ", 1+2)
print("Mubtração simples: ", 1-2)
print("Multiplicação simples: ", 3*4)
print("Divisão inteira: ", 10//3)
print("Divisão em ponto flutuante: ", 10/3) # A precisão padrão do ponto flutuamte é 15 casas decimais
print("Resto da divisão inteira: ", 10%3)
print("Potencia: ", 2**10)
print("Raíz usando potencia: ", 1024**0.5) # Neste caso, raíz quadrada

# Os mesmos iperadores também podem ser usados cou outros tipos de dados,
# por isso, cuidado
print("\nSoma de uma string" + " com outra")
print("Multiplicação com string " * 4)
print(4 * "Multiplicação com string ")

Soma simples:  3
Mubtração simples:  -1
Multiplicação simples:  12
Divisão inteira:  3
Divisão em ponto flutuante:  3.3333333333333335
Resto da divisão inteira:  1
Potencia:  1024
Raíz usando potencia:  32.0

Soma de uma string com outra
Multiplicação com string Multiplicação com string Multiplicação com string Multiplicação com string 
Multiplicação com string Multiplicação com string Multiplicação com string Multiplicação com string 


Um **comando** é uma instrução enviada ao interpretador para que ele execute algum tipo de atividade específica. Exemplos de comando podem ser a função `print()`, que utilizamos anteriormente, e atribuições. Comandos podem ou não retornar retornar informações, e cabe ao programador/a decidir o que fazer em cada um dos casos. 

In [19]:
# O print é um comando
print("Isto é um comando!")

# Atribuição também é um comando
variavel = "Este é outro comando que não indica ao usuário que foi executado"

Isto é um comando!


Sempre que queremos imprimir algo na tela, precisamos utilizar a função `print`; que recebe uma variável, valor ou expressão como argumento. A função recebe zero ou mais elementos separados por vírgula, e imprime cada um deles com uma espaço entre cada e termina a frase com uma quebra de linha.

Existem caracteres reservados que são utilizados para a formatação da saída nos prints e não são mostrados na tela, o `\n` quebra a linha enquanto o `\t` é a tabulação.

In [24]:
print("Primeira string", "e segunda string", "todas na primeira linha")
print()  # apenas imprime uma linha em branco
print("Quarta string que está na terceira linha impressa")
print("Exemplo de print com uma expressão:\nO resultado de 1+2 é: ", 1+2)

Primeira string e seguda string todas na primeira linha

Quarta string que está na terceira linha impressa
Exemplo de print com uma expressão:
O resultado de 1+2 é:  3


<a id="pt1.2"></a>
## 1.2 Funções

No contexto de programação, função é uma sequência nomeada de instruções ou comandos, que realizam uma operação desejada. Esta operação é especificada numa definição de função. Existe, as funções nativas da linguagem que já estão implementadas e podemos apenas utiliza-las. Até o momento já vimos duas, a `type` que retorna o tipo de seu argumento e a `print` que imprime na tela, entretanto existem diversas outras. 

Uma tarefa comum ao longo da programação é a conversão de diferentes tipos, quando um operador tem comportamentos distintos dependendo do que se é operado. Suponha que você deseja concatenar uma string *A* com um número inteiro *B*. O operador da concatenação em strings é o `+`, que também é usado para adição aritimética, e por isso não podemos executar a concatenação logo de cara senão obtemos um erro:

In [10]:
A = "Uma string que vai anteceder um inteiro: "
B = 1
print(A+B)

TypeError: can only concatenate str (not "int") to str

É necessário converter a variável `B` para string antes de concatenar as duas no print

In [30]:
B_str = str(B)
print(A+B_str)

Uma string que vai receber um inteiro: 1


Nestes casos em que o propósito é montar strings a partir de valores de variáveis, pode ser chato ter que ficar convertendo tudo para string no momento de concatenar, e, por isso, na versão 3.6 do python foi introduzido uma funcionalidade chamada de *f-strings*, uma forma de criar strings "formatadas" incluindo código dentro da definição das aspas. A sintaxe é simples, antes da primeira aspa, é necessário ter um `f` e dentro da string, tudo que estiver entre chaves será interpretado como uma expressão.

In [15]:
print(f"Posso colocar um texto aqui e antes do que queríamos -> {A}{B}")
print(f"A soma de 1 e 3 é {1+3}")

frutas = ["banana", "abacate", "maçã", "kiwi"]
print(f"Minhas frutas favoritas são {', '.join(frutas)}")  # Vamos falar melhor sobre o join em listas

Posso colocar um texto aqui e antes do que queríamos -> Uma string que vai anteceder um inteiro: 1
A soma de 1 e 3 é 4
Minhas frutas favoritas são banana, abacate, maçã, kiwi


Ainda sobre funções de conversão de tipos, temos a `float` e `int`

In [45]:
print("string para int:   ", int("123"))
print("string para float: ", float("3.14"))
print("float para int:    ", int(5.1))
print("int para float:    ", float(6))

string para int:    123
string para float:  3.14
float para int:     5
int para float:     6.0


Se a conversão for entre elementos inválidos, o interpretador retornará um erro e não fará a conersão

In [46]:
print("string para int:   ", int("qualquer coisa que não da pra transformar em int"))

ValueError: invalid literal for int() with base 10: 'qualquer coisa que não da pra transformar em int'

Além das funções que já vem por padrão, é possível criar as nossas da forma como quisermos. A sintaxe base da assinatura das funções em python podem ser as seguintes:
```py
def f1(arg1, arg2):

def f2(arg1 = "", arg2 = 0):

def f3(arg1, arg2 = 0):
```
 - Quando queremos uma função chamada `f1` que recebe dois argumentos, `arg1` e `arg2`, que podem ser qualquer de qualquer tipo, já que python é dinâmicamente tipado.
 - A função `f2` também recebe dois argumentos, mas, desta vez, cada um deles possui um velor *default* associado a elas. Portanto, se na chamada da função não for passado seus argumentos, estes serão uma string vazia e zero.
 - A função `f3` Mistura elementos da função  `f1` e `f2`, tendo um de seus argumentos com um valor *default* e o outro não. Esta forma é válida, mas neste caso a ordem é importante.

```py
def f4(arg1 = 0, arg2):
```
A função `f4` retorna um erro, já que um argumento não-*default* não pode vir depois de um que possui.

In [3]:
def f4(arg1 = 0, arg2):
    return arg1 * arg2

f4(2)

SyntaxError: non-default argument follows default argument (<ipython-input-3-cfa39b0a4c95>, line 1)

Mas, um detalhe não pode passar desapercebido aqui: definir um valor *deault* no argumento da função não quer dizer que ele só poderá ser daquele tipo. O ponto é que este valor só será utilizado se na chamada ele for omitido.

In [9]:
def f1(arg1 = ""):
    return arg1

print("Chamada de f1 sem passar o argumento:      ", type( f1()   ))
print("Chamada de f1 passando int como argumento: ", type( f1(10) ))

Chamada de f1 sem passar o argumento:       <class 'str'>
Chamada de f1 passando int como argumento:  <class 'int'>


<a id="pt2"></a>
# Parte 2: Controle de fluxo

<a id="pt2.1"></a>
## 2.1 Estrutura de seleção

Estruturas de seleção, ou expressão condicional ou ainda construção condicional, é a forma como podemos decidir no *runtime* qual parte de código será executada dependendo do resultado de uma expressão booleana.

Em python, não é necessário incluir os parêntesis na sintaxe do `if`, mas se você se sente mais confortável o usando, fique a vontade.

In [34]:
frutas = ["banana", "abacate", "maçã", "kiwi"]

if "abacate" in frutas:
    print("Abacate é uma fruta!")
else:
    print("Abacate não é uma fruta")
    

    
if True:
    print("True é sempre verdadeiro, False não.")
    
    
    
if 826423 % 23 == 0:
    print("O resto da divisão inteira de 826423 por 23 é zero")
else:
    print("O resto da divisão inteira de 826423 por 23 não é zero")

Abacate é uma fruta!
True é sempre verdadeiro, False não.
O resto da divisão inteira de 826423 por 23 não é zero


Se você está acostumado a programar em C ou Java, deve ter visto que existe um tipo de dado chamado `Null` que serve para representar que uma determinada variavel "não tem um valor" associado a ela. Em python é o `None`.

Como o `None` tem a semântica de "não ser nada", podemos comparálo utilizando o sinal de igualdade ou desigualdade, mas a forma idiomática (como quem utiliza a linguagem prefere usar) é comparar usando o `is`

In [33]:
a = None
if a == None:
    print("é None com igual")
    
if a is None:
    print("é None com is")
    
if a is not None:
    print("não é None com is")
    

é None com igual
é None com is


A diferença entre o `==` e `is` é que o sinal de igualdade avalia se o **valor** sendo comparado é igual enquanto o `is` verifica se ambas as variáveis/valores são a mesma coisa, se elas se referem a mesma posição da memória.

In [25]:
A = [1, 2, 3]
B = [1, 2, 3]

if A == B: print("A == B")
if A is B: print("A is B")

print(id(A), id(B))

A == B
139692339835528 139692339105416


O segundo `if` não imprime nada na tela já que ambas as variáveis são diferentes (ainda que possuem o mesmo valor) pois elas ocupam posições de memória distintas. Podemos conferir isso olhando que o `id` de cada uma é distinto.

O que você esperaria como resposta se o seguinte código for executado?
```py
A = 10
B = 10

if A == B: print("A == B")
if A is B: print("A is B")
```
Levando em conta que todos os tipos de dados em python são objetos, é esperado que o comportamento seja igual do exemplo anterior, mas aqui ocorre uma peculiaridade da linguagem

In [31]:
A = 10
B = 10

if A == B: print("A == B")
if A is B: print("A is B")

print(id(A), id(B))

A == B
A is B
139692418450944 139692418450944


Tipos primitivos (inteiros, floats, strings e booleanos) são todos armazenados na mesma posição de memória e cada variável com este conteúdo possui a mesma referência (para economizar espaço). Qualquer outro tipo de objeto possui o comportamento usual.

Comparação de grandeza funciona de forma similar a C ou Java:

In [32]:
if 20 > 3: print("20 é maior que 3")

if 3 <= 20: print("3 é menor ou igual a 20")

20 é maior que 3
3 é menor ou igual a 20


Operadores lógicos $e$ e $ou$ são implementados com a *keyword* `and` e `or`. Para aninhar um outro `if` dentro do `else`, utilizamos a notação `elif`

In [5]:
a = 10

if a == 10 and a is 10:
    print(a)
    
elif a != 10 or a is not 10:
    print("A primeira expressão é falsa e a segunda verdadeira")
    
else:
    print("Todas as expressões foram falsas")
    

10


<a id="pt2.2"></a>
## 2.2 Estruturas de repetição for

Uma das estruturas de repetição mais utilizadas na linguagem é o `for` e podemos utilizá-lo de diferentes maneiras.

Qualquer *container* em python é iterável, ou seja, podemos colocá-lo direto no laço.

A sintaxe base é:
```py
for variavel_do_laço in container:
```

In [35]:
frutas = ["banana", "abacate", "maçã", "kiwi"]
for fruta in frutas:
    print(fruta)

banana
abacate
maçã
kiwi


Pode ser tentador programar como se estivesse utilizando a linguagem C, acessando cada elemento da lista pelo seu índice e imprimindo-o

In [36]:
for i in range(len(frutas)): # A função len() retorna o comprimeiro da lista
    print(frutas[i])

banana
abacate
maçã
kiwi


O resultado final pode ser o mesmo, mas além de não ser a forma mais idiomática (ou pythonica), este tipo de estrutura consome mais processamento do interpretador do que o formato anterior.

Sempre que for necessário iterar em cima de uma sequencia, temos que utilizar a função `range` que possui 3 argumentos:
```py
range(inicio, fim, passo)
```
Em que `inicio` é incluído e `fim` não.

In [39]:
print("Numeros pares de 0 a 10 usando for")
for i in range(0, 10, 2):
    print(i)

Numeros pares de 0 a 10
0
2
4
6
8


In [41]:
print("Numeros pares de 10 a 0 ao contrário")
for i in range(10, 0, -2):
    print(i)

Numeros pares de 10 a 0 ao contrário
10
8
6
4
2


<a id="pt2.3"></a>
## 2.3 Estruturas de repetição while

As estruturas de repetição `while` executam uma tarefa enquanto uma expressão booleana for verdadeira.

In [45]:
print("Números pares de 0 a 10 usando while")
a = 0
while a < 10:
    print(a)
    a += 2

Números pares de 0 a 10 usando while
0
2
4
6
8


<a id="pt3"></a>
## Parte 3: Estruturas de dados nativas
Existem diversos tipos/estruturas de dados que podem ser carregados a partir da biblioteca padrão. Aqui veremos as principais e mais úteis no dia a dia.

<a id="pt3.1"></a>
### 3.1: Strings
Strings em python são cadeias de caracteres e podem funcionar de forma parecida como vemos em listas. Então é possível acessar seu conteúdo pelo índice do caractere. Python é 0-indexado e valores negativos são lidos do final.

In [29]:
fruta = "BananA"
print(fruta[0])
print(fruta[-1])

B
A


Por conta disso, string são considerados contâiners, então podemos iterálas.

In [38]:
alfabeto_latino = "abcdefghijklmnopqrstuvwxyz"
for letra in alfabeto_latino:
    print(letra, end=" ")
    
# A função print pode receber outros argumentos modificando seu comportamento.
# o argumento `end` insica qual caractere será usado ao final de cada execução
# da função. O padrão é \n (quebra de linha).


a b c d e f g h i j k l m n o p q r s t u v w x y z 

Existem alguns métodos da classe string que são super úteis no dia a dia.
 - `str.split(separador)` : Transforma os elementos de uma string numa lista, separada pelo seu argumento "separador";
 - `str.lower()` ou `str.upper()` : Transformam todos os caracteres em caixa baixa ou alta;
 - `str.strip(r_string)` : Remove das bordas uma string a sequencia indicada por "r_string";
 - `str.rstrip` e `str.lstrip`: Igual a strip, mas só remove da borda direita ou esquerda;
 - `str.replace(remover, substituir)` : Substitui um caractere (ou cadeia) por outro;
 - `str.count(elem)` : Conta a quantidade de ocorrências de um elemento em uma string;
 - `str.find(string)` : Encontra o índice da primeira ocorrência (da esquerda para a direita) de uma string
 - `str.join(container)` : "junta" cada elemento de container com o valor de str


Mas existem diversos outros métodos que podem ser encontrados na [documentação oficial](https://docs.python.org/3/library/string.html)

In [71]:
lista_de_palavras = "p1 p2 p3 p4 p5 p6".split(" ")
print(lista_de_palavras)

print("lower case para upper case".upper())

print("inicio-->"+ "   Remover  os espaços em branco das bordas  ".strip(" ") + "<--fim")

print("string de espaços para underline".replace(" ", "_"))

print("A quantidade de 'ta' dentro de batata: ", "batata".count('ta'))

print("A posião da primeira ocorrência de 'a' dentro de 'farofa': ", "farofa".find("a"))

print("_".join(lista_de_palavras))

# Cada um dos métodos podem ser utiliados aninhados.
# strip sem argumento remove espaço, quebra de linha e tabs das bordas
print("\t   P1 P2 P3 P4 P5 P6   \n".lower().strip().replace(" ", "_") )

['p1', 'p2', 'p3', 'p4', 'p5', 'p6']
LOWER CASE PARA UPPER CASE
inicio-->Remover  os espaços em branco das bordas<--fim
string_de_espaços_para_underline
A quantidade de 'ta' dentro de batata:  2
A posião da primeira ocorrência de 'a' dentro de 'farofa':  1
p1_p2_p3_p4_p5_p6
p1_p2_p3_p4_p5_p6


<a id="pt3.2"></a>
### 3.2: Listas

<a id="pt3.3"></a>
### 3.3: Conjuntos

<a id="pt3.4"></a>
### 3.4 Dicionários

<a id="pt3.4"></a>
### 3.5 Matrizes

Em python existe uma forma mais concisa de se fazer laços chamado de *list comprehension*, e esta é a sintaxe:
```py
[v_laço for v_laço in container if expressão]
```