# Introdução a Linguagem de Programação Python
.

Slide Exibição

# O que é Python?
- Linguagem de programação interpretada
- Multiparadigma
- Foco na legibilidade e (re)usabilidade
    - Excelente para prototipagem
- Possui diversas bibliotecas prontas para as mais diversas tarefas

# Python: popularidade

Como linguagem de ensino, Python é a linguagem mais utilizada atualmente.
![Python](http://cacm.acm.org/system/assets/0001/6470/Top39-700.3.png)

# Comparação

Em termos de expressividade $\Uparrow$

- Python
- Java
- C

Em termos de velocidade $\Downarrow$

Por que?
- Linguagem interpretada com alocação dinâmica de espaço
- Sem tipos primitivos $\Rightarrow$ todas as variáveis são objetos 
- Todas as operações com overhead de verificações de tipos

# Comparação

|  C    | Python |
|:-----:|:------:|
| ```int a = 1;``` | ```a = 1```|
| ```int b = 2;``` | ```b = 2```|
| ```int c = a + b;``` | ```c = a + b```|

# [Comparação][1]

## C (4 instruções)
1. Assign ```<int>``` 1 to a
2. Assign ```<int>``` 2 to b
3. call ```binary_add<int, int>(a, b)```
4. Assign the result to c

https://jakevdp.github.io/blog/2014/05/09/why-python-is-slow/

[1]: https://jakevdp.github.io/blog/2014/05/09/why-python-is-slow/


# [Comparação][1]

## Python (12 instruções)

1. Assign 1 to a
    1. Set ```a->PyObject_Head->typecode``` to ```integer```
    2. Set ```a->val = 1```
2. Assign 2 to b
    1. Set ```b->PyObject_HEAD->typecode``` to ```integer```
    2. Set ```b->val = 2```
3. ```call binary_add(a, b)```
    1. find ```typecode``` in ```a->PyObject_HEAD```
    2. ```a``` is an ```integer```; ```value``` is ```a->val```
    3. find ```typecode``` in ```b->PyObject_HEAD```
    4. ```b``` is an ```integer```; ```value is b->val```
    5. call ```binary_add<int, int>(a->val, b->val)```
    6. result of this is ```result```, and is an integer.
4. Create a Python object c
    1. set ```c->PyObject_HEAD->typecode``` to ```integer```
    2. set ```c->val``` to ```result```

https://jakevdp.github.io/blog/2014/05/09/why-python-is-slow/

[1]: https://jakevdp.github.io/blog/2014/05/09/why-python-is-slow/


# Como mitigar ineficiência do Python?

Programando partes críticas da aplicação em C 

- O nome “completo” da distribuição Python mais popular é CPython
    - Outras distribuições:  https://www.python.org/download/alternatives/ 
- Isso porque é possível implementar bibliotecas inteiras em C e chamar funções a partir de uma interface Python


# Programando em C

## Código em Python
```python
def predict(self, data, dt, inner=False):
        tree = dt.tree.node
        shape = data.shape
        data = data.values.ravel().tolist()
 
        preds = make_predictions(
            shape,
            data,
            tree,
            range(shape[0]),  
            self.dataset_info.attribute_index
        )
        return preds
```



# Programando em C

## Amarração em C

```C
static PyObject* make_predictions(PyObject *self, PyObject *args) {
    int n_objects, n_attributes;
    PyObject *predictions, *tree, *dataset, *attribute_index, *shape;
 
    if (!PyArg_ParseTuple(
            args, "O!O!O!O!O!",
            &PyTuple_Type, &shape,
            &PyList_Type, &dataset,
            &PyDict_Type, &tree,
            &PyList_Type, &predictions,
            &PyDict_Type, &attribute_index)) {
        return NULL;
    }
 
    n_objects = (int)PyInt_AsLong(PyTuple_GetItem(shape, 0));
    n_attributes = (int)PyInt_AsLong(PyTuple_GetItem(shape, 1));
 
    predict_dataset(n_objects, n_attributes, &dataset[0], tree, &predictions[0], attribute_index);
 
    return Py_BuildValue("O", predictions);
}
```

![Comparison](images/comparison-python-c.png)

# Frameworks de Aprendizado de Máquina
![Periodic Table](images/periodic-table.png)

# Configuração do Ambiente

# Passo 1: interpretador

1. Baixe a distribuição Anaconda do Python 3.X: https://www.anaconda.com/download 
2. Instale na sua máquina: https://docs.anaconda.com/anaconda/install/ 
3. Teste a instalação:
```bash
python --version
```
Deve resultar em uma string do tipo:
```
Python 2.7.15 :: Anaconda custom (64-bit)
```
Para habilitar o comando CONDA 
https://conda.io/docs/user-guide/getting-started.html
```
4. Atualize sua distribuição periodicamente:
```bash
Update anaconda using the following command:
 conda update -n base conda && conda update --all && conda clean --all
```
**Importante:** Nunca use ```sudo``` nos comandos do Anaconda para manter as instalações estanques. Uma vez usado ```sudo```, você sempre dependerá dele.

# Passo 2: ambientes virtuais

- O Anaconda permite criar interpretadores virtuais para encapsular ambientes de trabalho
- Para ver a descrição do comando ```conda create```:

```bash   
$conda create -h
usage: conda create [-h] [-y] [--dry-run] [-f] [--file FILE] [--no-deps]
                    [--only-deps] [-m] [-C] [--use-local] [--offline]
                    [--no-pin] [-c CHANNEL] [--override-channels]
                    [-n ENVIRONMENT | -p PATH] [-q] [--copy] [-k]
                    [--update-dependencies] [--no-update-dependencies]
                    [--channel-priority] [--no-channel-priority] [--clobber]
                    [--show-channel-urls] [--no-show-channel-urls]
                    [--download-only] [--json] [--debug] [--verbose]
                    [--clone ENV] [--no-default-packages]
                    [package_spec [package_spec ...]]

Create a new conda environment from a list of specified packages. To use the created environment, use 'source activate envname' look in that directory first.  This command requires either the -n NAME or -p PREFIX option.

```

# Passo 2: ambientes virtuais

Para criar um ambiente:

```bash
$ conda create --name py3 python=3.5
Solving environment: done

## Package Plan ##

  environment location: /Users/meneguzzi/anaconda/envs/py3

  added / updated specs:
    - python=3.5


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    certifi-2018.4.16          |           py35_0         142 KB
    python-3.5.5               |       h0a44026_3        14.9 MB
    wheel-0.31.1               |           py35_0          62 KB
    setuptools-39.2.0          |           py35_0         565 KB
    pip-10.0.1                 |           py35_0         1.8 MB
    ------------------------------------------------------------
                                           Total:        17.4 MB

The following NEW packages will be INSTALLED:

    ca-certificates: 2018.03.07-0
    certifi:         2018.4.16-py35_0
    libcxx:          4.0.1-h579ed51_0
    libcxxabi:       4.0.1-hebd6815_0
    libedit:         3.1.20170329-hb402a30_2
    libffi:          3.2.1-h475c297_4
    ncurses:         6.1-h0a44026_0
    openssl:         1.0.2o-h26aff7b_0
    pip:             10.0.1-py35_0
    python:          3.5.5-h0a44026_3
    readline:        7.0-hc1231fa_4
    setuptools:      39.2.0-py35_0
    sqlite:          3.23.1-hf1716c9_0
    tk:              8.6.7-h35a86e2_3
    wheel:           0.31.1-py35_0
    xz:              5.2.4-h1de35cc_4
    zlib:            1.2.11-hf3cbc9b_2

Proceed ([y]/n)?
```

O ambiente resultante se chamará ```py3``` que utiliza python 3.5

# Passo 2: ambientes virtuais
Para utilizar o ambiente:

```
Set anaconda to use a specific python version:
 source activate py3
to go back to Python 2.7 (default)
 source deactivate
```

E o prompt resultante terá o nome do ambiente o identificando

```
(py36) Retina-MBP:python_basico meneguzzi$
```

# Passo 2: ambientes virtuais

Para remover um ambiente virtual:

```bash
$ conda env remove --name py36

Remove all packages in environment /Users/meneguzzi/anaconda/envs/py36:


## Package Plan ##

  environment location: /Users/meneguzzi/anaconda/envs/py36


The following packages will be REMOVED:

    appnope:            0.1.0-py36hf537a9a_0
    backcall:           0.1.0-py36_0
    bleach:             2.1.3-py36_0
    ca-certificates:    2018.03.07-0
    certifi:            2018.4.16-py36_0
    cycler:             0.10.0-py36hfc81398_0
    dbus:               1.13.2-h760590f_1
    decorator:          4.3.0-py36_0
    entrypoints:        0.2.3-py36hd81d71f_2
    expat:              2.2.5-hb8e80ba_0
    freetype:           2.5.5-2
    gettext:            0.19.8.1-h15daf44_3
    glib:               2.56.1-h35bc53a_0
    graphviz:           2.38.0-4
    h5py:               2.8.0-py36ha8ecd60_0
    hdf5:               1.10.2-hfa1e0ec_1
    html5lib:           1.0.1-py36h2f9c1c0_0
```

# Passo 3: gerenciando pacotes

Para verificar os pacotes instalados no ambiente virtual use:

```conda list``` ou ```pip list```

```bash
$ conda list
# packages in environment at /Users/meneguzzi/anaconda/envs/py36:
#
# Name                    Version                   Build  Channel
appnope                   0.1.0            py36hf537a9a_0
backcall                  0.1.0                    py36_0
bleach                    2.1.3                    py36_0
ca-certificates           2018.03.07                    0
certifi                   2018.4.16                py36_0
cycler                    0.10.0           py36hfc81398_0
dbus                      1.13.2               h760590f_1
decorator                 4.3.0                    py36_0
entrypoints               0.2.3            py36hd81d71f_2
expat                     2.2.5                hb8e80ba_0
freetype                  2.5.5                         2
gettext                   0.19.8.1             h15daf44_3
glib                      2.56.1               h35bc53a_0
graphviz                  2.38.0                        4
h5py                      2.8.0            py36ha8ecd60_0
hdf5                      1.10.2               hfa1e0ec_1
html5lib                  1.0.1            py36h2f9c1c0_0
icu                       58.2                 h4b95b61_1
```

# Passo 3: gerenciando pacotes

Para instalar pacotes:

```conda install <pacote>```

```bash
```

**Sempre use o conda ao invés do pip para instalação e desinstalação**

# Passo 3: gerenciando pacotes

Para remover pacotes:

```conda uninstall <pacote>```

```bash
```

**Sempre use o conda ao invés do pip para instalação e desinstalação**

# Passo 4: utilizando notebooks

- Uma forma interativa de aprender a programar em Python é utilizando o recurso de Jupyter notebooks
- Encapsulam o trabalho em arquivos, sendo estes arquivos separados em boxes com código-fonte e texto em Markdown


# Passo 4: utilizando notebooks

Iniciando o servidor jupyter localmente:
- Entre no ambiente virtual que você criou anteriormente (```source activate py3```)
- Instale o pacote jupyter:
```conda install jupyter``` (últimas versões do conda já o possuem pré-instalado)
- Digite o comando ```jupyter notebook```
- Crie um novo notebook  (ou abra um notebook existente)


# Passo 4: utilizando notebooks

```bash
$ jupyter notebook
[I 16:29:12.488 NotebookApp] Serving notebooks from local directory: /Users/meneguzzi/Documents/pucrs/courses/2018-1/extension/python101
[I 16:29:12.488 NotebookApp] 0 active kernels
[I 16:29:12.488 NotebookApp] The Jupyter Notebook is running at:
[I 16:29:12.488 NotebookApp] http://localhost:8888/?token=1409da988aa14b9336b373b35d167dda20bca7efc2c23585
[I 16:29:12.488 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[C 16:29:12.489 NotebookApp]

    Copy/paste this URL into your browser when you connect for the first time,
    to login with a token:
        http://localhost:8888/?token=1409da988aa14b9336b373b35d167dda20bca7efc2c23585&token=1409da988aa14b9336b373b35d167dda20bca7efc2c23585
```

# Passo 4: utilizando notebooks

![Notebook](images/python-notebook.png)

# Sistemas de Versionamento

- Mantém versões de arquivos ao longo do tempo
- Repositório
    - Local onde estão armazenados os arquivos e suas versões
    - Sujeito a operações de check out, e check in
    - Impede que versões conflitantes sejam depositadas inadvertidamente
- Permitem reconstruir o estado de código fonte em momentos específicos de tempo
    - E.g. para descobrir como um bug foi introduzido
- Permitem criar "ramos" separados de bases de código (e.g. para experimentação, versões customizadas, etc)

# Git
- Sistema de versionamento distribuído:
    - Versionamento
    - Distribuído: múltiplas cópias dos arquivos em diversos clones de um repositório
- Repositórios distribuídos:
    - Permitem versionamento e desenvolvimento em paralelo 
    - Sincronização com repositórios através operações de push e pull


# Github (www.github.com)
- Serviço de versionamento online baseado em Git
- Interfaces para:
    - Versionamento Git
    - Acompanhamento de bugs, features, tarefas
    - Gerência de projetos
- Oferece pacotes acadêmicos gratis
- Github classroom:
    - Facilidades para desenvolvimento de trabalhos acadêmicos


# Criando um Repositório (no Github) 1

- Primeiro passo: criar um *endpoint* para o master no servidor

## Em conta pessoal
![New Repo1](images/new-repo-person.png)




# Criando um Repositório (no Github) 1

## Em conta organizacional
![New Repo1](images/new-repo.png)

# Criando um Repositório (no Github) 2

- Segundo passo: preencher formulários
![New Repo1](images/new-repo-forms.png)

# Populando o repositório

- Crie um repositório local (init)
- Adicione um arquivo qualquer nele, tipicamente README.md (add, commit)
- Conecte o repositório local ao servidor (add origin)
- Sincronise o repositório local (master) com o servidor (origin)

```bash
echo "# brainhack-demo" >> README.md
git init
git add README.md
git commit -m "first commit"
git remote add origin https://github.com/meneguzzi/brainhack-demo.git
git push -u origin master
```

Após o push, a página do Github deve mostrar seu arquivo:
![Populated Repo](images/new-repo-populated.png)

# Clonando um Repositório

- Replica repositório **todo**,incluindo histórico de modificações, para o computador local (isto pode ocupar espaço considerável)
    - Alternativa é clonar com profundidade 1 ```git clone --depth=1``` 
    - Isto copia apenas a última versão dos arquivos 
- Recapitulando:
    - ```origin``` é o nome padrão do ramo principal que vive no servidor
    - ```master``` é o nome padrão do ramo que vive no computador local
```bash
meneguzzi$ git clone https://github.com/meneguzzi/brainhack-demo.git
Cloning into 'brainhack-demo'...
remote: Counting objects: 3, done.
remote: Total 3 (delta 0), reused 3 (delta 0), pack-reused 0
Unpacking objects: 100% (3/3), done.
```

# Commits e Pushes
- ```git commit``` $\rightarrow$ atualiza um arquivo no repositório ```master``` (o ramo local)
- ```git push``` $\rightarrow$ sincroniza o ramo ```master``` com o ramo ```origin``` (no servidor)  

```bash
meneguzzi$ git commit -m "Minor change to README" *
[master 72c11bf] Minor change to README
 1 file changed, 2 insertions(+)
meneguzzi$ git push
Counting objects: 3, done.
Delta compression using up to 8 threads.
Compressing objects: 100% (2/2), done.
Writing objects: 100% (3/3), 317 bytes | 317.00 KiB/s, done.
Total 3 (delta 0), reused 0 (delta 0)
To https://github.com/meneguzzi/brainhack-demo.git
   c4ebe76..72c11bf  master -> master
```

# Pulls
- ```git pull``` sincroniza o ramo ```master``` (clone local) com mudanças no ramo ```origin``` (no servidor)
- Se houverem modificações concorrentes no servidor, podem haver conflitos a serem resolvidos

```bash
meneguzzi$ git pull
remote: Counting objects: 6, done.
remote: Compressing objects: 100% (3/3), done.
remote: Total 6 (delta 1), reused 6 (delta 1), pack-reused 0
Unpacking objects: 100% (6/6), done.
From https://github.com/meneguzzi/brainhack-demo
   fd720a2..8fdb1d4  master     -> origin/master
Updating fd720a2..8fdb1d4
Fast-forward
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)
```

# Conflitos
- Quando duas cópias locais de um repositório possuem edições concorrentes no mesmo trecho de código, isto representa um conflito
![Repo Conflict](images/repo-conflict.png)

# Resolvendo conflitos manualmente
- Arquivos em conflito estão anotados com commentários no formato de um [diff](https://en.wikipedia.org/wiki/Diff)
    - ```<<< HEAD``` até ```====``` representa o seu conteúdo local
    - ```====``` até ```>>>``` é o conteúdo conflitante no repositório
- Você escolhe que partes do código devem permanecer
![Conflict edit](images/repo-conflict-edit.png)
```bash
meneguzzi$ git pull
remote: Counting objects: 3, done.
remote: Compressing objects: 100% (2/2), done.
Unpacking objects: 100% (3/3), done.
remote: Total 3 (delta 0), reused 3 (delta 0), pack-reused 0
From https://github.com/meneguzzi/brainhack-demo
   72c11bf..fd720a2  master     -> origin/master
Auto-merging README.md
CONFLICT (content): Merge conflict in README.md
Automatic merge failed; fix conflicts and then commit the result.
```

# Concluindo a resolução de conflitos
- Quando terminar a edição dos arquivos:
    - ```git add``` $\rightarrow$ marca o conflito como resolvido
    - ```git commit``` $\rightarrow$ levará edição de uma mensagem começando com o texto abaixo 
    ```bash
    Merge branch 'master' of https://github.com/meneguzzi/brainhack-demo
    ```
    - ```git push``` $\rightarrow$ tudo resolvido
    
```bash
meneguzzi$ git add README.md
meneguzzi$ git commit
[master 8fdb1d4] Merge branch 'master' of https://github.com/meneguzzi/brainhack-demo
meneguzzi$ git push
Counting objects: 6, done.
Delta compression using up to 8 threads.
Compressing objects: 100% (4/4), done.
Writing objects: 100% (6/6), 625 bytes | 625.00 KiB/s, done.
Total 6 (delta 1), reused 0 (delta 0)
remote: Resolving deltas: 100% (1/1), done.
To https://github.com/meneguzzi/brainhack-demo.git
   fd720a2..8fdb1d4  master -> master
```
 

# Em resumo
![Git overview](images/git-overview.png)

# Ferramentas Git
Github Desktop
![Github Desktop](images/github-desktop.png)

# Ferramentas Git
SourceTree
![SourceTree](images/sourcetree.png)

# Ferramentas Git
Git Kracken
![Git Kracken](images/git-kracken.png)

# Conclusão

- Python é uma excelente linguagem de programação para prototipagem
- Maioria das tarefas de aprendizado de máquina estão disponíveis
    - Bibliotecas com os principais algoritmos também estão disponíveis
    - (as vezes em uma organização demasiadamente dispersa)
- Não tente reinventar a roda


# Avaliações deste curso

- As avaliações deste curso serão feitas utilizando o Github classroom
![Github](images/github-classroom.png)
- Repositórios na organização @pucrs-datascience [https://github.com/pucrs-datascience/]
    - Código dos notebooks está em: https://github.com/pucrs-datascience/python-notebooks
    - Link para iniciar o seu clone pessoal: https://classroom.github.com/a/mIAZHxvt
- Registre seu usuário Git até a próxima aula e use o link acima

# Python: Conceitos Básicos
Felipe Meneguzzi e Henry Cagnini

# Variáveis, tipos de dados

- Python manipula **objetos** 
- Cada objeto possui um **tipo**
    - Tipos definem que operações podem ser realizadas em cada objeto
    - Tipos podem ser **escalares** o ou **não-escalares**
        - Objetos escalares são indivisíveis
        - Objetos não-escalares possuem estrutura interna (e.g. strings)
    - Python possui quatro tipos de objetos escalares:
        - ```int``` representam inteiros
        - ```float``` representam números reais em **ponto flutuante**
        - ```bool``` representam valores lógicos booleanos ```True``` e ```False```
        - ```NoneType``` é um tipo com valor único, denotando ```None``` representando a ausência de quaisquer outros valores

- **Variáveis** associam nomes a objetos
    - O operador ```=``` associa o valor de uma **expressão** a uma variável
    - Expressões sempre resultam em um objeto de algum tipo
    

# Conversões de tipos

- Tipos básicos de python possuem uma variedade de operações de conversão de tipo:
    - ```int(p)``` converterá ```p``` para inteiro
        - Possível converter strings ```str``` e números em ponto flutuante ```float```
    - ```float(p)``` converterá ```p``` para ponto flutuante
        - Possível converter strings ```str``` e números inteiros ```int```
    - ```str(p)``` converterá ```p``` para uma representação em string
        - Possível converter ```int```, ```float```, ```list```, ```tuple```, ```dict```
    - ```list(p)``` converterá ```p``` para uma lista
        - Possível converter ```str```, ```tuple```, ```dict```
    - ```tuple(p)``` converterá ```p``` para uma tupla
        - Possível converter ```str```, ```list```

# Operadores matemáticos e comparativos

Escalares em Python possuem um conjunto básico de operadores.
- Os tipos ```int``` e ```float``` possuem os seguintes operadores matemáticos:
    - ```i+j``` representa a adição de ```i``` e ```j``` 
    - ```i-j``` representa a subtração de ```i``` e ```j```
    - ```i*j``` representa a multiplicação de ```i``` e ```j```, 
    - ```i**j``` representa ```i``` elevado a potência ```j```, para estas quatro operações:
        - se ambos ```i``` e ```j``` forem do tipo ```int``` o resultado será do tipo ```int```; 
        - se qualquer um deles for do tipo ```float```, o resultado também será do tipo ```float```
    - ```i//j``` representa a divisão *inteira* de ```i``` e ```j``` (então o resultado será sempre ```int```)
    - ```i/j``` representa a divisão *em ponto flutuante* de ```i``` e ```j``` (isto, em Python 3, então o resultado será sempre ```float```)
    - ```i%j``` representa o *resto da divisão inteira* de ```i``` e ```j``` (então o resultado será sempre ```int```)
- De forma similar, estes tipos possuem os operadores comparativos:
    - ```==``` (igual);
    - ```!=``` (diferente)
    - ```>``` (maior que)
    - ```>=``` (maior ou igual a)
    - ```<``` (menor que); e
    - ```<=``` (menor ou igual a).
- Objetos ```bool``` possuem os seguintes operadores lógicos
    - ```a and b``` conjunção;
    - ```a or b``` disjunção;
    - ```not a``` negação.

# Importação de módulos

- Conjuntos de programas e classes em python são organizados em arquivos individuais ou **módulos**
- Módulos organizam uma coleção lógicamente relacionada de programs distribuídos em um ou mais arquivos
- Tipicamente um arquivo individual ```.py``` representa um módulo que pode ser importado
    - Por exemplo considere o arquivo ```circle.py``` com um conjunto de funções
    - Podemos acessar as funções de ```circle.py``` a partir de outro arquivo usando o comando ```import circle```
- Módulos nos permite acessar diversas funções *built-in* da linguagem, por exemplo no módulo ```math``` (usando ```import math```, temos acesso a diversas funções matemáticas:
    - ```math.sin(x)``` retorna o seno de ```x```
    - ```math.sqrt(x)``` retorna a raiz quadrada de ```x```
 

# Ramificações, laços e iterações

- Condicionais em Python utilizam as palavras reservadas ```if```, ```else```, e ```elif```:
```python
if Boolean expression: 
    block of code
elif Boolean expression: 
    block of code
else:
    block of code
```
Por exemplo
```python
if x > 0: 
    return x
elif x < 0:
    return -x
else:
    return None
```
![Branching](images/branching-diagram.png)

- Note que Python utiliza indentação de forma semanticamente significativa
    - Cada bloco de programa está em um nível de indentação diferente

- Laços em python utilizam a palavra reservada while
```python
while Boolean expression: 
    block of code
```
Por exemplo:
```python
# Square an integer, the hard way x=3
ans = 0
itersLeft = x
while (itersLeft != 0): 
    ans = ans + x
    itersLeft = itersLeft - 1
```
![Loop](images/branching-diagram.png)

- Iterações (em tipos que suportam iteração) utilizam a palavra reservada ```for```
```python
for variable in sequence: 
    code block
```
Por exemplo
```python
for i in range(0,10): 
    print(i)
```

# Strings, Entrada e Saída

- Objetos do tipo ```str``` (para strings) são declarados tanto com aspas simples ```'abs'``` quanto com aspas duplas ```"abs"```
- Possuem diversos operadores:
    - Concatenação de strings ```"abc"+"def"``` resulta na string ```abcdef```
    - Replicação um certo número de vezes ```3*"a"``` resulta em ```aaa```
    - Indexação pode ser usada para extrair caracteres específicos ```"abc"[0]``` resultará no caracter ```'a'```
        - Strings são **constantes** e **imutáveis**
- Python 3 possui apenas um comando de entrada: ```input``` 
    - Único parâmetro é uma string texto a ser apresentada ao usuário:
- Entretando diversas variações do comando de saída ```print```:
    - ```print("Algum texto")```
    - ```print("Texto formatado com número %d"%12)``` imprime ```"Texto formatado com número 12"```
    - ```print("Algum texto",end="")``` imprime sem quebra de linha
    ```python
    >>> name = raw_input('Enter your name: ') 
    Enter your name: George Washington
    >>> print 'Are you really', name, '?'
    Are you really George Washington ?
    ```    

# Exceções

- Exceções indicam uma condição fora do comum ocorrendo em um programa
- Permitem tratamento de erros e eventualidades de forma separada à saída regular de uma função
- Utilizadas de diversas formas nas bibliotecas Python
- Tratamento de Exceções:
    - Quando ocorre uma exceção, um programa termina, retornando ao programa chamante
    - Caso a exceção não seja capturada, ela pode ser propagada até o programa principal (e terminar o programa inteiro)
No exemplo:

```python
successFailureRatio = numSuccesses/float(numFailures) 
print ('The success/failure ratio is', successFailureRatio)
print ('Now here')
```

Caso o número de falhas ```numFailures``` for 0, teremos uma exceção ```ZeroDivisionError``` e nenhum print ocorrerá
Tratando a exceção, teremos o código

```python
try:  
   successFailureRatio = numSuccesses/float(numFailures)  
   print('The success/failure ratio is', successFailureRatio)  
except ZeroDivisionError:  
   print('No failures so the success/failure ratio is undefined.')  
print 'Now here'
```

# Utilizando Exceções como Controle de Fluxo


# Asserções

# Funções em Python
Felipe Meneguzzi e Henry Cagnini

# Boas práticas de programação
- Grandes volumes de código não são necessariamente bons para legibilidade
- Idealmente, melhor codificar unidades de funcionalidade
- Para isto, utilizamos a noção de **funções**
- Mecanismo para atingir **decomposição** e **abstração**

# Declaração de Funções

As declarações de função utilizam a palavra reservada ```def```
```python
def function():
		pass
```

# Parâmetros
- Parâmetros proveem algo chamado: **lambda abstraction**
    - Permite escrever código que manipula objetos não específicos
    - Os objetos serão definidos pelo chamador da função

## Exemplo de sintaxe

```python
def printName(nome, sobrenome, inverte=False):
    if inverte:
        print(nome+" "+sobrenome)
    else:
        print(sobrenome+", "+nome)
```

## Tipos de parâmetros 

- Posicionais:
    - A ordem dos parâmetros reais deve ser a mesma dos parâmetros formais
```python
printName("Felipe","Meneguzzi",True)
```

## Tipos de parâmetros

- Palavra-chave:
    - Usa-se o nome do parâmetro para indicar seu valor
```python
printName(sobrenome="Meneguzzi",nome="Felipe")
```

## Tipos de parâmetros 

- Default:
    - Se omitido assume valor padrão
```python
def func(a, norm=False):
    if norm:
        return [(x - min(a))/ (max(a) - min(a)) for x in a]
    else:
        return a
```

## Tipos de parâmetros 

Exemplos de chamadas:
```python
In: func([1,2,3])
Out: [1,2,3]
In: func([1,2,3], False)
Out: [1,2,3]
In: func([1,2,3], True)
Out: [0, 0.5, 1]
In: func([1,2,3], norm=True)
Out: [0, 0.5, 1]
```

# Parâmetros não nomeados
- Se você não souber quantos parâmetros uma função receberá, utilize **\*args** para denotar este comportamento:
    - Na função abaixo: args codifica uma lista de parâmetros sem nome que foram passados para a função
    
```python
def func(*args):
    for item in args:
        print(item)
```

Exemplo de uso:
```python
In: func(1, 2, 'c')
Out: 
    1
    2
   'c'
```

# Parâmetros não nomeados
- Se você não souber quantos parâmetros uma função receberá, mas apenas que eles devem ser **nomeados**, utilize **\*\*kwargs**:
    - kwargs codifica um dicionário, onde a chave é o nome do parâmetro

```python
def func(**kwargs):
    for key, value in kwargs.items():
        print(key, value)
```

Exemplo de uso:
```python
In: func(a=1, b=2, c=‘d’)
Out: ‘a’,  1
 ‘b’,  2
 ‘c’, ‘d’

```

## Verificação de tipos

- Em python 3.X, o programador pode definir o tipo dos parâmetros
- Python 2.7 não possui verificação automática de tipos
    - Código abaixo ilustra como se faz verificação explicita de tipos em Python 2.7

```python
def func(param):  
    if isinstance(param, list):
        print ‘list’
    else:
        print type(param)
```

In [4]:
def my_func(some_list: list):
    for p in some_list:
        print(p)
        
a = [1, 2, 3]
my_func(a)

1
2
c


In [7]:
def my_func(some_list: list) -> list:
    for i in range(len(some_list)):
        some_list[i] **= 2  # eleva cada membro da lista ao quadrado
    return some_list
        
a = [1, 2, 3]
my_func(a)

[1, 4, 9]

## Documentação de funções

- Definem um *contrato* entre o programador que escreve a função e os programadores que irão usar a função em seus programas

- O contrato tem duas partes:
    - Pré condições (premissas): asserções que devem ser verdadeiras para que a função possa ser utilizada
    - Pós condições (garantias): asserções que o desenvolvedor da função garante que serão verdadeiras após a execução da função

In [10]:
def findRoot(x, power, epsilon): 
    """
    :param x: base
    :type x: float
    :param power: Expoente. deve ser maior ou igual a 1
    :type power: int
    :param epsilon: margem de erro. Deve ser maior que zero.
    :type epsilon:
    :return: Retorna um valor y, de tal forma que y ** power é aproximado de x 
        (dada a margem de erro epsilon). Se este valor não existir, retorna None
    :rtype: float
    """
    if x < 0 and power % 2 == 0:
        return None
    low = min(-1.0, x)
    high = max(1.0, x)
    ans = (high + low)/2.0
    while abs(ans ** power - x) >= epsilon:
        if ans ** power < x:
            low = ans
        else:
            high = ans
        ans = (high + low)/2.0
    return ans

In [18]:
expoente = 2
x = 10
epsilon = 0.1
y = findRoot(x, expoente, epsilon)

print('achando a base para o expoente 2 que mais se aproxima de 10:', y)
print('%.2f^%.0f = %f = %f - %f' % (y, expoente, (y**expoente), x, epsilon))

achando a base para o expoente 2 que mais se aproxima de 10: 3.16796875
3.17^2 = 10.036026 = 10.000000 - 0.100000


# Funções de teste

- Úteis para detecção de bugs
    - Ajudam na etapa de manutenção
    - Casos de teste facilmente gerados a partir da especificação
    - Desenvolvidas antecipadamente

In [22]:
def testFindRoot():
    epsilon = 0.0001
    for x in [0.25, -0.25, 2, -2, 8, -8]:
        for power in range (1, 4):
            print("Testing x =",str(x),"and power = ",power)
            result = findRoot(x,power,epsilon)
            if result == None:
                print(" No root")
            else:
                print(" ",result**power,"==",x)

In [23]:
testFindRoot()

Testing x = 0.25 and power =  1
  0.25 == 0.25
Testing x = 0.25 and power =  2
  0.25 == 0.25
Testing x = 0.25 and power =  3
  0.24990749079734087 == 0.25
Testing x = -0.25 and power =  1
  -0.25 == -0.25
Testing x = -0.25 and power =  2
 No root
Testing x = -0.25 and power =  3
  -0.24990749079734087 == -0.25
Testing x = 2 and power =  1
  1.999908447265625 == 2
Testing x = 2 and power =  2
  2.0000906325876713 == 2
Testing x = 2 and power =  3
  2.000059155646067 == 2
Testing x = -2 and power =  1
  -1.999908447265625 == -2
Testing x = -2 and power =  2
 No root
Testing x = -2 and power =  3
  -2.000059155646067 == -2
Testing x = 8 and power =  1
  7.999931335449219 == 8
Testing x = 8 and power =  2
  7.99999568007479 == 8
Testing x = 8 and power =  3
  8.000068664747232 == 8
Testing x = -8 and power =  1
  -7.999931335449219 == -8
Testing x = -8 and power =  2
 No root
Testing x = -8 and power =  3
  -8.000068664747232 == -8


## Por que utilizar funções?

- Decomposição
    - Cria uma estrutura
    - Quebra o programa em partes razoavelmente autocontidas
    - Estrutura pode ser facilmente reusada em diferentes contextos

- Abstração
    - Esconde detalhes
    - Permite usar trecho de código como “caixa-preta”
    - Preserva a informação relevante para um contexto
    - Ignora detalhes que não são relevantes naquele contexto



# Recursão
- Algoritmicamente: maneira de projetar soluções de problemas por uma estratégia de **dividir e conquistar** ou **decrementar e conquistar**
    - Reduz o problema a versões mais simples do mesmo problema
- Semanticamente: uma técnica de programação onde a **função chama a si mesma**
    - em programação, o objetivo é **não ter** recursão infinita
        - deve ter **1 ou mais casos base** que são facilmente solucionáveis
        - deve resolver o mesmo problema em **alguma outra entrada** com o objetivo de simplificar o problema maior dado

# Elementos de um algoritmo recursivo
- Caso base
- Passo de indução

```python
def fat(n):
    """ Assume que n é um int e n > 0
        Retorna n! """
    if n==1:
        return n
    else:
        return n*fat(n-1)
```

- Definição recursiva da função fatorial:
    - $1! = 1$
    - $n! = n * (n-1)!$ 

# Ponteiros para funções
- Funções em Python são "objetos de primeira classe"
    - Podem ser manipuladas como qualquer outro objeto
    - Podem ser passadas por parâmetro
    - Permitem realizar **programação de alta ordem** (útil para listas)

In [2]:
def addOne(n):
    return n+1

def applyToEach(maxN,f):
    for i in range(1,maxN):
        print(f(i))

applyToEach(10,addOne)

2
3
4
5
6
7
8
9
10


# Funções $\lambda$ (lambda)

- São como funções anônimas em Java
- Retornam valores, porém não precisam do statement "return"
- Geralmente são usadas em um escopo muito curto e restrito, como a chamada de uma função
- Podem ser atribuídas a variáveis:

In [24]:
func = lambda x: x + 1
func(2)

3

## Módulos
- Funções são a unidade fundamental de decomposição
- Programas muito grandes costumam exigir recursos adicionais
- Módulos permitem agrupar conjuntos de variáveis e funções em um único arquivo
- Cada módulo define seu próprio contexto
- Um módulo pode importar outros usando o comando ```import```
- Usa-se ```<nome do modulo>.<nome da função>``` para acessar funções definidas em outros módulos

### Exemplo

Módulo em ```circulo.py```
```python
pi = 3.14159

def area(raio):
    return pi*(raio**2)
    
def perimetro(raio):
    return 2*pi*raio
    
def superficie(raio):
    return 4.0*area(raio)
    
def volume(raio):
    return(4.0/3.0)*pi*(raio**3)

```

Uso do módulo
```python
import circulo

raio = float(input("Digite o raio do circulo: "))

print("Area do circulo:",circulo.area(raio))
print("perímetro do circulo:",circulo.perimetro(raio))
print("Volume da esfera:",circulo.volume(raio))
```

### Definição de módulos

Para definir um módulo (dentro da pasta de um projeto), é necessário:

* Especificar o nome do módulo como o nome da pasta que conterá os arquivos de código
  * Por exemplo, ```treelib```
* Colocar um arquivo ```__init__.py``` dentro desta pasta
  * Este arquivo contém as instruções iniciais que devem ser executadas assim que um módulo é importado. Se nenhuma instrução for necessária, ele pode ficar em branco
* Colocar os outros arquivos de código fonte nesta pasta
  * Por exemplo, um arquivo ```creation.py``` dentro da pasta d módulo ```treelib```
  * Ele será importado com a seguinte sintaxe: ```treelib.creation```

# Contêineres em Python

## Prof. Felipe Meneguzzi e Henry Cagnini

### Agenda:
* Tipos de dados
* Listas
  * Índices e ordenação
  * referências
  * append e extend
  * iteração
  * indexação
  * slicing
  * construção com list comprehension
  * função pré-definida map
  * métodos
  * funções de alta ordem
* Tuplas
  * função pré-definida zip
  * função pré-definida enumerate
* Conjuntos
* Dicionários
* Operadores de conjuntos
* Itertools
* Leitura recomendada

## Tipos Escalares vs Tipos Estruturados
- Tipos em Python podem ser **escalares** o ou **não-escalares**
    - Objetos escalares são indivisíveis
    - Objetos não-escalares possuem estrutura interna (e.g. strings)
- Na aula de hoje veremos os principais tipos estruturados

## Listas

O que são listas?
- Listas são **sequências ordenadas** de valores onde cada valor é identificado por um índice
- Uma lista é denotada por **colchetes**, ```[]```
- Listas contém **elementos**:
    - normalmente homogênea (i.e. uma lista de inteiros)
    - podem conter elementos misturados (incomum)
- Listas são mutáveis (permitem inserção e remoção de elementos)
- É possível aplicar slicing sobre listas

- Listas em Python são implementadas como **listas encadeadas**

## Listas

- No console: ```[1, 7, 3, 5]```
    - No hardware:
![Lists](images/lists.png)

## Listas

Quando usar listas em Python?
- Para escopos que duram **pouco tempo** 
- Quando o tamanho da lista **será alterado** 
- Quando o tamanho da lista é **pequeno**


## Listas: índices e ordenação

In [24]:
a_list = []
L = [2, 'a', 4, [1,2]] 
print(len(L))  #avalia para 4 
print(L[0])    #avalia para 2 
print(L[2]+1)  #avalia para 5
print(L[3])    #avalia para [1,2], outra lista!
i=2 #
print(L[i-1])  #avalia para ‘a’ já que L[1]='a' acima

4
2
5
[1, 2]
a


```python
print(L[4])    #erro
```

# Listas: referências
```python
Techs = ['MIT','Caltech']
Ivys = ['Harvard','Yale','Brown']
Univs = [Techs,Ivys]
Univs1 = [['MIT','Caltech'],['Harvard','Yale','Brown']]
```
- Use a função pré-definida ```id``` para verificar que os objetos são diferentes apesar de guardarem o mesmo conteúdo.
- O que acontece se dermos o comando: ```Techs.append('RPI')?```
    - Temos um efeito colateral na lista ```Univs```, visto que ela referencia a mesma lista que ```Techs```

![Lists Example](images/lists-example.png)

## Listas: append e extend

- Diferença entre ```append``` e ```extend```
    - Quando se faz ```append``` se acrescenta um objeto lista em outra lista
    - Quando se faz ```extend``` acrescenta-se uma cópia dos elementos de uma lista na outra lista

## Listas: iteração
- Por exemplo, computar a **soma dos elementos** de uma lista
- Padrão comum, iterar sobre os elementos de uma lista:

```python
total = 0
for i in range(len(L)):
  total += L[i]
print total
```

O código acima é equivalente a:

```python
total = 0
for i in L:
  total += i
print total
```

- Note que:
    - os elementos são indexados de $0$ até ```len(L)-1```
    - ```range(n)``` vai de $0$ a $n-1$

## Listas: indexação

A indexação linear (para os contêineres que a suportam) em Python possui algumas particularidades:
* Suporta números negativos
* Nesse caso, indexa de trás para frente (-1, -2, ...)
* Aceita 3 parâmetros
  * Ponto de início (inclusivo)
  * Ponto de fim (exclusivo)
  * Passo


| Dados na lista        | a   | b   | c   | d   | e   |
|----------------------:|:---:|:---:|:---:|:---:|:---:|
| Indexação crescente   | 0   | 1   | 2   | 3   | 4   |
| Indexação decrescente | -5  | -4  | -3  | -2  | -1  |

## Listas: slicing

* Slicing é a técnica de “fatiar” um contêiner que suporta indexação linear 
* O fatiamento se dá adicionando um par de colchetes ao fim da variável
* Possui 3 parâmetros: início (incluso), fim (excluso) e passo


![slicing_1](images/slicing_1.png)

## Listas: slicing

![slicing_2](images/slicing_2.png)

## Listas: slicing

```python
nums = list(range(5))
print(nums)
print(nums[:])   # do início ao fim
print(nums[2:])  # do 2o (incluso) até o fim
print(nums[:2])   # do início ao 2o (excluso)
print(nums[2:4])  # do 2o (incluso) ao 4o (excluso) 
print(nums[:-1])  # do início ao último (excluso)
nums[2:4] = [8, 9]  # atribuição
print(nums)
```

## Listas: construção com list comprehension

- *List Comprehension* (compreensão de lista) é um mecanismo conciso de aplicar uma operação nos valores de uma lsita
    - Cria uma nova lista 
    - Cada elemento é o resultado de uma operação em outra sequência (e.g. uma outra lista)

```python
L = [x**2 for x in range(1,7)]
```
Resultará na lista ```[1, 4, 9, 16, 25, 36]```

- O comando ```for``` na compreensão pode ser segido de um ou mais comandos ```if``` para filtrar o conteúdo da lista

```python
mixed = [1, 2, 'a', 3, 4.0]
mixed = [x**2 for x in mixed if type(x) == int]
```

Aplicará a potência quadrática apenas no números inteiros, resultando na lista ```[1, 4, 9]```

## Listas: ```map```

- ```map``` é uma função de alta ordem pré-definida
    - Aplica uma função em cada elemento de uma lista
    - Chamada ```map(f,l)``` onde ```f``` é uma função a ser aplicada na lista ```l```
- Por exemplo, o código (utilizando a função lambda ``` x = x+'a' ```):

```python
lista = ['b', 'n', 'n']
lista1 = list(map(lambda x: x + 'a', lista))
print(lista1)
```

Resultará na lista ```['ba', 'na', 'na']```


## Listas: métodos

- ```L.append(e)``` adiciona um objeto ```e``` no final de ```L```
- ```L.count(e)``` retorna o número de vezes que ```e``` ocorre em ```L```
- ```L.insert(i, e)``` insere o objeto ```e``` em ```L``` no índice ```i```
- ```L.extend(L1)``` adiciona os itens da lista ```L1``` no final de ```L```
- ```L.remove(e)``` deleta a primeira ocorrência de ```e ``` de ```L```.
- ```L.index(e)``` retorna o índice da primeira ocorrência de ```e``` em ```L```. Cria uma exceção caso ```e``` não esteja em ```L```.
- ```L.pop(i)``` remove e retorna o elemento no índice ```i```
    - Se ```i``` for omitido ```i``` será assumido como ```-1``` por default, retornando o último elemento de ```L```
- ```L.sort()``` ordena os elementos de ```L``` em ordem ascendente
- ```L.reverse()``` inverte a ordem dos elementos em ```L```

## Tuplas

- Tuplas são sequências de elementos de qualquer tipo
- Exemplos:
    - Tuplas que representam produtos:
        - ```Prod1 = (10,”Banana”,1.5)```
        - ```Prod2 = (22,”Maca”,4.5)```
    - Tuplas que representam pontos cartesianos:
        - ```P1 = (101,22)```
        - ```P2 = (-3,18)```

## Tuplas

- São **imutáveis**
    - Uma vez criados, não podem ser **estendidos**, **reduzidos** ou **alterados**
        - Similares a strings
    - Podem ser indexados tal como listas: e.g. ```P1[0]``` $\rightarrow$ ```101```
    - Admitem slicing ```Prod2[1:]``` $\rightarrow$ ```("Maca", 4.5)```

## Tuplas

- Preste atenção:
    - ```X = (“ola”)``` $\rightarrow$ ```type(X) == String```
    - ```X = (“ola”,)``` $\rightarrow$ ```type(X) == Tuple```


## Tuplas: zip

- ```zip``` permite iterar sobre valores agregados de múltiplas coleções iteráveis
- Retorna um iterador de tuplas onde cada elemento $i$ iterado corresponde a uma tupla com o i-gésimo elemento de cada coleção

Por exemplo
```python
x = [1, 2, 3]
y = [4, 5, 6]
zipped = list(zip(x, y))
```

Resultará na lista de tuplas ```[(1, 4), (2, 5), (3, 6)]```

## Tuplas: enumerate

- ```enumerate``` permite iterar sobre uma coleção mantendo uma variável com a contagem de elementos vistos até agora 
    - Esta contagem corresponde ao índice de coleções sequenciais (e.g. strings, listas e tuplas)

Por exemplo:

In [40]:
seasons = ['Spring', 'Summer', 'Fall', 'Winter']
tuples = list(enumerate(seasons))

print(tuples)

[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]


## Conjuntos

- Implementam uma coleção de objetos únicos respeitando propriedades de um conjunto matemático
- Implementam operadores de [teoria dos conjuntos](https://en.wikipedia.org/wiki/Set_theory)
- Não possuem ordem garantida

![Sets](images/sets.png)

## Conjuntos

In [25]:
a = {1, 2, 3}
b = set([3, 4, 5])

In [26]:
len(a)

3

In [27]:
1 in a

True

In [28]:
a ^ b

{1, 2, 4, 5}

In [29]:
a | b

{1, 2, 3, 4, 5}

In [30]:
a - b

{1, 2}

## Conjuntos

In [31]:
a = {1, 2, 3}
b = set([3, 4, 5])

In [32]:
c = {1, 2}

In [33]:
c.issubset(a)

True

In [34]:
a.issuperset(c)

True

## Conjuntos: operadores

- ```len(s)```: número de elementos no conjunto ```s``` (cardinalidade)
- ```x in s```: testa se ```x``` é um membro de ```s``` 
- ```x not in s```	testa se ```x``` não é membro de ```s```
- ```s.issubset(t)``` (equivalente a ```s <= t```)	testa se cada elemento de ```s``` está em ```t```
- ```s.issuperset(t)```	(equivalente a ```s >= t```) testa se cada elemento de ```t``` está em ```s```
- ```s.union(t)```	(equivalente a ```s | t```)	gera um novo conjunto com todos os elementos de ```s``` e ```t```
- ```s.intersection(t)``` (equivalente a ```s & t```) gera um novo conjunto com os elementos comuns entre ```s``` e ```t```
- ```s.difference(t)```	(equivalente a ```s - t```)	gera um novo conjunto com os elementos de  ```s``` que não estão em ```t```
- ```s.symmetric_difference(t)``` (equivalente a ```s ^ t```) gera um novo conjunto com elementos em ```s``` ou ```t``` que não estão em ambos

## Dicionários

- Dicionários são estruturas de dados indexadas **indiretamente** utilizando **chaves** no lugar de índices numéricos
- Dicionários implementam **tabelas hash** (hash tables)
- Indexação utiliza uma **função hash** que converte valores de tipos arbitrários para um índice númerico (idealmente único)
    - Todos os objetos em Python implementam uma função de hash padrão no método ```__hash__(self)```

![Dictionary](images/dictionary.png)

## Dicionários

In [35]:
d = {'camila': 21, 'roberto': 53, 'carla': 66}

In [36]:
d['camila']

21

In [37]:
# print d[21]  # resultará em um erro

In [38]:
'camila' in d

True

In [39]:
for key, value in d.items():
    print('chave:', key, '\tvalor:', value)

chave: camila 	valor: 21
chave: roberto 	valor: 53
chave: carla 	valor: 66


## Contêineres: resumo

![Dictionary](images/comparacao.png)

## Itertools

Iteradores infinitos:

![itertools_01](images/itertools_01.png)

## Itertools

Iteradores que terminam com a sequência de menor tamanho:

![itertools_02](images/itertools_02.png)

## Itertools

Iteradores combinatórios:

![itertools_03](images/itertools_03.png)

## Leitura recomendada

* Documentação oficial sobre contêineres: https://docs.python.org/3/library/stdtypes.html#list
* Documentação sobre a biblioteca nativa itertools: https://docs.python.org/3/library/itertools.html

# Arquivos

Cria arquivo:
```python
import random
arq = open("numeros.txt","w")
for i in range(0,100):
    val = random.random()
    arq.write(str(val)+"\n")
print("Arquivo criado")
arq.close()
```

Lê arquivo:
```python
arq = open("numeros.txt","r")
for line in arq:
    print(float(line)*10)
arq.close()
```