# Revisão da linguagem de programação Python

Nesse documento vamos apenas revisar os conceitos básicos da linguagem e da sua sintaxe necessários para podermos trabalhar com Pandas e Jupyter.

## Tópicos

1. [Jupyter NoteBook](#jupyter)
    1. [Inicialização](#inicializacao)
    2. [Teclas](#teclas)
    3. [Estado da célula](#celula)
        1. [Executando](#executando)
        2. [Inativa](#inativa)
    4. [Resultado](#resultado)
2. [A linguagem Python](#python)
    1. [Tipos de valores](#valores)
        1. [Texto (*strings*)](#texto)
            1. [Métodos](#texto_metodos)
            2. [Nota sobre sequências](#sequencias)
        2. [Números (*int* e *float*)](#numeros)
        3. [Booleanos](#booleanos)
        4. [Exemplo biológico](#valores_exemplo)
    2. [Tipos de variáveis](#variaveis)
        1. [Variáveis escalares](#escalares)
        2. [Listas](#listas)
            1. [Métodos e operadores](#metodos_de_listas)
            2. [Exemplo biológico](#lista_exemplo)
        3. [Dicionários](#dicionarios)
            1. [Métodos e operadores](#metodos_dicionarios)
            2. [Exemplo biológico](#dicionario_exemplo)
    3. [Condicionais](#condicionais)
        1. [Exemplo biológico](#condicional_exemplo)
    4. [Repetição (laços)](#repeticao)
        1. [While](#while)
            1. [Exemplo biológico](#while_exemplo)
        2. [For](#for)
            1. [Exemplo biológico](#for_exemplo)
        3. [Compreensão](#compreensao)
    5. [Funções](#funcoes)
        1. [Exemplo biológico](#funcao_exemplo)
    6. [Objetos e classes](#objetos)
        1. [Atributos](#atributos)
        2. [Métodos](#metodos)
        2. [Módulos](#modulos)
        4. [Exemplo biológico](#objeto_exemplo)
    7. [Arquivos](#arquivos)
3. [Notas](#notas)

<a id="jupyter"></a>
## 1. Jupyter NoteBook

O conteúdo dessa aula estará inteiramente contido em *notebooks* do Jupyter.

Os *notebooks* vão conter as instruções, descrição de conceitos básicos e o código Python executável, já digitado e pronto para execução.

<a id="inicializacao"></a>
### 1.A Inicialização
O Jupyter é uma aplicativo web que deve ser iniciado, __na janela de terminal__, com o comando

>`jupyter-notebook`

A primeira página do Jupyter mostra os arquivos e diretórios contidos no diretório onde o Jupyter foi iniciado.

Clicando em um *notebook* (arquivos terminados em `.ipynb`), a página do *notebook*  é aberta em uma nova janela ou aba, pronta para execução.

No Jupyter, a entrada de código ou comentários é feita em as caixas de texto chamadas __células__.

Cada *notebook* é uma __sequência de células__, que podem ser preenchidas com texto ou código.

O __resultado__ da execução de uma célula, quando visível, é mostrado abaixo da célula.

>Se quiser adicionar uma célula para testar código, __controle o tipo de célula__ usando o menu de rolagem (*dropdown menu*), na barra de ferramentas (linha dos botões, abaixo dos menus *File, Edit, etc*), e escolha *Code* ou *Markdown*, conforme sua necessidade. 

<a id="teclas"></a>
### 1.B Teclas

Para usar bem o Jupyter, a função de duas combinações de teclas precisam ser memorizadas:

* __`Enter`__: ativa a edição da célula, se estiver inativa
* __`Shift+Enter`__: executa o conteúdo da célula, convertendo MarkDown em HTML ou executando o código Python dentro da célula.
* Quando uma célula inativa é selecionada a tecla:
    * `a` adiciona uma célula nova __acima__ da atual e
    * `b` adiciona uma célula nova __abaixo__ da atual

Para seguir o conteúdo e ver a execução do código, para executar

<a id="celula"></a>
### 1.C Estado da célula

<a id="executando"></a>
#### 1.C.a Executando: `In [*]:`
Se o código de uma célula está em execução ou aguardando para executar, o indicador do lado esquerdo da célula inclui um asterisco e aparece como `In [*]`.

As células podem depender umas das outras __no mesmo *notebook*__ mas não de outro *notebook* pois, embora cada *notebook* execute uma nova instância do *kernel*, todas células do mesmo *notebook* usam o mesmo *kernel*.

<a id="inativa"></a>
#### 1.C.b Inativa: `In [ ]:`
Se uma célula, contendo código, tem do lado esquerdo um indicador de ativide com um espaço vazio entre dois colchetes, ela ainda não foi executada. Um exemplo de célula inativa aparece abaixo.

<a id="resultado"></a>
### 1.D Resultado: `Out[1]:`

O Jupyter vai exibir o resultado da execução de uma célula com código __somente__ quando a última linha de código __devolver um [valor](#valores)__ após sua execução.

No exemplo abaixo, o nome da [variável](#variaveis) `a` é a última instrução, o que faz com que a célula retorne o [valor](#valores) armazenado em `a`.

Para executar, aperte as teclas __`Shift+Enter`__:

In [None]:
a = 1
a

Mas, se o código, depois de executar várias instruções, terminar em uma linha que não devolve nenhum [valor](#valores), nada será impresso:

In [None]:
a = 1
a
b = 2

mesmo se todas as instruções forem executas corretamente e tiverem feito o efeito esperado:

In [None]:
b

<a id="python"></a>
## 2. A linguagem Python

A liguagem Python é uma linguagem interpretada de alto nível, ou seja, que permite ao usuário realizar tarefas de programação complexas sem ter que lidar com detalhes da arquitetura do computador.

O interpretador de Python se encarrega, por exemplo, de solicitar memória ao sistema operacional, sempre que precisa carregar dados na memória, sem que o programador precise escrever, em seu código, essa solicitação.

Nessa aula, vamos usar o Python como interpretador do código executável ou [*kernel*](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Connecting%20with%20the%20Qt%20Console.html?highlight=kernel#The-Frontend/Kernel-Model) para nossos *notebooks*.

>__Notas__:
>
> * A linguagem Python suporta a adição de comentários no código
> * A forma mais simples de fazer um comentário é adicionar um sustenido ou *hash tag* (#)
> * Todo o texto depois do "#" é ignorado pelo Python e tratado com comentário
> * Vamos usar comentários nessa aula para explicar algumas linhas de código

<a id="valores"></a>
### 2.A. Tipos de valores

A linguagem Python é capaz de processar muitos tipos diferentes de dados, como números, texto, arquivos, imagens, planilhas, etc.

Para lidar com essa diversidade, a linguagem define uma complexa hierarquia de tipos de valores.

Nessa aula só precisamos entender alguns tipos básicos de valores, que descrevemos a seguir.

<a id="texto"></a>
#### 2.A.a. [Texto (*strings*)](https://docs.python.org/3/library/stdtypes.html#textseq)

Letras, números, caracteres especiais (como @, \$, #), o final de uma linha ou uma tabulação, acentos e vários outros caracteres, quando armazenados numa cadeia, representam um texto ou *string*.

O Python usa aspas, simples ou duplas, para indicar que uma sequência de um ou mais caracteres será uma *string*.

Na célula abaixo atribuímos à [variável](#variaveis) `a` um valor do tipo *string*.

Execute essa célula usando a combinação de teclas __`Shift+Enter`__:

In [None]:
a = "uga buga"

Executando a próxima linha (__`Shift+Enter`__) , podemos ver o que foi armazenado:

In [None]:
a

e o tipo de valor:

In [None]:
type(a)

`str` é o identificador do tipo texto em Python.

<a id="texto_metodos"></a>
##### 2.A.a.i Métodos

Valores do tipo texto (*string*) têm vários métodos específicos desse tipo como:

* Contar quantas vezes um texto aparece dentro do texto na variável

In [None]:
a = "uga buga"
a.count('a')

* Devolver o mesmo texto depois de converter todas as letras em maísculas

In [None]:
a = "uga buga"
a.upper()

Para ver o repertório completo de métodos para valores do tipo *string*, use o comando `help()`:

In [None]:
help(str)

<a id="sequencias"></a>
##### 2.A.a.ii Nota sobre sequências

Em Python, os valores do tipo texto são um exemplo de uma classe mais ampla, chamada [sequências]().

Isso é importante pois implica que funções de sequências também funcionam com *strings*, tais como `len()`:

In [None]:
len("uga")

In [None]:
len(a)

que imprime o comprimento da *string*.

O operador `in` também funciona e serve para testar se uma *string* contém outra *string*:

In [None]:
"h" in "Arthur"

In [None]:
"J" in "Jota"

In [None]:
a

In [None]:
"bug" in a

<a id="numeros"></a>
#### 2.A.b. [Números (*int* e *float*)](https://docs.python.org/3/library/stdtypes.html#numeric-types-int-float-complex)

Python implementa três tipos básicos de valores numéricos: inteiros, reais e complexos.

Valores inteiros correspondem aos números inteiros, positivos ou negativos:

In [None]:
b = 1
c = -2
d = 0

In [None]:
type(b)

Note que para definir valores numéricos não usamos aspas!

O código:

In [None]:
e = "3"
type(e)

mostra que a variável `e` é, na verdade, uma *string*.

e podemos fazer as operações aritméticas usuais com os números:

In [None]:
b + c

O comportamento não é diferente para números reais (*float*):

In [None]:
f = 0.1

In [None]:
f

In [None]:
type(f)

In [None]:
b + f

<a id="booleanos"></a>
#### 2.A.c Booleanos

Esse tipo de variável é binária: comporta apenas os valores verdadeiro (*True*) ou falso (*False*).
    
Esse tipo de variável aparece sempre que é preciso testar relações lógicas como, por exemplo, se alguma condição se aplica (ver [Condicionais](#condicionais), abaixo).

Operadores lógicos (and, or, not) são os mais usados para avaliar os valores booleanos, mas operadores numéricos também funcionam pois os booleanos são também considerados um tipo numérico em Python.

In [None]:
g = True
h = False

In [None]:
g and h

In [None]:
g * h

<a id="valores_exemplo"></a>
#### 2.A.d Exemplo biológico

Para lidar com sequências biológicas é conveniente usar valores do tipo texto:

In [None]:
s = "ATGAAAAGTGGGCCC"
s

Há várias propriedades das sequências, porém, que são melhor descritas por variáveis numéricas, como seu comprimento ou a frequência de bases:

In [None]:
s = "ATGAAAAGTGGGCCC"       # Armazendando a sequência
sG = s.count('G')           # Número de guaninas na sequência "s" (int)
sC = s.count('C')           # Número de citosinas na sequência "s" (int)
GC = sG + sC                # Quantidade de guaninas e citosinas (int)
sl = len(s)                 # Comprimento da sequência (int)
GCp = GC / sl               # Percentual de guanina e citosina (float)
print(f'GC  = {GC}')        # Usando a F-string e print() para imprimir o valor da variável GC
print(f'GC% = {GCp}')       # Usando a F-string e print() para imprimir o valor da variável GCp
type(GCp)                   # Imprimindo o tipo de valor da variável GCp

<a id="variaveis"></a>
### 2.B Tipos de variáveis
Além de poder processar vários tipos de dados, o Python também pode organizar esses dados de muitas maneiras diferentes na memória do computador.

As diferentes formas de organização dos dados são chamadas de __tipos de variáveis__ e os tipos mais básicos são intrínsecos ([*built-in variables*](https://docs.python.org/3/library/stdtypes.html)), ou seja, são parte integral da linguagem Python.

Os tipos mais importantes de variáveis intrínsecas são:

<a id="escalares"></a>
#### 2.B.a Variáveis escalares
Como visto nos exemplos acima, o tipo mais simples de variável, chamado de escalar, corresponde a um único valor e é acessado pelo nome atribuído à variável:

In [None]:
var1 = "Essa variável é do tipo escalar"

In [None]:
var1

O comportamento de uma variável escalar é definido pelo tipo do valor armazenado nela.

<a id="listas"></a>
#### 2.B.b [Listas](https://docs.python.org/3/library/stdtypes.html#list)

Listas são conjuntos ordenados de variáveis esclares cujos elementos são identificados por índices numéricos.

Assim como as *strings*, listas são sequências, o que implica que os métodos `len()`, `count()` e `in`, [entre outros](https://docs.python.org/3/library/stdtypes.html#sequence-types-list-tuple-range), funcionam para listas.

Para criar uma lista podemos usar a notação de colchetes `[]`:

In [None]:
m = ['a',2,'texto',3]

In [None]:
m

Alternativamente, podemos usar a função `list()`, para converter um texto ([*string*](#texto)) em uma lista:

In [None]:
n = list('abc1')
n

Note que, no caso acima, o último elemento, embora seja um número é armazenado na lista como texto (*string*).

#### __Acessando valores em uma lista__

Itens em uma lista podem ser acessados usando o índice (posição) do elemento:

In [None]:
m[2]

Para acessar uma __fatia__ de uma lista usamos a notação de intervalo `x:y`, onde
* `x` é o indice do primeiro elemento a ser recuperado na lista e
* `y` é o limite superior do intervalo ou seja, parte de seus elementos:

Exemplos:

1. __Segundo__ e __terceiro__ elementos da lista `m = ['a',2,'texto',3]`:

In [None]:
m[1:3]

2. Do __primeiro__ ao __terceiro__ elementos da lista:

In [None]:
m[0:3]

3. Últimos dois elementos, usando índices negativos:

In [None]:
m

In [None]:
m[-2:]

Note que os índices começam em __zero__, fazendo com que o índice de um elemento seja sempre sua posição menos um.

> __Nota:__
>
> A mesma lista pode armazenar tipos de valores diferentes:

In [None]:
type(m[0])

In [None]:
type(m[1])

<a id="metodos_de_listas"></a>
#### 2.B.b.i Métodos e operadores

A todo um [repertório de operações](https://docs.python.org/3/library/stdtypes.html#list) que podemos fazer com listas, usando funções e/ou operadores.

Alguns exemplos importantes:

* __Concatenando listas__

Com o operador `+`

In [None]:
['a','b','c'] + ['d','e']

ou, usando um [método](#metodos):

In [None]:
m

In [None]:
m.extend(['texto2','texto3'])
m

ou, para adicionar __um único elemento__ usando um [método](https://docs.python.org/3/library/stdtypes.html#methods):

In [None]:
m.append('texto4')
m

* __Ordenar elementos__

Essa operação exige que todos os elementos da lista sejam o mesmo [tipo de variável](#variaveis).

In [None]:
m = list('zebra ROXA')
m.sort()

In [None]:
m

note que o método `sort()` altera a variável `m` sem retornar nada e essa é a razão pela qual a execução do código na penúltima célula não imprime nada.

* __Comprimento de uma lista__

In [None]:
len(m)

* __Remover elementos__

Pode ser feito com a função `del()`, que também é usada para remover variáveis inteiras:

In [None]:
del(m[4:8])

In [None]:
m

ou usando essa sintaxe:

In [None]:
m[2:4] = []

In [None]:
m

* __Verificando a presença de certo valor__

In [None]:
'A' in m

<a id="lista_exemplo"></a>
#### 2.B.b.ii Exemplo biológico

Podemos usar listas para armazenar múltiplas sequências de nucleotídeos ou proteínas e comparar alguma posição nelas:

In [None]:
s = ['ATGAAAAGTGGGCCC','ATGAAAAGCGGGCCC']
s[0]

In [None]:
s[1]

In [None]:
s[0][8]

In [None]:
s[1][8]

In [None]:
s[0][8] == s[1][8]

No exemplo acima usamos o primeiro colchete para acessar a __primeira__ sequência (`s[0]`, valor do tipo texto).

O mesmo é aplicado à segunda sequência e, em seguida, o segundo par de colchetes usa a notação de colchetes para acessar uma base na sequência de nucleotídeos. Para a __segunda__ sequência, por exemplo, o __nono__ (9) caractere é `s[1][8]`.

<a id="dicionarios"></a>
#### 2.B.c Dicionários

Dicionários são semelhantes às listas mas os identificadores dos elementos (__índices__) podem ser texto (*strings*) e não apenas números inteiros.

Dizemos, portanto, que um dicionário associa uma chave com um único valor, definindo um par `chave => valor`.

Dicionários podem ser criados usando chaves (`{}`):

In [None]:
d = {'c':'d', 'a':'b'}

In [None]:
d

e seus valores podem ser acessados usando a sintaxe e colchetes:

In [None]:
d['a']

* __Verificando a presença de uma chave__

Assim como nas listas, podemos usar o operador `in` para saber o que está armazenado em um dicionário.

Para dicionários, porém, esse operador verifica apenas a preseça da chave:

In [None]:
'c' in d

<a id="metodos_dicionarios"></a>
#### 2.B.c.i Métodos e operadores

Para dicionários, o comportamento de [operadores](https://docs.python.org/3/reference/lexical_analysis.html#operators) e o repertório de [métodos](https://docs.python.org/3/library/stdtypes.html#methods) é similar ao disponível para listas.


* O __comprimento de um dicionário__ é o número de pares `chave => valor` nesse dicionário:

In [None]:
len(d)

* É possível obter a __lista de chaves__ de um dicionário:

In [None]:
d.keys()

<a id="dicionario_exemplo"></a>
#### 2.B.c.ii Exemplo biológico

Boa parte da informação em bioinformática é processada no formato de texto, o que torna os dicionários extremamente úteis para representar esse tipo de informação.

Um exemplo é a conveniência de representar o código genético em um dicionário:

In [None]:
gc = {'ATG':'M', 'TGG':'W'} # Códons para os aminoácidos metionina (M) e triptofano (W)
gc['CCC'] = 'P'             # Adicionando um códon de prolina (P)
gc

<a id="condicionais"></a>
## 2.C [Condicionais](#https://docs.python.org/3/tutorial/controlflow.html#if-statements)

Quando preparamos um programa para resolver um problema, é comum que, à medida que a execução do programa avança, tenhamos que lidar com situações que exigem soluções diferentes. 

Nesses casos, é comum usarmos a palavra __`if`__ para definir qual o comportamento do programa em cada situação:

In [None]:
if True:
    print('Considerado "verdadeiro"!')

É importante lembrar que o texto que vem à frente do `if` é sempre avaliado como sendo um valor [booleano](#booleanos), ou seja, examinado e considerado __falso__ ou __verdadeiro__.

No caso do exemplo acima, a função [`print()`](https://docs.python.org/3/library/functions.html#print) será sempre executado, pois o valor à frente do `if` é sempre verdadeiro. 

Usando a palavra `else`, que contrala a execução de código quando o teste avaliado pelo `if` resulta falso: 

In [None]:
if True:
    print('Considerado "verdadeiro"!')
else:
    print('Considerado "falso"!')

Usando a célula abaixo, trocando o `True` por quaisquer outros exemplos de código ou variável para descobrir se o `if` considera o valor como verdadeiro. Por exemplo: `[]`, `'a'`, `['a']`, `1`, `list()`, etc.

In [None]:
if []:
    print('Considerado "verdadeiro"!')
else:
    print('Considerado "falso"!')

>__Nota importante__:
>
> No código acima usamos, pela primeira vez nesse tutoria uma [__indentação__](https://docs.python.org/3/reference/lexical_analysis.html#indentation), ou seja, um conjunto de __quatro espaços__ ou uma __tabulação__ (tecla *Tab*) no começo da linha.
>
>Em Python, as indentações são usadas para definir contextos, ou seja, __conjuntos de linhas__ que são __executados__ apenas nas circuntâncias definidas pela linha que define o bloco.
>
> Outros exemplos de contextos serão introduidos quando tratarmos de [laços](#repeticao) e [funções](#funcoes).

<a id="condicional_exemplo"></a>
#### 2.C.a Exemplo biológico:

Podemos testar se um certo códon está presente no dicionário `gc`:

In [None]:
gc = {'ATG':'M', 'TGG':'W', 'CCC':'P'}
if 'CCA' in gc:
    print(gc['CCA'])
else:
    print("O códon CCA não está no dicionário!")

<a id="repeticao"></a>
## 2.D Repetição (laços)

Uma das características mais úteis da programação é a possibilidade de repetir muitas vezes um procedimento.

Para fazer isso em Python podemos usar as palavras `while` e `for` para definir blocos de códigos que serão executados até que a condição definida não mais se aplique, ou seja, seja __falsa__.

<a id="while"></a>
### 2.D.a [While](https://docs.python.org/3/reference/compound_stmts.html#while)

A palavra `while` opera de forma semelhante ao `if`, pois também precisa de uma indentação para definir quais são as linhas que pertencem ao bloco (mesmo contexto).

A execução das linhas no bloco só para de ser repetida quando o código entre `while` e `:` é avaliado como sendo __falso__:

In [None]:
a = True
while a:
    print('É para repetir isso enquanto "a" for verdadeiro (True)')
    a = False

>__Notas__:
>
>* O código acima, se a linha `a = False` for removida, jamais terminará sua execução, exigindo que a execução do próprio Python seja interrompida.
>
>* A identação correta é essencial para que o Python saiba que a linha `a = False` pertence ao bloco definido pelo `while`. Sem a indentação, no exemplo acima, essa linha jamais seria executada.


Uma forma muito comum de usar um laço `while` é repetir cálulos para um intervalo de números:

In [None]:
i = 0
while i < 10:
    print(i)
    i = i + 1

Quando necesseario, podemos interromper a execução do laço usando `break`:

In [None]:
i = 0
while i < 10:
    print(i)
    if i == 5:
        break
    i = i + 1

Note que o teste no exemplo acima é feito depois da linha `print()`, razão pela qual o número cinco ainda é impresso.

Uma outro recurso útil é a capacidade de pular uma ou mais das repetições mas continuar executando o resto do código depois:

In [None]:
i = 0
while i < 10:
    if i == 5:
        i = i + 1
        continue
    else:
        print(i)
    i = i + 1

 O código acima evitar a impressão do número 5 mas é preciso incrementar o contador quando `i == 5` antes de ordenar a continuação do laço (`continue`) para evitar que a variável de controle (`i`) fique estagnada no número 5 e o laço jamais termine.

<a id="while_exemplo"></a>
#### 2.D.b Exemplo biológico:

Usando o laço `while` podemos extrair os códons de uma sequência de DNA:

In [None]:
s = "ATGAAAAGTGGGCCC"     # Variável que contém a sequência de interesse
i = 0                     # Valor inicial da variável "i"
while i < len(s):         # Cabeçalho do bloco
    print(s[i:i+3])       # Extraindo fatias de três nucleotídeos da sequência "s"
    i = i + 3             # Incrementando "i"

No exemplo acima, `i`:
* Controla o laço, evitando que o código busque texto depois do final da sequência
* Indica a posição de início de cada códon, que começa no zero e tem que incluir três bases

<a id="for"></a>
### 2.D.b For

Outra forma de criar um bloco de código é a palavra `for`, que repete as linhas de código no bloco para cada um dos elementos de uma lista.

In [None]:
x = 0
for x in ['a','b','c','d']:
    print(x)

>__Nota__:
>
>A variável `x`, à qual atribuímos o valor zero (0) antes de executarmos o laço `for`, agora mudou seu valor para `'d'`:

In [None]:
x

Em laços `for` usamos a palavra `in` mas, diferente dos contextos nos quais ela testa a presença de elementos em listas ou chaves em dicionários, `for x in y:` opera atribuindo o valor do __próximo__ elemento de `y` à variável escalar `x`.

Para efeitos práticos, o laço `for` é equivalente a um laço `while` no qual a variável controle (`i` no exemplo da seção anterior) fica oculta e não precisa ser incrementada.

Ou seja, se `y` é algum tipo de dado compatível com laços, como uma lista, o código:

In [None]:
y = "ATGAAAAGTGGGCCC"
for x in y:
    print(x)

é equivalente a

In [None]:
y = "ATGAAAAGTGGGCCC"
i = 0
while i < len(y):
    x = y[i]
    print(x)
    i = i + 1

>__Nota__:
>
>Como esperado, as palavras `continue`, que impede a execução de um laço, e `break`, que interrompe a execução de todos os laços subsequentes, também podem ser usadas em laços `for`.

<a id="for_exemplo"></a>
#### 2.D.b.i Exemplo biológico

Usaremos o laço `for` para achar os resíduos diferentes de duas sequências:

In [None]:
a = 'ATGAAAAGTGGGCCC'
b = 'ATGAAAAGCGGGCCC'
for i in range(0,len(a)):
    if a[i] != b[i]:
        print(f'As sequências diferem por uma mutação na posição {i+1}')

>__Nota__:
>
>[`range()`](https://docs.python.org/3/library/functions.html#func-range) cria todos os valores em um intervalo, nesse caso os números de $0$ a $len(a) - 1$, e o laço `for` processa cada um desses valores, dispensando a necessidade de incrementar explicitamente (`i = i + 1`) a variávei `i`, como seria necessário num laço `while`.

<a id="funcoes"></a>
## 2.E Funções

Funções são um sintaxe conveniente e poderosa para definir blocos de código.

Algumas das principais vantagens de se usar funções para definir blocos são:

* A possibilidade de simplificar a reutilização de código
* Controle sobre a entrada e saída de dados
* Independência das variáveis definidas dentro e fora da função

Para definir uma função usamos a palavra `def`, seguida do nome da função e dos argumentos que ela deve receber, delimitados por parênteses:

In [None]:
def hello(x):
    print(f'Hello {x}!')

hello("Homo sapiens")

No exemplo acima usamos uma das conveniências introduzidas na versão 3 da linguagem Python: a `F-string`.

Uma *F-string* permite intercalar texto e código em Python, bastando que o código dentro da *F-string* apareça dentro de um par de chaves para que ele seja executado antes de a *string* completa ser retornada.

<a id="funcao_exemplo"></a>
#### 2.E.a Exemplo biológico

O código que criamos para extrair códons de uma sequência de DNA parece muito útil.

Vamos convertê-lo em uma função que devolva os códons numa lista:

In [None]:
def get_codons(x):
    c = []
    i = 0                     # Valor inicial da variável "i"
    while i < len(x):         # Cabeçalho do bloco
        c.append(x[i:i+3])    # Extraindo fatias de três nucleotídeos da sequência "s"
        i = i + 3             # Incrementando "i"
    return c

Como na definição de outros blocos, a indentação correta é chave para que o código funcione.

Aplicamos nossa função chamando-a pelo nome com os argumentos que nos interessam:

In [None]:
x = "Definido antes de chamarmos get_codons()"
s = "ATGAAAAGTGGGCCC"
get_codons(s)

Ilustrando a independência de variáveis definidas dentro e fora da função, o valor de `x` definido antes de chamarmos `get_codons()` não é alterado:

In [None]:
x

<a id="objetos"></a>
## 2.F [Objetos e classes](https://docs.python.org/3/reference/datamodel.html#objects-values-and-types)

Objetos são variáveis que

1. Armazenam e dão acesso a dados com estrutura arbitrária, muitas vezes complexa
2. Associam esses dados a funções especializadas, chamadas [métodos](#metodos)

Um objeto pode, por exemplo, ser composto de uma combinação de listas e dicionários voltada para representar objetos reais complexos, como moléculas ou células.

Diferem, portanto, dos tipos de valores definidos pelo própria linguagem e, efetivamente, extendem a linguagem para outros tipos de dados.

Dois conceitos fundamentais são fundamentais para se entender o conceito de objetos em Python: os [métodos]() e [atributos]() de um objeto.

Os métodos e atributos de um objeto são definidos pelo [código Python](#modulos) que implementa sua [classe](https://docs.python.org/3/tutorial/classes.html).

>__Nota__
>
>Em python, todas os valores são objetos de alguma classe.

<a id="atributos"></a>
### 2.F.a Atributos
Atributos são variáveis que permitem o acesso aos dados armazenados no objeto. Um atributo é normalmente acessado usando o nome do objeto e o nome do atributo, unidos por um ponto (`.`).

Para um exemplo simples, consideremos um número real. Em Python, um número real é um objeto da classe `float`:

In [None]:
a = 10.5
a.imag

O atributo `imag`, para objetos da classe `float` e `complex`, corresponde à parte imaginária de um número real, que nesse caso é zero pois $10.5 = 10.5 + 0.0*i$.

<a id="metodos"></a>
### 2.F.b [Métodos](https://docs.python.org/3/library/stdtypes.html#methods)
Métodos são funções atreladas à estrutura de dados contida no objeto e acessíveis somente através do objeto.

Métodos são desenhadas especificamente para trabalhar com os dados armazenados nos atributos de um objeto, sem interferir com outros objetos, da mesma ou de outra classe.

O acesso aos métodos é similar ao dos [atributos](#atributos), ou seja, é feito usando o nome do objeto e o nome do método, unidos por um ponto (`.`). Porém, como são funções, o acesso aos métodos exige o uso de parentêses:

In [None]:
a = 'atgaaaagtgggccc'
a.upper()

<a id="modulos"></a>
### 2.F.c [Módulos](#https://docs.python.org/3/glossary.html#term-module)

Módulos ou pacotes são __arquivos__ contendo código Python.

Módulos podem servir

* Como agregadores de funções relacionadas
* Para definir e organizar classes usando a palavra [`class`](https://docs.python.org/3/reference/compound_stmts.html#class-definitions).

Uma vez carregado pelo Python, um módulo passa a ser tratado como um objeto da classe `modulo` e o acesso a seus métodos e atributos permitem o uso das classes e funcões nele definidas.

Para carregar módulos usamos a palavra `import`:

In [None]:
import math

e podemos ver qual arquivo foi carregado com o atributo especial `__file__`:

In [None]:
math.__file__

e acessar os atributos do módulo:

In [None]:
math.e

e seus métodos:

In [None]:
math.cos(math.pi)

<a id="objeto_exemplo"></a>
#### 2.F.d Exemplo biológico

Como exemplo de utilização de módulos e classes para análise de dados biológicos, consideremos o problema de traduzir a sequência de DNA com a qual vínhamos trabalhando (ATGAAAAGTGGGCCC).

O pacote BioPython inclui classes capazes de traduzir sequências de DNA.

In [None]:
from Bio.Seq import Seq
s = Seq("ATGAAAAGTGGGCCC")
str(s.translate())

O exemplo acima ilustra como o uso de bibliotecas de uso livre, que são abundantes na linguagem Python, permite acelerar a solução de problemas pela reutilização de código contribuído por outros autores.

Esse exemplo será melhor explicado na parte 3 da aula, onde introduzimos as funções básicas do Biopython.

<a id="arquivos"></a>
### 2.G Arquivos

Arquivos podem ser acessados em Python usando a função `open()`.

Essa função constrói um objeto que permite carregar o conteúdo do arquivo na memória do programa:

In [None]:
f = open("t1.tsv", "r")
for r in f:
    print(r)
f.close()

O segundo parâmetro da função `open()` define se o arquivo será aberto somente para leitura (`'r'`), somente para escrita (`'w'`) ou para leitura e escrita (`'rw'`).

Na última linha, seguindo uma boa prática de programação, fechamos o arquivo após terminarmos seu processamento, evitando acumular um grande número de arquivos abertos.


<a id="notas"></a>
## 3. Notas

* A instalação de bibliotecas externas de Python não é necessária nesse curso mas pode ser feita, na maioria dos casos, a partir do [Python Package Index](https://pypi.org/), usando o comando [`pip`](https://docs.python.org/3/installing/index.html#basic-usage).
* Sempre é possível aprender mais sobre um objeto usando o `help()`:

In [None]:
help('Bio.SeqRecord')