# **Introdução a programação em Python**

---
###### ${Por \ Matheus\ Scaketti\ \& \ Ubiratan\ Batista*}$
###### ${Revisão : \ Raissa\ Melo}$

\* Desenvolvido a partir do material previamente publicado em ["The experience of teaching introductory programming skills to bioscientists in Brazil" (Zuvanov et al., 2021)](https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1009534) [ [GitHub Repository] ](https://github.com/SantosRAC/BrazilianWorkshopPythonForBioData_Zuvanov_etal_2021), com algumas modificações.


Python é uma linguagem de fácil aprendizado e muito potente. Ela pode ser usada em diversas áreas e pode ser utilizada na maiorias das plataformas.

**O que você irá aprender hoje?** Ao final deste dia você poderá utilizar do potencial da linguagem para criar diversos programas/rotinas. *Sua imaginação é o limite*.

Pontos importantes que serão abordados:

*   Particularides da linguagem
*   Variáveis/Objetos
*   Operadores aritméticos
*   Operadores lógicos
*   Ferramentas de controle de fluxo
*   Sequências



---


# **1. Conceitos importantes**

Toda linguagem possui suas características e suas vantagens e desvantagens. Antes de qualquer assunto, é importante que seja aprendido alguns conceitos para que seja possível criar códigos que sejam corretos.

## **1.1. Classes**

As classes são formas de organizar os dados e funcionalidades semelhantes juntas.

*   Representa uma entidade (real ou lógica) do mundo real.
*   Podem conter atributos e funções que manipulam os dados da classe.

Após sua criação é possível gerar instâncias (objetos) dessa mesma classe dependendo do objetivo proposto. Por exemplo:
*   Podemos criar uma classe chamada **```Flor```** e definir atributos como ***comprimento*** e ***largura*** das folhas. Além disso, podemos definir funções que podem ser chamadas para executar alguma determinada ação, como: **```calcula_area()```**.

  <img src='https://raw.githubusercontent.com/brazilpythonws/Updates_BrazilianWorkshopPythonForBiologicalData/main/5thBrazilianWorkshopPythonForBioData_2022/Class_Notebooks/Day1_2022_colab/GIFs/Classes%26Objetos.gif'>
  
  

## **1.2. Objetos**

*   Representa uma instância de uma classe específica.
*   Contêm todos os atributos e funções definidas na classe.
*   Exemplo:
    *   Seguindo a mesma ideia de classe **```Flor```**, podemos criar um objeto chamado **```orquidea```** com seus atributos: ***comprimento e largura*** igual a 4cm e 3cm, respectivamente.

## **1.3. Funções**

*   As funções são rotinas de códigos que executam operações sobre os dados do objeto.

## **1.4. Indentação**

A indentação de código é uma forma de melhorar a visualização e organização do código, definindo melhor sua estrutura.

Diferente de algumas linguagens de programação, a linguagem Python necessita de que o código seja indentado de forma correta, definindo sua estrutura. A indentação é um requisito principal para uma execução sem erros.

Em Python, a indenteção é definida pela inserção do comando **```tab```**.

## **1.5. Comentários**

Uma prática importante para uma melhor documentação do código é a adição de comentários e explicações do que está sendo feito no código. É importante utilizar comentários para outras pessoas ou até mesmo você saiba o que está sendo executado.

Em Python existem duas formas de criar comentários:
* Usando o caractere ```#```: Toda informação após o caractere não será considerado na execução do código.
* Através da combinação ```''' comentário '''```: Toda informação contida entre as aspas não serão consideradas. Este tipo de comentário é útil para realizar comentários de mais de uma linha.

---

#   **2. Variáveis/Objetos**

**Variáveis/Objetos** são espaços de memória capazes de armazenar **dados** que possuem um **tipo** específico, como: números inteiros, números reais ou textos (**```string```**).

A declaração (e sua inicialização) de uma variável ocorre quando o nome é declarado seguido de um valor de atribuição, representado como `=`.

Por exemplo: `<nome_variavel> = <valor>`


In [None]:
obj_a = obj_b = obj_c = obj_d = 5

In [None]:
print(obj_a)
print(obj_b)
print(obj_c)
print(obj_d)

5
5
5
5


Os tipos de dados em Python são diversos, e podem ser divididos em **tipos primitivos** (tipos básicos) e **estruturas de dados mais complexas**

Primeiramente, nos **tipos primitivos** nós temos:

| Tipo    | Valor | Descrição|
|---------|-------|----------|
| int     | número inteiro | Números discretos positivos ou negativos  |
| float   | número real / número de ponto flutuante | Números decimais |
| string  | Textos | Conjunto de caracteres que expressam uma informação textual|
| complex | Números complexos | Números complexos na forma $x+j$       |
| boolean | Valores verdadeiro ou falso | Valores lógicos / Booleanos  |
| null    | Nenhum | Valores nulos                                     |


## **2.1. Objetos do tipo ```int```**:
*   Exemplos de valores que são **int**:
    * 4
    * 5
    * -12
    * 4594

# **2.2. Objetos do tipo ```float```**:
Objetos de ponto flutuante em Python, utilizam **```.```** para separar a parte real da parte flutuante.
*   Exemplos de valores que são **float**:
    * 0.345
    * 10.005
    * -0.312
    * 4.0

*   Ok, acho que temos um erro aqui, como assim o valor 4 é **int** e **float** ao mesmo tempo?

    *   **Resposta**: depende de como estamos tratando o valor 4. Apesar dos dois casos os valores serem iguais, no caso do número **float**, existe uma parte com ponto flutuante (**```.0```**).

# **2.3. Objetos do tipo ```string```**:
Em Python, para representar um valor de tipo **string** é necessário envolver nosso "valor" com aspas simples (**```''```**) ou duplas (**```""```**).
*   Exemplos de valores que são **string**:
    * 'Biologia'
    * '3.14'
    * "Olá"

Note que **'3.14'** é diferente do que somente **3.14**, pois estamos definindo o valor como um conjunto de caracteres que formam o texto.

## **2.4. Nomeando Objetos**:

Os nomes de Objetos e outros conceitos linguísticos devem ser sugestivos, mantendo um padrão e representando o que essa variável está armazendo.

Além disso, existem algumas regras para sua criação:

 * O nome deve representar claramente o dado armazenado:
     * **Correto**: ```ano = 2021```
     * **Errado**: ```k = 2021```
 * Deve iniciar com uma letra e não um número:
     * **Correto**: ```pi = 3.141592```
     * **Errado**: ```3pi = 3.141592```
 * Pode conter _underscore_ (`_`) ou números. Diferente dos números, o _underscore_ pode ser utilizado no início:
     * **Exemplo**: ```_pi1_ = 3.141592```

 * Não pode conter espaços (use o _underscore_ para representar espaços)
     * **Exemplo**: ```primeira_mensagem = "Olá mundo!!!"```
 * Não é possível utilizar palavras reservadas pela linguagem, utilizadas para uso interno ou como nomes de funções
     * **Exemplo**: ```in```
 * Objetos em Python 3 podem ter acentos (mas essa prática **não é recomendada**!)
 * Python 3 é ```case sensitive```, ou seja, caracteres maiúsculos e minúsculos possuem significados distintos

In [None]:
i = 2018
f = 3.14
s = "Biology!"
c = 3+4j
b = True
n = None

In [None]:
n

In [None]:
s

'Biology!'

Ao atribuir um valor (com um certo **tipo**) a uma variável, essa variável passa a ser do **tipo** armazenado.

In [None]:
a=True
print(type(a))
b = 2018
print(type(b))
c = 3.14
print(type(c))

<class 'bool'>
<class 'int'>
<class 'float'>


É importante ressaltar que a atribuição de valor para uma variável em determinado ponto do código sobrescreve a atribuição feita anteriormente para a mesma variável.

In [None]:
b = 2018
print(b)
print(type(b))
b = "Sobrescreve como string"
print(b)
print(type(b))
b = 3.14
print(b)
print(type(b))

2018
<class 'int'>
Sobrescreve como string
<class 'str'>
3.14
<class 'float'>


Ressaltar a diferença entre números inteiros e números de ponto flutuante. Mesmo que tenha um `zero (0)` depois da casa decimal, o tipo ainda é considerado do tipo float:

In [None]:
c = 3.0

In [None]:
print(type(c))

<class 'float'>


In [None]:
c = 3

In [None]:
print(type(c))

<class 'int'>


Vejam também que em Python as casas decimais são separadas **com ponto e não com vírgula**. Além disso, os milhares **não são separados por vírgulas**:

In [None]:
30000000.15

30000000.15

## **2.5. Conversão de tipos de dados**

Em alguns casos, existe a possibilidade de termos um valor ```int```, ```float``` ou ```string``` porém necessitamos de que esse valor seja representado com um tipo de dados diferente. No Python, essas conversões podem ser feitas de uma forma muito simples, utilizando funções específicas.

* A função ```str(x)``` converte o parâmetro ```x``` para uma variável de tipo **string**.
* A função ```int(x)``` converte o parâmetro ```x``` given to an **int**.
* A função ```float(x)``` converte o parâmetro ```x``` given to a **float**.


In [None]:
um = '1'
print(um, type(um))
print(int(um), type(int(um)))

1 <class 'str'>
1 <class 'int'>


In [None]:
um = 1
print(um, type(um))
print(str(um), type(str(um)))

1 <class 'int'>
1 <class 'str'>


In [None]:
pi = 3.1415
print(pi, type(pi))
print(int(pi), type(int(pi)))

3.1415 <class 'float'>
3 <class 'int'>


## **2.6. Composição**

Pode ser usado em casos em que juntar diferentes _strings_ não seja algo tão prático.

Por exemplo, se quisermos indicar o valor de uma determinada variável dentro de uma _string_ maior.

In [None]:
usuario1 = "Joao"
usuario2 = "Maria"
dia = 12

In [None]:
"%s, seu DNA foi sequenciado hoje." % usuario1

print("%s e %s, seu DNA foi sequenciado no dia %d." % (usuario1, usuario2, dia))

Joao e Maria, seu DNA foi sequenciado no dia 12.


O símbolo `%s` é chamado de marcador de posição e indica que ali substituiremos com uma determinada _string_ (`Joao`).

| Marcador  | Tipo              |
|-----------|-------------------|
| %d        | Números inteiros  |
| %s        | Strings           |
| %f        | Números decimais  |

---

#   **3. Operadores aritméticos**

Você pode usar diversas operações aritméticas para realizar calculos e criar fórmulas. Na tabela abaixo apresenta as possiveis operações e seus caracteres na linguagem:

| Operação        | Caractere        |
|-----------------|------------------|
| Soma            | ```+```          |
| Subtração       | ```-```          |
| Multiplicação   | ```*```          |
| Divisão         | ```/```          |
| Divisão Inteira | ```//```         |
| Mod (divisão)   | ```%```          |
| Potenciação     | ```**```         |



In [None]:
soma = 2 + 3.2
soma

5.2

In [None]:
subtracao = 3 - 4
subtracao

In [None]:
multiplicacao = 5 * 11
multiplicacao

In [None]:
divisao = 13 / 5.2
divisao

2.5

In [None]:
divisao_inteira = 13 // 5.2
divisao_inteira

2.0

In [None]:
mod = 103.5 % 10
mod

3.5

In [None]:
potenciacao = 2 ** 10
potenciacao

## **3.1. Prioridade de execução**
Uma informação muito necessária ao organizar fórmulas em Python, é a ordem e forma que digitamos as operações. Assim como na matemática, existe a precedência de execução de cada operação, em que determinada operação terá uma prioridade em relação a outras. Na tabela abaixo é possível verificar essas prioridades:

| Prioridade | Caractere        |
|------------|------------------|
| 1°         | ```()```         |
| 2°         | ```**```         |
| 3°         | ```* /  // %```  |
| 4°         | ```+ -```        |


In [None]:
0.2 + 2 ** (1+9)/5

205.0

No exemplo acima, é possível verificar a ordem de todas as prioridades. Primeiramente é realizado todo calculo dentro dos parenteses. Após isso, o primeiro operador com maior prioridade é o de potenciação, seguido pela divisão e só por último que será realizado a adição.

## **3.2. Módulo *math***

Entender como criar funções e criar scripts complexos é importante. Contudo, nem sempre precisamos reinventar a roda. Em Python, é possível acessar definições e scripts pré-definidos e importar para uso em seu código. Tudo isso é permitido pela utilização de módulos. Um módulo importante a ser considerado é o módulo **```math```**, este que traz consigo diversas funções que manipulam números reais não complexos e facilita o trabalho de quem está programando.

Para importar um módulo é simples, basta adicionar uma linha de código no padrão `import [nome_modulo]`. Após isso basta chamar a função desejada do módulo: `[nome_modulo].[nome_funcao]`. Além disso, para facilitar a escrita e leitura do código, podemos definir um "apelido" para o módulo, basta adicionarmos o apelido no momento de importação do módulo: `import [nome_modulo] as [apelido]`.

Algumas funções que podem ser úteis podem ser encontradas na tabela abaixo:

| Função/Variável | Descrição        |
|------------     |------------------|
| sqrt(x)  | Retorna a raiz quadrada de ```x``` |
| ceil(x)  | Retorna o teto de `x`, sendo o menor inteiro maior ou igual a `x`      |
| floor(x) | Retorna o piso de `x`, sendo o maior inteiro menor ou igual a `x`      |
| pi       | Retorna o valor constante de `pi`  |

In [None]:
import math as mt

In [None]:
mt.sqrt(100)

10.0

In [None]:
mt.floor(23.5)

23

In [None]:
mt.ceil(23.5)

24

In [None]:
mt.pi

3.141592653589793

---

# Exercícios

1. Crie os objetos $num1=1450$ e $num2=198$. Faça a soma desses números, utilizando os nomes dos objetos.

2. Divida cada um desses valores por 2 e armazene os resultados em outros dois vetores ($res1$ e $res2$). Quais são os valores dos novos objetos?

3. Faça o cálculo a seguir $\frac{1,78}{2} + \frac{5,43}{3}$.

4. Calcule a expressão $\frac{(x+y)\times h}{k+a+g} + u$, assumindo que $x=9$, $y=27$, $h=6$, $k=1$, $a=2$, $g=3$ e $u=5$.

In [None]:
num1 = 1450
num2 = 198

res1 = num1/2
res2 = num2/2

print(res1)
print(res2)

725.0
99.0


In [None]:
#As próximas duas células são sugestões de inclusão/alterações no primeiro exercício. Como forma de incluir dados biológicos nos exercicios da aula.

# Exercícios

1. Crie os objetos $num1=1450$ e $num2=198$. Faça a soma desses números, utilizando os nomes dos objetos.

2. Faça o cálculo a seguir $\frac{1,78}{2} + \frac{5,43}{3}$.

3. Calcule a expressão $\frac{(x+y)\times h}{k+a+g} + u$, assumindo que $x=9$, $y=27$, $h=6$, $k=1$, $a=2$, $g=3$ e $u=5$.

4. Numa população de 1000 indivíduos, para o locus Y, temos frequência de 60% do alelo A e 40% do alelo a para uma data característica.
Contabilize nos objetos alelo_dominante e alelo_recessivo o numero de vezes que cada um dos alelos (do par A e a) aparecem na população.

5. Em uma sequencia de dupla fitas de DNA existem 120 pares de nucleotídeos. A porcentagem C-G dessa sequência é de 58,33%. Calcule os números de nucleotídeos de A, T, C e G presentes nesta sequência e os armazene nas variáveis de inteiros qtdA, qtdT, qtdC e qtdG.

In [None]:
#Questão 1
num1 = 1450
num2 = 198
soma = num1 + num2
print(soma)

In [None]:
#Questão 2
calculo = (1.78/2) + (5.43/3)
print(calculo)

In [None]:
#Questao 3
calculo = (((9+27) * 6) / (1 + 2 + 3)) + 5
print(calculo)

41.0


In [None]:
#Questao 4
alelo_dominante = (1000 * 0.6) * 2
alelo_recessivo = (1000 * 0.4) * 2
print(alelo_dominante)
print(alelo_recessivo)

1200.0
800.0


In [None]:
#Questao 5
qtdC = round((120 * 0.5833))
qtdG = qtdC
qtdA = round((240 - (qtdC + qtdG))/2)
qtdT = qtdA
print(qtdC)
print(qtdG)
print(qtdA)
print(qtdT)

70
70
50
50


# 4. Operações lógicas, booleanas e de comparação

## 4.1. Variáveis do tipo lógico

Quando quisermos armazenar um conteúdo simples: `verdadeiro` ou `falso` em uma variável.

In [None]:
resultado = True

In [None]:
aprovado = False

In [None]:
resultado

True

In [None]:
aprovado

False

## 4.2. Operações lógicas, booleanas e de comparação


Operações lógicas, `booleanas` e de comparação são úteis para comparar números, resultados de operações aritméticas e até mesmo _strings_. São aquelas que retornam verdadeiro (**```True```**) ou falso (**```False```**).


A tabela abaixo apresenta as operações de comparação, operações booleanas, bem como seus operadores.


| Tipo de operação | Operação        | Operador        |
| ---------- |-----------------|---------------------|
| Comparação / relacional | Diferença       | ```!=```        |
| Comparação / relacional | Maior que       | ```>```         |
| Comparação / relacional | Maior ou igual a| ```>=```        |
| Comparação / relacional | Menor que       | ```<```         |
| Comparação / relacional | Menor ou igual a| ```<=```        |
| Comparação / relacional | Equivalente a   | ```==```        |
| Booleana / Lógica | Verdadeiro      | ```True```      |
| Booleana / Lógica | Falso           | ```False```     |
| Booleana / Lógica | Negação         | ```not```       |
| Booleana / Lógica | E               | ```and```       |
| Booleana / Lógica | Ou              | ```or```        |

Esses operadores são muito úteis quando estamos trabalhando com estruturas condicionais (`if-then-else` - serão abordadas mais adiante), usadas quando um código precisa decidir qual caminho seguir.

### Tabela-Verdade

Os resultados das operações booleanas (lógicas) podem ser descritos em uma tabela denominada Tabela-Verdade.

|    A    |    B    |    NOT A    |    A AND B    |    A OR B    |
|---------|---------|-------------|---------------|--------------|
| False   | False   |    True     |     False     |     False    |
| False   | True    |    True     |     False     |     True     |
| True    | False   |    False    |     False     |     True     |
| True    | True    |    False    |     True      |     True     |   

In [None]:
1 < 4 < 6

True

In [None]:
5 >= 4

True

In [None]:
2 == 1

False

Usando a operação lógica `or`:

In [None]:
2 < 2 or 5 > 1

True

Usando a operação lógica `not`:

In [None]:
not(1 != 1)

True

Usando a operação lógica `and`:

In [None]:
2 > 1 and 1 <= 2

True

In [None]:
2 < 1 and 1 <= 2

False

Cadeias de caracteres (`strings` - detalhadas mais adiante), também podem ser comparadas:

In [None]:
'actcacactaac' == 'actcacactaac'

True

In [None]:
'actc' == 'actcacactaac'

False

## 4.3. Expressões lógicas

Operadores lógicos e relacionais podem ser utilizados em expressões mais complexas.

In [None]:
True or False and not True

True

In [None]:
True or False and False

True

In [None]:
True or False

True

In [None]:
True

True

In [None]:
# Exemplo misturando os dois tipos de operadores

### Exercícios

Considerando as operações apresentadas nesta seção:

3. Dadas dois objetos que guardam os comprimentos de uma sequência de nucleotídeos codificante (CDS) e de uma proteína (valores numéricos inteiros), verificar se o tamanho da CDS condiz com o comprimento da proteína traduzida (fornecer comandos adicionais).

```python
compr_proteina = 30
compr_cds = 90
compr_proteina2 = 50
compr_cds2 = 160
```

In [None]:
#Exercício
compr_proteina = 30
compr_cds = 90
compr_proteina2 = 50
compr_cds2 = 160

print((compr_cds/3) == compr_proteina)
print((compr_cds2/3) == compr_proteina2)

True
False




---



# **5. Ferramentas de controle de fluxo**

Um programa de computador executa uma sequência de instruções pré-definidas, uma após a outra, para realizar uma determinada tarefa. No entanto, assim como na vida cotidiana, algumas tarefas exigem um cenário um pouco mais elaborado para que o objetivo final seja atingido e comumente, estamos falando de tomada de decisões. Na programação algumas estruturas são chaves para mudar o direcionamento das instruções de um programa com base em condições que devam ser consideradas e satisfeitas.

## **5.1. Estrutura condicional**




Vejamos uma situação onde precisamos atribuir nomes a um grupo de objetos com base em suas características físicas. Estas classificações são frequentemente utilizadas na caracterização de grupos biológicos em diversas áreas, como paisagismo, botânica, taxonomia, etc.:

In [7]:
import IPython
IPython.display.Image(url='https://raw.githubusercontent.com/brazilpythonws/Updates_BrazilianWorkshopPythonForBiologicalData/main/5thBrazilianWorkshopPythonForBioData_2022/Class_Notebooks/Day1_2022_colab/GIFs/Gif1_PT_HighQuality.gif')

Uma forma muito comum de tomarmos decisões (neste caso, classificar um índividuo ou não dentro de um grupo) é ponderarmos uma situação e verificar o que é melhor fazer dependendo do estado atual (neste caso, com base nas características que cada indivíduo apresenta). Assim como na vida, na programação existe uma estrutura capaz de verificar qual caminho tomar caso uma situação seja verdadeira ou falsa.

<img src="https://drive.google.com/uc?id=19wWEcfkhG_8QgOUjji4jtr_YYNNqyX1I" width="300">

Em Python, nós usamos a estrutura condicional ```if-then-else``` para controlar a linha de execução e determinar quais ações devem ser tomadas dada uma condição.

A sintaxe para o ```if-then-else``` é simples.

```
if(<condição>): # Se a condição é verdadeira, então...
    <código>
else: # se não...
    <código>
```

In [None]:
altura = 1.70

In [None]:
if(altura > 1.90):
  print('Você é uma pessoa alta')
else:
  print('Você é uma pessoa baixa')

Você é uma pessoa baixa


Em muitos casos, apenas a utilização de uma condição verdadeira ou falsa não é suficiente. Nesses casos, é preciso verificar mais condições. Para isso, podemos combinar diversos ```if-then-else``` com o uso da estrutura ```if-elif-else```. A palavra ```elif``` é uma expressão na linguagem usada para representar a ideia de "else, if". Sendo assim, podemos usar essa estrutura para melhorar a verificação do exemplo anterior.

In [None]:
if(altura > 1.90):
  print('Você é uma pessoa alta')
else:
  if(altura > 1.50):
    print('Você é uma pessoa mediana')
  else:
    print('Você é uma pessoa baixa')

Você é uma pessoa mediana


In [None]:
if(altura > 1.90):
  print('Você é uma pessoa alta')
elif(altura > 1.50):
  print('Você é uma pessoa mediana')
else:
  print('Você é uma pessoa baixa')

Você é uma pessoa mediana


<img src="">

Caso não seja necessário executar um código caso a condição verificada seja negativa, é possível remover a condição ```else``` da estrutura.

## **5.2. Laços de Repetição**
Muitas vezes, necessitamos fazer uma mesma ação repetidas vezes para atingir um objetivo final. Como por exemplo, coletar uma mesma informação um número definido de vezes.




In [8]:
IPython.display.Image(url='https://raw.githubusercontent.com/brazilpythonws/Updates_BrazilianWorkshopPythonForBiologicalData/main/5thBrazilianWorkshopPythonForBioData_2022/Class_Notebooks/Day1_2022_colab/GIFs/Gif2_PT_HighQuality.gif')

Como na vida real, em programação isso também acontece. Porém, caso seja necessário realizar uma operação diversas vezes, não é necessário duplicar o código em questão. Por xemplo: Vamos supor que por algum motivo, sua máquina não consegue realizar operações de multiplicação, como poderiamos realizar uma conta simples igual a **"```10*5```"**? Simples, basta somar o valor ```5```, ```10``` vezes ou o valor ```10```, ```5``` vezes.

Porém não é agradável digitar ```10+10+10...``` ou ```5+5+5...```. Felizmente, na programação existem estruturas que permitem você executar um comando por *n* vezes.

### **Comando ```For```**

O comando ```for``` é utilizado para iterar sobre uma sequência de elementos, como uma string, uma lista ou uma tupla. Diferente de outras linguagens, o comando for não necessita de um passo de iteração ou uma condição de parada.


Para resolver nosso problema, podemos utilizar o auxílio da função ```range(x)```, na qual retorna uma sequência dependendo do valor recebido de entrada.

In [None]:
multiplicacao_por_soma = 0

# 5 * 10
for i in range(5):
  multiplicacao_por_soma += 10

multiplicacao_por_soma

50

### **Comando ```While```**

Diferente do comando anterior, o comando ```while``` não é utilizado para iteração sobre uma sequência. O comando é usado para executar comandos repetidos enquanto uma determinada condição é verdadeira.

In [9]:
IPython.display.Image(url='https://raw.githubusercontent.com/brazilpythonws/Updates_BrazilianWorkshopPythonForBiologicalData/main/5thBrazilianWorkshopPythonForBioData_2022/Class_Notebooks/Day1_2022_colab/GIFs/Gif3_PT_HighQuality.gif')

In [None]:
#Seguindo a mesma ideia do nosso problema.

multiplicacao_por_soma = 0
i = 1

# 5 * 10
while(i <= 5):
  multiplicacao_por_soma += 10
  i += 1

multiplicacao_por_soma

50

---

#   **6. Sequências**

Sequências são coleções de objetos organizados em uma ordem por posição. A posição de cada elemento é determinada pelo seu **index**.

O Python possui diversos tipos de sequências que podem ser usadas como:
* Strings
* Tuplas
* Listas

Essas estruturas, sendo sequências, possuem operações em comum. A partir disso, é possível resolver inúmeros problemas com essas estruturas simples.

## **6.1. Operações sobre sequências**
Para poder manipular sequências, existem funções que permitem realizar operações sobre essas sequências.

| Operação        | Operador/Função        | Sintaxe            | Descrição        |
|-----------------|-----------------|--------------------|------------------
| "In"            | ```in```        | x ```in``` seq     | Verifica se  `x` está contido na sequência `seq`. Retorna `True`, caso seja verdadeiro e `False` caso contrário|
| "Not in"        | ```not in```    | x ```not in ``` seq | Operação inversa da operação "In"|
| Concatenação    | ```+```         | seq1 ```+``` seq2 | Concatena duas sequências _seq1_ e _seq2_. Retorna o resultado da concatenação |
| Multiplicação   | ```*```         | seq * x          | Multiplica a sequência `seq`,  `x` vezes (`x` sendo um número inteiro) |
| Encontrar o índice| `index()` | ```seq.index(x)```| Retorna o index da primeira ocorrência de `x` na sequência ```seq```|
| Contabiliza elementos total| len() |```len(s)```    | Retorna o tamanho da sequência `s` |
| Contabiliza elementos específico| `count()` | ```seq.count(x)```| Retorna o número de ocorrências de `x` na sequência `seq`|




In [None]:
seq1 = 'atgcgatctagca'
seq2 = 'tcgatcgagtgcata'

In [None]:
seq_concatenado = seq1 + seq2
seq_concatenado

'atgcgatctagcatcgatcgagtgcata'

In [None]:
seq1 = 'atcatcatc'
seq2 = 'atc'

In [None]:
if(seq2 in seq1):
    print("Encontrado!")

Encontrado!


In [None]:
seq3 = 'aac'

In [None]:
if(seq3 in seq1):
    print("Found!")
else:
    print("Not Found!")

Not Found!


In [None]:
seq_pessoas = ['João', 'Maria', 'Lucas']

['Maria', 'Lucas']

In [None]:
seq_pessoas.index('Maria')

1

Perceba que o índice retornado para este exemplo é diferente do que estamos acostumados. No Python, para representar índices, se inicia a sequência com o valor `0`. Portanto, apesar de `'Maria'` estar na segunda posição da sequência, seu índice é o número `1`

In [None]:
len(seq_pessoas)

3

In [None]:
seq_pessoas.count('João')

1

## Exercícios

Considerando as operações aritméticas apresentadas nesta seção:

1. Escreva um código que calcule o número de ligações peptídicas para uma proteína com 20 aminoácidos.

2. Escreva um código que calcule o número esperado de resíduos de aminoácidos na proteína traduzida, para uma sequência codificante de tamanho 330.

In [None]:
numLig = len('MKNKFKTQEELVNHLKTVGF') - 1
numLig

19

In [None]:
a = 'MKNKFKTQEELVNHLKTVGFVFANSEIYNGLANAWDYGPLGVLLKNNLKNLWWKEFVTKQKDVVGLDSAIILNPLVWKASGHLDNFSDPLIDCKNCKARYRADKLIESFDENIHIAENSSNEEFAKVLNDYEISCPTCKQFNWTEIRHFNLMFKTYQGVIEDAKNVVYLRPETAQGIFVNFKNVQRSMRLHLPFGIAQIGKSFRNEITPGNFIFRTREFEQMEIEFFLKEESAYDIFDKYLNQIENWLVSACGLSLNNLRKHEHPKEELSHYSKKTIDFEYNFLHGFSELYGIAYRTNYDLSVHMNLSKKDLTYFDEQTKEKYVPHVIEP'
resAmin = len(a)//3
resAmin

110

# **6.2.1. Slices de sequências**

Uma funcionalidade muito interessante para trabalhar com sequências em geral é permitir que o programador selecione uma determinada sub-sequência de um conjunto de elementos. Para que isso seja possível, é utilizado `[]` e adicionando a posição do índice na sequência. Para os casos de sub-sequências, utiliza-se `:` em conjunto com as posições de início e fim.

O índice do primeiro elemento da sequência começa com 0. Sim, 0, não 1, essa é uma informação **importante**. Sendo assim, podemos acessar os outros índice a partir de `zero` até `tamanho da sequência - 1`.

| Padrão                 | Descrição
|------------------------|----------------------------------------------------------|
| `seq[i]`     | Retorna o valor do elemento no índice `i` |
| `seq[i:j]`   | Retorna a sub-sequência que inicia no índice `i` até `j`|
| `seq[i:j:k]` | Retorna a sub-sequência que inicia no íncide `i` até `j` com um intervalo de `k`|

In [None]:
seq_pessoas = ['João', 'Maria', 'Lucas', 'Roberto']

In [None]:
seq_pessoas[0]

'João'

In [None]:
seq_pessoas[:2]

['João', 'Maria']

In [None]:
seq_pessoas[2:]

['Lucas', 'Roberto']

In [None]:
seq_pessoas[1:3]

['Maria', 'Lucas']

In [None]:
seq_pessoas[::2]

# **6.3. Strings**

As strings são recursos do Python para armazenar informações textuais em geral, permitindo armazenar desde textos simples até coleções de dados representando imagens.

Na bioinformática, strings são importantes, podendo ser usadas para representar DNA, RNA e sequências de proteínas.

**Lembrando:** Para declarar uma string, é possível utilizar dois métodos um com aspas simples (‘ ’) e outro com aspas duplas (“ ”). Isso permite que você utilize uma em conjunto com a outra possibilitando você criar textos com aspas para printar na tela, por exemplo.

Além dos métodos básicos de sequências, as strings também possuem funções específicas que podem ser utilizadas. Ta tabela abaixo são apresentadas as mais comuns.

| Método                             | Descrição
|------------------------------------|----------------------------------------------------------------------------------|
| `s.title()`                    | Retorna uma cópia da _string_ com todas os caracteres iniciais com letra maiúscula |
| `s.lower()`                    | Retorna uma cópia da _string_ com todos seus caracteres com letra minúscula                 |
| `s.upper()`                    | Retorna uma cópia da _string_ com todos os caracteres com letra maiúscula               |
| `s.replace(old_s, new_s)`      | Retorna uma cópia da _string_ com todas as ocorrências de `old_s` substitudo por `new_s` |
| `s.split(sep)`                 | Retorna uma lista com as _strings_ tendo `sep` como delimitador     |



In [None]:
borboleta = 'Danaus plexippus'


In [None]:
borboleta.title()

'Danaus Plexippus'

In [None]:
borboleta.lower()

'danaus plexippus'

In [None]:
borboleta.upper()

'DANAUS PLEXIPPUS'

In [None]:
borboleta.replace('plexippus', 'chrysippus')

'Danaus chrysippus'

In [None]:
borboleta.split()

['Danaus', 'plexippus']



---



# **6.4. Listas**

Uma **lista** é uma coleção ordenada de dados que podem ser de qualquer **tipo** de dado, com tamanho não fixado e que permite manipulação de seus dados. Você pode armazenas uma **lista** de dados do tipo inteiro, ponto flutuante, strings, ou até mesmo um conjunto com outras listas e sequências!

A partir dessa funcionalidade, a lista é uma das estruturas mais versáteis do Python e, assim como _strings_, elas também são **sequências** e, por conta disso, eles possuem todas os métodos de sequência já apresentados.

Por que precisamos de listas?
- Para lidar com grandes conjuntos de dados (sequências de DNA, posições SNP medições de expressão gênica) e processar vários pedaços de dados ao mesmo tempo.

# **6.4.1. Métodos mais comuns**

Como as listas é uma estrutura muito comum para diversas aplicações, lógicamente existem métodos específicos que permitem uma extração de 100% do seu potêncial. Na tabela abaixo são apresentados os métodos que são mais utilizados:

| Método                             | Descrição
|------------------------------------|--------------------------------------------------------------------------|
| `l.append(x)`   | Concatena o elemento `x` na lista `l`           |
| `l.insert(i, x)`| Insere o elemento `x` no índice `i` da lista `l`|
| `l.pop(i)`      | Remove o elemento da lista `l` que é encontrado no índice `i` e o retorna. Se a função não encontrar o índice, o último elemento de `l` é removido |
| `l.remove(x)`   | Remove o elemento `x` da lista `l`              |
| `l.extend(l2)`  | Extende a lista `l` com a lista `l2`            |
| `l.sort()`      | Ordena a lista `l` de forma ascendente          |

In [None]:
# Para fazer uma nova lista, colocamos várias strings ou números entre colchetes, separados por vírgulas:
# Cada item individual em uma lista é chamado de elemento
# O primeiro elemento de uma lista está sempre no índice zero;

# Exemplos de listas:

proteina = []
proteina = ['ALA', 'LYS', 'GLY', 'GLU', 'ALA']
apes = ["Homo sapiens", "Pan troglodytes", "Gorilla gorilla"]
conserved_sites = [24, 56, 132]

In [None]:
lista = ['Danaus affinis', 'Danaus chrysippus', 'Danaus eresimus', 23, 6.93, ['Python', 2017, 2018]]
lista

['Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 23,
 6.93,
 ['Python', 2017, 2018]]

In [None]:
# Para adicionar outro elemento ao final de uma lista existente, podemos usar o método append()
# Muda o original(variável)

lista.append('Danaus eresimus')
lista

['Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 23,
 6.93,
 ['Python', 2017, 2018],
 'Danaus eresimus']

In [None]:
lista.insert(0,'Morpho Menelaus')
lista

['Morpho Menelaus',
 'Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 23,
 6.93,
 ['Python', 2017, 2018],
 'Danaus eresimus']

In [None]:
# Se quisermos adicionar elementos de uma lista ao final de uma lista existente, alterando-a no processo, podemos usar o método extend().
# Leva uma lista como seu argumento, em vez de um único elemento

lista.extend(['Danaus affinis', 'Danaus eresimus'])
lista

['Morpho Menelaus',
 'Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 23,
 6.93,
 ['Python', 2017, 2018],
 'Danaus eresimus',
 'Danaus affinis',
 'Danaus eresimus']

In [None]:
lista.remove(23)
lista.remove(6.93)
lista.remove(['Python', 2017, 2018])
lista

['Morpho Menelaus',
 'Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 'Danaus eresimus',
 'Danaus affinis',
 'Danaus eresimus']

In [None]:
x = lista.pop()
print(x)
lista

Danaus eresimus


['Morpho Menelaus',
 'Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 'Danaus eresimus',
 'Danaus affinis']

In [None]:
#Alterando a ordem dos elementos na lista com sort()
#Por padrão, o Python classifica as strings em ordem alfabética e os números em ordem numérica crescente
lista.sort()
lista

['Danaus affinis',
 'Danaus affinis',
 'Danaus chrysippus',
 'Danaus eresimus',
 'Danaus eresimus',
 'Morpho Menelaus']

In [None]:
lista.count('Danaus affinis')

2

In [None]:
lista.count('Danaus')

0

# **6.4.2. Estatística básica em listas**

Também é possível encontrar algumas funções de estatística básica para serem utilizadas em conjunto com as listas.

In [None]:
sequencia = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [None]:
max(sequencia)

10

In [None]:
min(sequencia)

0

In [None]:
sum(sequencia)

55

# **6.5. Dicionários**

Dicionários são coleções de tipo “_mapping_”, sendo "escrito" como relações `<chave:valor>`. Essas coleções são organizadas por **chave** onde, para cada **chave** existe um valor associado. Elementos em dicionários são acessados pela sua **chave** e não pelo seu índice, como é feito nos casos de outras sequências.

Dicionários também são mutáveis (permitem alteração), assim como as listas.

Por que precisamos de dicionários?

Podemos querer armazenar:

- Nomes de enzimas de restrição de DNA e seus motivos;

- Códons e seus resíduos de aminoácidos associados;

- Nomes de amostra e suas coordenadas;

- Palavras e suas definições

In [None]:
bases = {'A':'Adenine', 'T':'Thymine', 'C':'Cytosine', 'G':'Guanine'}
bases

{'A': 'Adenine', 'T': 'Thymine', 'C': 'Cytosine', 'G': 'Guanine'}

In [None]:
bases = {'A':'Adenine', 'T':'Thymine', 'C':'Cytosine', 'G':'Guanine'}
bases

{'A': 'Adenine', 'T': 'Thymine', 'C': 'Cytosine', 'G': 'Guanine'}

In [None]:
bases['G']

'Guanine'

In [None]:
bases.keys()

dict_keys(['A', 'T', 'C', 'G'])

In [None]:
bases.values()

dict_values(['Adenine', 'Thymine', 'Cytosine', 'Guanine'])