<a href="https://colab.research.google.com/github/rplop/estagio_docencia_ppgsis/blob/main/python_fundamentos_para_biologia.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lógica de programação
* **Decomposição**: dividir o problema em partes menores e mais gerenciáveis;
* **Padronização**: estabelecer regras e convenções que tornem o código mais legível e organizado;
* **Abstração**: simplificar o problema, identificar os elementos essenciais e ocultar os detalhes desnecessários;
* **Algoritmo**: sequência ordenada, finita e objetiva de instruções que leva, passo a passo, à resolução de um determinado problema ou tarefa;

# Linguagem Python
* Linguagem de alto nível;
* Propósito geral;
* Biblioteca padrão vasta e funcional;
* Comunidade bastante ativa e colaborativa;

[Site do Python](https://www.python.org/)

[Manual em português](https://docs.python.org/pt-br/3/)


# Google Colaboratory
* Serviço em nuvem do Google;
* Salvo no seu Drive;
* Texto rico + código;
* Células interativas;
* `Ctrl`+`Enter` para executar a célula selecionada;

[Sobre o Colab](https://colab.research.google.com/notebooks/intro.ipynb)

Testando o Colab...

Vamos escrever nosso primeiro **programa**.

Ele irá _exibir uma mensagem na tela_.

Usaremos a função `print()`, nativa do Python.

In [None]:
print("Olá, mundo!")

Olá, mundo!


In [None]:
# Escreva aqui

_Fazendo de outra maneira..._

Podemos **criar uma variável** e atribuir a ela um valor.

Ou seja, vamos **decompor** o problema, dividi-lo em **etapas menores**.

In [1]:
mensagem="Olá, mundo!"
print(mensagem)

Olá, mundo!


In [None]:
# Escreva aqui

Mas o que são _variáveis_?

# Variáveis e tipos de dados
**Variável** é um elemento que armazena e retém uma informação (dado). Assim, podemos acessar essa informação a partir de um nome atribuído por nós.

Existem vários tipos de valores que podem ser armazenados e referenciados por uma variável:
* Números inteiros (int);
* Números com casa decimal (float);
* Texto (string): sempre resepresentado usando aspas;
* Valores binários (boolean): True/False

Vamos criar uma variável a partir de uma **instrução**.

Instruções são pedaços de código que executam um comando.


In [None]:
x=3
# x é um rótulo que eu escolhi arbitrariamente
# = é um operador de atribuição
# 3 é a informação que eu quero armazenar

A função `type()` mostra o tipo de variável com o qual estamos trabalhando.

In [None]:
print(x)
type(x)

3


int

In [None]:
texto="Isso é uma string"
print(texto)
type(texto)

Isso é uma string


str

Podemos reatribuir o valor de uma variável a qualquer momento.

In [None]:
x=4
print(x)

4


**Strings** são sequências de caracteres, declaradas entre aspas simples ou duplas.

Podemos declarar uma *sequência de DNA* como uma string em Python.

In [44]:
dnaSeq = "actggatctcgatgattgagtcattggatac"

**Operações básicas com strings**

Podemos utilizar **métodos** para realizar operações com as nossas strings. Existe uma sintaxe específica para isso.

In [45]:
dnaSeq = dnaSeq.upper()
print(dnaSeq)

# Neste código, mudamos o valor da variável dnaSeq usando o método upper()
# O ponto indica que o método upper() deve atuar na variável dnaSeq
# Em seguida, exibimos o novo valor da variável


ACTGGATCTCGATGATTGAGTCATTGGATAC


Mais detalhes sobre *strings* [documentação oficial do Python](https://docs.python.org/pt-br/3/tutorial/introduction.html#strings).

**Int** e **Float** são tipos de dados númericos.

Operações em Python respeitam as regras algébricas.

In [2]:
# Adição
print(1+2)

# Subtração
print(6-2)

# Multiplicação
print(2*4)

# Divisão
print(8/2)

3
4
8
4.0


Mais detalhes sobre *dados númericos* na [documentação oficial do Python](https://docs.python.org/pt-br/3/tutorial/introduction.html#numbers).

# Listas

**Listas** são coleções ordenadas de itens.

Elas permitem o armazenamento de várias informações.

No Python, indicamos que um objeto é uma lista usando `[]` (colchetes).



Vamos criar uma lista contendo os **nucleotídeos presentes no DNA**.

No nosso código, vamos representar os nucleotídeos pela **bases nitrogenadas** associada.

In [4]:
# Escreva aqui

Podemos acessar os elementos de uma lista, informando o **índice** (posição) deles.

In [10]:
# Mude o valor dentro dos colchetes e execute a célula novamente
print(nucleotideos[0])

A


Mais detalhes sobre *listas* na [documentação oficial do Python](https://docs.python.org/pt-br/3/tutorial/introduction.html#lists).

# Dicionários

**Dicionários** são estruturas de dados no formato *chave:valor*.

Criamos dicionários utilizando `{}` (chaves).

O valor pode ser um número, uma string, uma lista ou até mesmo outro dicionário.

In [18]:
# Exemplo
dict_elefante = {"scientific_name":"Loxodonta africana",
                "phylum":"CHORDATA",
                "class":"MAMMALIA",
                "order":"PROBOSCIDEA",
                "family":"ELEPHANTIDAE",
                "genus":"Loxodonta",
                "main_common_name":"African Savanna Elephant"}

Vamos criar um dicionário com as **bases complementares do DNA**.

In [None]:
# Escreva aqui

Mais detalhes sobre *dicionários* na [documentação oficial do Python](https://docs.python.org/pt-br/3/tutorial/datastructures.html#dictionaries).

# Laços de repetição

Ao escrever programas é comum que precisemos executar o mesmo comando *várias vezes*.

O que fazer? Escrever as mesmas linhas de código repetidas vezes?

In [None]:
print(nucleotideos[0])
print(nucleotideos[1])
print(nucleotideos[2])
print(nucleotideos[3])

A
C
G
T


Um método mais otimizado e eficiente utiliza **loops** ou **laços de repetição**.

In [11]:
# Exemplo utilizando o loop for
for i in nucleotideos:
  print(i)

A
C
G
T


O laço `for` nos permite percorrer *um a um* os itens de uma lista.

In [38]:
# Retomando nossa sequência de DNA
print(dnaSeq)

ACTGGATCTCGATGATTGAGTCATTGGATGC


Vamos escrever um código que printe **todos os nucleotídeos dessa sequência**, um por vez.

In [26]:
# Escreva aqui

Podemos usar o loop for para realizar operações com os itens da lista.

# Estruturas condicionais

Programas precisam tomar decisões...

As **estruturas condicionais** são a maneira como um programa pode tomar uma decisão a partir da observação de um conjunto de condições.

As instrução `if` e `else` são usadas em Python para testar condições.

In [49]:
# Retomando nossa sequência de DNA
print(dnaSeq)

ACTGGATCTCGATGATTGAGTCATTGGATAC


In [46]:
if dnaSeq.endswith("TAC"):
  print("Sim! A sequência termina com TAC.")
else:
  print("Não! A sequência não termina com o códon TAC.")

Sim! A sequência termina com TAC.


In [62]:
dnaSeq2 = "CCCTGA"

In [59]:

if dnaSeq2.endswith("TAC"):
  print("Sim! A sequência termina com o códon TAC.")
else:
  print("Não! A sequência não termina com o códon TAC.")

Não! A sequência não termina com o códon TAC.


Testando condições númericas...

In [56]:
tamanho_seq = len(dnaSeq)

if tamanho_seq > 10:
  print("A sequência tem mais de 10 nucleotídeos.")
else:
  print("A sequência tem menos de 10 nucleotídeos.")

A sequência tem mais de 10 nucleotídeos.


Testando para a sequência 2...

In [64]:
tamanho_seq2 = len(dnaSeq2)

if tamanho_seq2 > 10:
  print("A sequência tem mais de 10 nucleotídeos.")
else:
  print("A sequência tem menos de 10 nucleotídeos.")

A sequência tem menos de 10 nucleotídeos.


Obs: ao declarar uma condição `if`, sempre devemos usar `:` (dois pontos) ao final.

Obs2: as estruturas condicionais requerem a **indentação** do blocos de código.

# Desafio

Vamos representar a estrutura do DNA em um código e criar um conjunto de ferramentas para fazer manipulações básicas com sequências de DNA.

**Quais são as etapas?**