# Material/Conteúdo de aula do dia 1

Responsável: Renato A. Corrêa dos Santos

* Cadernos digitais e o Jupyter (no Google Colab)
* Variáveis e tipos de dados
* Operações aritméticas
* Operações lógicas
* Strings e listas (sequências)
* Processos iterativos e estruturas de controle
* Funções básicas e “métodos”
* Dados tabulares (familiarização para o dia 2)

🐤 - indica sugestões de boas práticas.


# Como usar o caderno digital do Google Colab

No Google Colab, à esquerda, você tem acesso à tabela de conteúdo do caderno.

# Variáveis e tipos de dados

Variáveis estão associadas a valores, que por sua vez podem ser de diferentes tipos.

In [None]:
universidade = "Universidade de São Paulo"

## Comentários em códigos de Python

Embora a gente possa adicionar comentários no código utilizando as próprias células do Jupyter notebook, tradicionalmente os comentários são adicionados em códigos de texto plano, que vamos trabalhar no projeto final.

In [None]:
# Este é um comentário e geralmente é utilizado para a documentação de códigos

In [None]:
universidade = "Universidade de São Paulo" # Atribuição de valor a uma variável de Python

In [None]:
universidade

'Universidade de São Paulo'

In [None]:
print(universidade)

Universidade de São Paulo


A função `print()` é também muito usada em códigos de Python fora dos cadernos do Jupyter. No entanto, ela ainda é útil quando você quer imprimir mais de uma linha de código. Veja:

In [None]:
print(universidade)
print(universidade)

Universidade de São Paulo
Universidade de São Paulo


Vamos falar um pouco mais sobre funções mais adiante!

## Regras para nomes de variáveis em Python

Nomes de variáveis em Python podem ter números, letras e "underscores", mas não podem iniciar com números ou ter espaços:

In [None]:
universidade1 = "Universidade Estadual Paulista"

In [None]:
universidade_1 = "Universidade Estadual Paulista"

In [None]:
1universidade = "Universidade Estadual Paulista"

SyntaxError: invalid decimal literal (<ipython-input-12-11e2909fa39c>, line 1)

In [None]:
universidade 1 = "Universidade Estadual Paulista"

SyntaxError: invalid syntax (<ipython-input-13-3448d5a42105>, line 1)

* 🐤 Use nomes sucintos e descritivos para variáveis!
* 🐤 Use preferencialmente um estilo snake case (letras minúsculas separadas por underscore)

## Ordem de execução dos códigos

Atenção: A ordem de atribuição de variáveis importa. Assim, as primeiras células executadas do caderno digital serão avaliadas primeiro CASO o usuário as execute primeiro.

In [None]:
professor = "Renato Augusto"

In [None]:
professor = "Alicia Melo"

In [None]:
professor = "Gustavo Nascimento"

Ao associar valores três vezes ao mesmo nome de variável, o que estará valendo é a último atribuição!

## Linguagem diferença minúsculas e maiúsculas

Vocês provavelmente já perceberam, mas Python é uma linguagem que distingue letras maiúsculas de minúsculas:


In [None]:
Cidade = "Piracicaba"

In [None]:
cidade

NameError: name 'cidade' is not defined

## Erros frequentes em Python

❌ seção incompleta

O "traceback" do interpretador de Python nos ajuda a identificar, sempre que possível, a que está associado nosso erro:

* `SyntaxError`: o interpretador não reconhece determinado trecho como código válido de Python
* `NameError`:

# Operações aritméticas

## Números inteiros

In [None]:
10 + 5 # Soma

15

In [None]:
10 - 5 # Subtração

5

In [None]:
10 * 5 # Multiplicação

50

In [None]:
10 / 5 # Divisão

2.0

In [None]:
10 ** 3 # Expoente

1000

## Precedência

Python segue a ordem de precedência da matemática que aprendemos no ensino fundamental. Também é possível utilizar parênteses para alterar a ordem que as operações devem ser executadas.

In [None]:
10 + 5 * 3

25

In [None]:
(10 + 5) * 3

45

In [None]:
10 + (5 * 3)

25

## _Floats_

Números de ponto flutuante têm um ponto decimal em QUALQUER posição do número (por isso "flutuante")

Notas importantes sobre operações aritméticas:

* Divisões sempre retornam float
* Operações entre inteiros e floats retornam float
*


Curiosidade:
* Números podem apresentar underscores (floats e inteiros) apenas por uma questão de facilitar visualmente a identificação de separação de milhares, por exemplo. Python ignora totalmente os underscores!

In [None]:
numero_de_alunos = 1_000

In [None]:
numero_de_alunos

1000

## Atribuindo valores de múltiplas variáveis

In [None]:
x, y, z = 10, 20, 30

In [None]:
print(x, y, z)

10 20 30


In [None]:
professor1, professor2, professor3 = "Renato Augusto", "Alicia Melo", "Pedro Carvalho"

In [None]:
print(professor1, professor2, professor3)

Renato Augusto Alicia Melo Pedro Carvalho


In [None]:
f"{professor1}, {professor2} e {professor3}"

'Renato Augusto, Alicia Melo e Pedro Carvalho'

In [None]:
print(f"{professor1}, {professor2} e {professor3}")

Renato Augusto, Alicia Melo e Pedro Carvalho


# Operações lógicas

# Strings

Strings são cadeias de caracteres, como sequências de DNA ou RNA:

In [None]:
"ATGCTACGTACATATGGG"

'ATGCTACGTACATATGGG'

In [None]:
nome_professor1 = "renato Augusto"

In [None]:
nome_professor2 = "gustavo nascimento"

In [None]:
nome_professor1

'renato Augusto'

Vimos a função `print()` anteriormente, usada para imprimir valores na tela.

Vamos ver agora algo que chamado de `método`, definida por Matthes como "ação que o Python pode executar em um dado". Métodos têm um ponto que indica que a ação está sendo executada sobre o dado antes do nome do método. Os parênteses podem incluir informações complementares que o método utiliza ao executar uma ação.

In [None]:
nome_professor1.title()

'Renato Augusto'

In [None]:
nome_professor2.title()

'Gustavo Nascimento'

In [None]:
nome_professor1

'renato Augusto'

❌ seção incompleta: melhorar a forma de apresentar dados "mutáveis" e "imutáveis" e rever se em outro momento da atividade teremos oportunidade de discutir este tópico.

Note que usar um método em uma string não significa que aquela variável foi alterada. Strings fazem parte de dados em Python que chamamos de "imutável".

In [None]:
nome_professor1 = nome_professor1.title()

In [None]:
nome_professor1

'Renato Augusto'

Outros exemplos de métodos:

In [None]:
nome_professor1 = nome_professor1.upper()
nome_professor1

'RENATO AUGUSTO'

In [None]:
nome_professor1 = nome_professor1.lower()
nome_professor1

'renato augusto'

## _f-strings_

In [None]:
nome_monitor1 = "Pedro Carvalho"
nome_monitor2 = "Alicia Melo"

É possível usar variáveis dentro de strings:

In [None]:
f"Este curso está sendo ministrado por {nome_professor1} e {nome_professor2}, tendo como monitores os colegas {nome_monitor1} e {nome_monitor2}"

'Este curso está sendo ministrado por renato augusto e gustavo nascimento, tendo como monitores os colegas Pedro Carvalho e Alicia Melo'

Podemos utilizar métodos dentro de f-strings:

In [None]:
f"Este curso está sendo ministrado por {nome_professor1.title()} e {nome_professor2.title()}, tendo como monitores os colegas {nome_monitor1} e {nome_monitor2}"

'Este curso está sendo ministrado por Renato Augusto e Gustavo Nascimento, tendo como monitores os colegas Pedro Carvalho e Alicia Melo'

# Listas

Listas são coleções de objetos em uma ordem específica.

In [None]:
disciplinas = ["Ecologia", "Genética", "Fisiologia", "Bioquímica"]

Para acessar elementos específicos de uma lista em Python, basta utilizar índices. Diferente de R (para quem já tem familiaridade com esta linguagem), índices em Python têm início em zero.

In [None]:
disciplinas[0]

'Ecologia'

In [None]:
disciplinas[3]

'Bioquímica'

In [None]:
disciplinas[4]

IndexError: list index out of range

Como a nossa lista contém apenas strings e nós acessamos cada uma delas com índices, é possível aplicar métodos, como vimos anteriormente:

In [None]:
disciplinas[3].upper()

'BIOQUÍMICA'

Podemos, inclusive, utilizar _f-strings_:

In [None]:
f"A disciplina que eu mais gosto é {disciplinas[3].upper()}"

'A disciplina que eu mais gosto é BIOQUÍMICA'

Podemos acessar os itens da lista de trás para frente:

In [None]:
disciplinas[-1]

'Bioquímica'

In [None]:
disciplinas[-4]

'Ecologia'

## Uma lista dinâmica

Diferentemente de strings, listas são mutáveis e podemos alterar seus elementos:

In [None]:
disciplinas[-1] = "Matemática Aplicada"

In [None]:
disciplinas

['Ecologia', 'Genética', 'Fisiologia', 'Matemática Aplicada']

Assim como strings, listas também têm métodos.
Um deles é `append()`:

In [None]:
disciplinas.append("Bioinformática")

In [None]:
disciplinas

['Ecologia', 'Genética', 'Fisiologia', 'Matemática Aplicada', 'Bioinformática']

Outras atividades:
* Inserir elementos em uma lista (`.insert()`)
* Remover elementos de uma lista (`del`)
* Remover elemento de uma lista e utilizá-lo (`.pop()`)
* Remover um element da lista pelo nome (`.remove()`)

## Ordenando listas


In [4]:
aminoacidos = ["Ser", "Asp", "Tyr", "Leu", "Gly", "Ala", "His", "Val", "Lys", "Pro", "Thr", "Cys"]

In [8]:
print(aminoacidos)

['Ala', 'Asp', 'Cys', 'Gly', 'His', 'Leu', 'Lys', 'Pro', 'Ser', 'Thr', 'Tyr', 'Val']


In [6]:
aminoacidos.sort()

In [7]:
print(aminoacidos)

['Ala', 'Asp', 'Cys', 'Gly', 'His', 'Leu', 'Lys', 'Pro', 'Ser', 'Thr', 'Tyr', 'Val']


Utilizamos muitas vezes os métodos de strings e listas nas atividades de hoje, mas ainda não incluímos informações dentro de parênteses. Vamos utilizar o método `sort()` com um comportamento diferente:

In [9]:
aminoacidos.sort(reverse=True)

In [11]:
print(aminoacidos)

['Val', 'Tyr', 'Thr', 'Ser', 'Pro', 'Lys', 'Leu', 'His', 'Gly', 'Cys', 'Asp', 'Ala']


Lembrem-se que listas são objetos mutáveis e podemos alterar sua composição com o método `.sort()`. No entanto, se se quisermos utilizar a lista ordenada mas sem alterar a lista original?

Existe uma função chamada `sorted()`

In [13]:
sorted(aminoacidos)

['Ala',
 'Asp',
 'Cys',
 'Gly',
 'His',
 'Leu',
 'Lys',
 'Pro',
 'Ser',
 'Thr',
 'Tyr',
 'Val']

Tamanho de uma lista pode ser acessado com a função `len()`:

In [14]:
len(aminoacidos)

12

## Erros frequentes em Python

❌ seção incompleta

O "traceback" do interpretador de Python nos ajuda a identificar, sempre que possível, a que está associado nosso erro:

* `SyntaxError`: o interpretador não reconhece determinado trecho como código válido de Python
* `NameError`:
* `IndexError`:

# Processos iterativos

Suponhamos que a gente queira acessar cada um dos nomes em uma lista de pessoas ou de aminoácidos. Podemos usar o `laço for`:

In [15]:
for aa in aminoacidos:
  print(aa)

Val
Tyr
Thr
Ser
Pro
Lys
Leu
His
Gly
Cys
Asp
Ala


Ao usar o laço loop em Python, devemos atentar para o conceito de identação: para realizar uma ou mais tarefas para cada elemento de uma lista no laço, é necessário adicionar um ou mais espaços ou tabulações antes das linhas de código executadas para este elemento. Acima, nós apenas imprimimos cada um dos aminoácidos, mas é possível realizar outras atividades para cada um deles. Por exemplo:

In [18]:
for aa in aminoacidos:
  print(f"{aa}:")
  print(f"{aa} é um aminoácido.")

Val:
Val é um aminoácido.
Tyr:
Tyr é um aminoácido.
Thr:
Thr é um aminoácido.
Ser:
Ser é um aminoácido.
Pro:
Pro é um aminoácido.
Lys:
Lys é um aminoácido.
Leu:
Leu é um aminoácido.
His:
His é um aminoácido.
Gly:
Gly é um aminoácido.
Cys:
Cys é um aminoácido.
Asp:
Asp é um aminoácido.
Ala:
Ala é um aminoácido.


Podemos realizar uma determinada ação com cada elemento da nossa lista e ainda fazer algo mais, dentro de cada célula ou em um código de Python em script (vamos falar mais sobre isso no terceiro dia).

In [20]:
for aa in aminoacidos:
  print(f"{aa} é um aminoácido.")
print(f"Esses são os {len(aminoacidos)} aminoácidos da nossa lista.") # A linha não identada é "printada" após o laço for

Val é um aminoácido.
Tyr é um aminoácido.
Thr é um aminoácido.
Ser é um aminoácido.
Pro é um aminoácido.
Lys é um aminoácido.
Leu é um aminoácido.
His é um aminoácido.
Gly é um aminoácido.
Cys é um aminoácido.
Asp é um aminoácido.
Ala é um aminoácido.
Esses são os 12 aminoácidos da nossa lista.


In [21]:
for aa in aminoacidos:
print(f"{aa} é um aminoácido.")

IndentationError: expected an indented block after 'for' statement on line 1 (<ipython-input-21-7e542617454d>, line 2)

Em cadernos do Google Colab a gente geralmente não se preocupa com a indentação de códigos pois o prompt faz isso de forma automática. No entanto, é importante atentar para este detalhe quando estamos desenvolvendo códigos em scripts.

## Erros lógicos

❌ seção incompleta (elaborar um pouco mais e talvez apresentar algum exemplo prático)

Muitas vezes, uma indentação errônea de código pode gerar resultados indesejados mesmo que não ocorra um erro de sintaxe!

## Erros frequentes em Python

❌ seção incompleta

O "traceback" do interpretador de Python nos ajuda a identificar, sempre que possível, a que está associado nosso erro:

* `SyntaxError`: o interpretador não reconhece determinado trecho como código válido de Python
* `NameError`:
* `IndexError`:
* `IndentationError`:

# Um pouco mais sobre listas


## Listas numéricas

Como cientistas, muitas vezes as listas de nosso interesse são numéricas, com dados de idade, temperatura, pH, posição genômica, entre muitas outras.

In [23]:
range(1, 5) # Será que vale a pena falar sobre esta função neste curso?

range(1, 5)

Criando uma lista numérica:

In [26]:
list(range(1, 5)) # Talvez também seja complicado explicar a função list() e a função range() juntas... skip!

[1, 2, 3, 4]

In [27]:
list(range(2, 11, 2)) # Talvez seja útil não entrar em detalhes sobre as funções, mas usar para criar listas com números pares e ímpares...

[2, 4, 6, 8, 10]

In [28]:
list(range(1, 10, 2))

[1, 3, 5, 7, 9]

In [35]:
for valor in range(1, 11):
  quadrado = valor ** 2
  print(f"{valor} (valor x valor: {quadrado})")

1 (valor x valor: 1)
2 (valor x valor: 4)
3 (valor x valor: 9)
4 (valor x valor: 16)
5 (valor x valor: 25)
6 (valor x valor: 36)
7 (valor x valor: 49)
8 (valor x valor: 64)
9 (valor x valor: 81)
10 (valor x valor: 100)


Criando uma lista vazia e incluindo os quadrados de cada número no resultado da função `range()`:

In [36]:
lista_quadrados = []

In [37]:
for valor in range(1, 11):
  quadrado = valor ** 2
  print(f"{valor} (valor x valor: {quadrado})")
  lista_quadrados.append(quadrado)

1 (valor x valor: 1)
2 (valor x valor: 4)
3 (valor x valor: 9)
4 (valor x valor: 16)
5 (valor x valor: 25)
6 (valor x valor: 36)
7 (valor x valor: 49)
8 (valor x valor: 64)
9 (valor x valor: 81)
10 (valor x valor: 100)


In [38]:
lista_quadrados

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

## Estatísticas simples

Vamos olhar um pouco para algumas estatísticas em listas. Amanhã exploraremos um pouco mais de dados estatísticos em tabelas (ou dados tabulares), que fazemos como mais frequência como cientistas.


In [39]:
min(lista_quadrados)

1

In [40]:
max(lista_quadrados)

100

In [41]:
sum(lista_quadrados)

385

❌ seção incompleta (gerar a versão definitiva; acredito que os tópicos essenciais aqui depende de conceitos serem ou não abordados posteriormente no curso)

Alguns tópicos muito importantes em listas, mas que não serão abordados neste curso:

* List comprehension

❌ seção incompleta (gerar a versão definitiva; acredito que os tópicos essenciais aqui depende de conceitos serem ou não abordados posteriormente no curso)

Tópicos que TALVEZ sejam abordados:
* Fatiando listas
* Percorrendo listas com laço loop
* Copiando listas

# Estruturas de controle

Alguns exemplos gerais utilizando tópicos abordados no início do curso (listas, números, strings)

## Instruções if

## Verificando igualdades e diferenças

## Comparações numéricas

# Funções básicas e métodos

## Testando múltiplas condições

## Verificando valores em listas

## Verificando se valores NÃO estão em listas

# Dados tabulares

# Referências

* Matthes, Eric. Curso Intensivo de Python: Uma introdução prática e baseada em projetos à programação. Novatec Editora, 2016.