# Caderno dia 1

# Comentários em python

Os comentários em python apresentam 3 finalidades principais. São elas:

*   Explicar o código
*   Facilitar a leitura e organização do script
*   Impedir a excução de certas linhas do código (útil principalmente para testes)

Eles são iniciados por "#" e podem ser colocados no início das linhas ou na frente do código. Tudo o que vier depois de "#" não será executado. Para comentários de mais de uma linha, usamos três aspas simples ( ''' ) no começo e final do que se deseja comentar.

In [None]:
# explicar a finalidade do bloco de código é uma maneira de facilitar sua leitura

print("Hello, World!") # comentários na frente do código podem explicar sua função

# comentar um código impede a execução da linha
# print("Hello, World!")

'''
Comentários que usam mais de uma linha
podem ser escritos
entre 3 aspas simples
'''

"""
Comentários que usam mais de uma linha
podem ser escritos
entre 3 aspas duplas
"""

Hello, World!


'\nComentários que usam mais de uma linha \npodem ser escritos \nentre 3 aspas simples\n'

### Ajuda em python

In [None]:
nome_cientifico = "Saccharum officinarum"

In [None]:
help(type(nome_cientifico))

# Variáveis e nomeação de variáveis

* Variáveis são espaços na memória que recebem um nome, onde podem ser armazenadas uma ou mais informações.
* Como o nome indica, o conteúdo das "variáveis" varia.
* Para atribuir um valor ou um elemento a uma variável utiliza-se o símbolo de atribuição em Python: "="

In [None]:
primeira_variavel = 'I Workshop de Python para Dados de Biologia Vegetal'

vendo o conteúdo de uma variável

In [None]:
primeira_variavel

'I Workshop de Python para Dados de Biologia Vegetal'

### Nomeação de variáveis

Há um documento bastante conhecido que apresenta as convenções para programação em Python chamado `PEP8` (vejam [aqui](https://www.python.org/dev/peps/pep-0008/)).

Vamos seguir as seguintes convenções para nomeação de varíaveis:
 * todas as letras são minúsculas
 * os nomes de variáveis devem ser DESCRITIVOS (`genero_bacteria = Streptoccocus` é mais descritivo que `microbio = Streptoccocus` ou `a = Streptococcus`)
 * Se houver mais de uma palavra na composição do nome da variável, elas deverão ser separadas por `_ ` :

In [None]:
nome_do_workshop = 'I Workshop de Python para Dados de Biologia Vegetal'
nome_do_workshop

In [None]:
# Nome possível, mas não segue as instruções do PEP8
Familia = "Brassicaceae"

In [None]:
# Nome possível e seguindo o PEP8
familia = "Brassicaceae"

In [None]:
# Nome possível e seguindo o PEP8
familia_planta_modelo = "Brassicaceae"

Além disso, as os nomes das variáveis também devem:
* começar com letras ou `_`
* não apresentar simbolos que não sejam letras ou números
* começar com letras

e podem ter números e letras



In [None]:
# Se começar com outro simbolo, o código retorna um erro

# 2variavel = "erro"
# $variavel = "erro"


# Se apresentar um símbolo que não é uma letra ou número

# arroz&feijao = "erro


'Brassicaceae'

### Tipos de variáveis

As variáveis em Python sempre recebem um tipo (por isso se diz que variáveis em Python são "tipadas"), mas não é preciso declarar os tipos na hora de definir uma variável, pois o Interpretador de Python faz isso automaticamente.

Os tipos de variáveis se dividem em variáveis simples e compostas. As variáveis simples são:
1. **Inteiro (int):**
2. **Ponto Flutuante ou Decimal (float)**
3. **String (str)**
4. **Boolean (bool)**

E as variáveis compostas são:

1. **Tuplas (tuple)**
2. **Listas (list)**
3. **Dicionários (dict)**

💻 Para saber o tipo de uma variável se usa o código: `type("nome_da_variavel")`

In [None]:
# Para saber o tipo da variável
primeira_variavel = 'I Workshop de Python para Dados de Biologia Vegetal'
type(primeira_variavel)

str

### Palavras reservadas

Existem componentes da linguagem que já possuem um significado determinado e que não podem ser redefinidas, por isso os nomes desses componentes não podem ser usadas com outras finalidades (como para dar nomes às variáveis, por exemplo)

Essas palavras são:

* and
* as
* assert
* break
* class
* continue
* def
* del
* elif
* else
* except
* False
* True
* finally
* for
* from
* global
* if
* import
* in
* is
* lambda
* None
* nonlocal
* not
* or
* pass
* raise
* return
* try
* while
* with
* yield

A lista é longa, mas nẽo é preciso decorá-la, as palavras reservadas normalmente ficam ressaltadas com uma coloração diferente, indicando que essas palavras tem um significado especial.


In [None]:
# class de classe é uma palavra com um significado biológico reservada em Python e que por isso não pode ser usada como nome de objetos
# class = "Dicotyledons"

### Mutabilidade de variáveis

As variáveis, variam.

In [None]:
a = 1

In [None]:
b = a
b

1

In [None]:
a = 2
a

2

In [None]:
b

1

# Strings

Strings em python são uma sequência de caracteres em uma determinada ordem.

Elas são usadas geralmente para representar palavras, frases e textos.

In [None]:
"Arabidopsis thaliana"

'Arabidopsis thaliana'

In [None]:
planta_modelo = 'Arabidopsis thaliana'

In [None]:
planta_modelo

'Arabidopsis thaliana'

Strings também aceitam números, mas eles são interpretados como texto

In [None]:
altura_planta = "19"

In [None]:
altura_planta

'19'

In [None]:
a = "10"
b = "15"

a + b

'1015'

### Manipulando textos

Cada caractere em uma string recebe um índice (index) começando em 0 e indo até o último caractere. Por exemplo, a string `"Arabidopsis thaliana"` tem comprimento de 20, como pode ser obtido pela função `len()`, então os índices vão de 0-19, sendo 0 a primeira letra e 19 a última.

💭 Então, se as variáveis são espaços na memória, os caracteres seriam micro-espaços na memória que recebem valores de 0 até`(len()-1)`

In [None]:
planta_modelo = "Arabidopsis thaliana"

'r'

In [None]:
len(planta_modelo)

20

In [None]:
print(planta_modelo[0]) # Primeiro caractere
print(planta_modelo[19]) # último caractere

A
a


In [None]:
ultimo_caractere = len(planta_modelo)-1
planta_modelo[ultimo_caractere]

'a'

Outra maneira de representar o último caractere é usar os índices negativos, neles o último caractere recebe index `-1` e vai diminuindo até chegar na primeira letra. Então para a string `"Arabidopsis thaliana"`, o último caractere recebe index -1 e o primeiro -20.

In [None]:
planta_modelo = "Arabidopsis thaliana"

In [None]:
print(planta_modelo[-20]) # Primeiro caractere
print(planta_modelo[-1]) # último caractere

A
a


**Fatiamento**
- Esse processo de pegar um caractere dentro da string também pode ser conhecido como "fatiamento", entretanto o fatiamento não para ai: Além de pegar um caractere, ele também pode ser usado para pegar partes da string usando intervalos dentro dos []

- Em Python intervalos (range) contínuos são representados pelo número do começo e do final separados por dois pontos :. Entretanto, vale lembrar que em Python o valor final é excludente, ou seja, não entra no intervalo.

*Exemplo:*  `3:6 == [3, 4, 5]`, repare que o 6 não entra no intervalo.

In [None]:
planta_modelo = "Arabidopsis thaliana"

20

In [None]:
planta_modelo[1:2]

'r'

In [None]:
planta_modelo[10:15]

's tha'

In [None]:
planta_modelo[0:11]

In [None]:
planta_modelo[0:20]

'Arabidopsis thaliana'

No último exemplo o range começou no primeiro caractere e terminou no último, ou seja, pegou a string inteira, mas como os valores das variáveis pode mudar, se o novo valor possuir um tamanho diferente, essa seleção vai falhar:

In [None]:
planta_modelo = "Arabidopsis thaliana"
planta_modelo[0:20]

'Arabidopsis thaliana'

In [None]:
planta_modelo = "Saccharum officinarum"
planta_modelo[0:20] # Fica faltando o último "m"

'Saccharum officinaru'

Para evitar esse erro, uma maneira de selecionar toda a string sem informar um intervalo deinido é deixar apenas os dois pontos : como range, isso significa vai do começo `__: `até o final `:__`.

Consequentemente, se quiser pegar um intervalo de começe em alguma parte da string e vá até o final basta indicar a posição de início e não informar o final (O mesmo vale para o oposto, se quiser começar no início e ir até certo ponto basta usar `__:n`para n o index da posição final).

In [None]:
planta_modelo = "Arabidopsis thaliana"
planta_modelo[:]

'Arabidopsis thaliana'

In [None]:
planta_modelo = "Saccharum officinarum"
planta_modelo[:]

'Saccharum officinarum'

In [None]:
planta_modelo[10:]

'officinarum'

In [None]:
planta_modelo[:4]

'Sacc'

**Análise da string**

Algumas funções que permitem fazer a análise das strings são:
* `len(variavel)`: Que retorna a quantidade dde caracteres começando a contar em 1.
* `variavel.count("elemento")`: Que conta a quantidade de vezes que o elemento apareceu na variável, fazendo a distinção de maiúsculas e minúsculas.
* `variavel.find("elemento")`: Que retorna o index em que o elemento iniciou
* `"Elemento" in variavel`: Que retorna um True (se o elemento estiver na variável) ou Falso (se o elemento não tiver na variável)

In [None]:
planta_modelo = "Arabidopsis thaliana"

In [None]:
len(planta_modelo)

20

In [None]:
planta_modelo.count("s")

2

In [None]:
# Se depois do elemento colocar um intervalo separado por vígula na função .count ele conta apenas em um intervalo
planta_modelo.count("s", 0, 5) # 0:5 = Arabi

0

In [None]:
planta_modelo.find("psis")

7

In [None]:
# Se o find retornar "-1", significa que o elemento não está na string
planta_modelo.find("Fruto")

-1

In [None]:
"psis" in planta_modelo

True

In [None]:
"Fruto" in planta_modelo

False

**Transformação da string**

Elementos e caracteres nas strings podem ser alterados com o uso de:

* ` variavel.replace("elemento", "novo_elemento")`: Em que troca todos os valores "elemento" na variavel por "novo_elemento", mas sem mudar o valor da variável diretamente.


In [None]:
planta_modelo.replace('thaliana', 'arenosa')
planta_modelo

'Arabidopsis thaliana'

In [None]:
print(planta_modelo.replace('thaliana', 'arenosa'))

Arabidopsis arenosa


In [None]:
planta_modelo = planta_modelo.replace('thaliana', 'arenosa')
planta_modelo

'Arabidopsis arenosa'

* `.upper()` e `.lower()`: Deixa toda a string com letra maiúscula ou minúscula, respectivamente.
* `.capitalize()` e `.title()`: Que deixa a primeira letra da string maiúscula e deixa as primeiras letras de todas as palavras em maiúscula, respectivamente


In [None]:
planta_modelo.upper()

'ARABIDOPSIS ARENOSA'

In [None]:
planta_modelo.lower()

'arabidopsis arenosa'

In [None]:
planta_modelo.capitalize() # bom para nome de espécie

'Arabidopsis arenosa'

In [None]:
planta_modelo.title()

'Arabidopsis Arenosa'

* `.strip()`, `.lstrip()` e `.rstrip()`: Retira todos os espaços do começo e final das strings, retira espaços da esquerda (left - começo) e retira espaços da direita (right - final) da string, respectivamente

In [None]:
planta_modelo = "      Arabidopsis thaliana     "


In [None]:
planta_modelo.strip()

'Arabidopsis thaliana'

In [None]:
planta_modelo.lstrip()

'Arabidopsis thaliana     '

In [None]:
planta_modelo.rstrip()

'      Arabidopsis thaliana'

**Divisão da string**

As strings podem ser divididas com o uso de:

* `.split()`: Que divide as strings nos simbolos apresentado dentro dos (), se não tiver nenhum símbolo, ele usa os espaços como padrão


In [None]:
planta_modelo = "Arabidopsis thaliana"


In [None]:
planta_modelo_separada = planta_modelo.split()
planta_modelo_separada

['Arabidopsis', 'thaliana']

**Junção da string**

As strings podem ser unidas com o uso de:

* `separador.join(variavel)`: Que une strings da variável separadas usando o separador indicado


In [None]:
'-'.join(planta_modelo_separada )

'Arabidopsis-thaliana'

# Inteiros e float

**Inteiros** são números (algarismos) positivos e negativos sem decimais, se referindo ao conjunto dos números inteiros (`ℤ = {..., - 3, - 2, - 1, 0, 1, 2, 3,...}`)

**Float** são números (algarismos) positivos e negativos com decimais.


In [None]:
variavel_inteiro = 1
variavel_inteiro

1

In [None]:
variavel_float = 1.7
variavel_float

1.7

In [None]:
# Em Python qualquer valor indicado com . é float, mesmo que ele seja inteiro
variavel_float = 1.0
variavel_float

1.0

Por serem variáveis numéricas, os inteiros e os float podem ser usados em contas e cálculos dentro de Python, para isso são necessários os operadores e a ordem de procedência.

# Operadores

Os operadores em python são:

1. operadores aritiméticos;
2. operadores de atribuição;
3. operadores de comparação;
4. operadores lógicos;
5. operadores de identidade; e
6. operadores de associação.


### Operadores aririméticos

* `+`: Operador de adição e de indicação de valor positivo
* `-`: Operador de subtração e de indicação de valor negativo
* `*`: Operador de multiplicação
* `/`: Operador de divisão
* `//`: Operador de divisão inteira, aquela que retorna apenas a parte inteira da divisão, ignorando os decimais
* `%`: Operador de módulo, aquele que retorna o resto da divisão
* `**`: Operador de exponenciação

In [None]:
10+3

13

In [None]:
10-3

7

In [None]:
10*3

30

In [None]:
10/3

3.3333333333333335

In [None]:
10//3

3

In [None]:
10%3

1

In [None]:
10**3

1000

In [None]:
# É possível fazer essas operações entre inteiros e float, sendo que o resultado sempre será um float
a = 1.0
b = 2

a % b

1.0

### Operadores de atribuição


* `=`: Operador de atribuição

A ideia geral dos próximos operadores é encurtar expressões como `x = x + 1 `, para se utilizar o `x` apenas uma vez fazendo `x += 1`

* `+=`: para adicionar ao valor da variável
* `-=`: para subtrair ao valor da variável
* `*=`: para multiplicação ao valor da variável
* `/=`: para divisão ao valor da variável
* `%=`: para dar o módulo ao valor da variável




In [None]:
x = 10

In [None]:
x = 10
x += 3
x

19

In [None]:
x = 10
x -= 3
x

7

In [None]:
x = 10
x *= 3
x

30

In [None]:
x = 10
x /= 3
x

3.3333333333333335

In [None]:
x = 10
x %= 3
x

1

### Operadores de comparação
esses operadores retornam como resultado True (para comparação verdeira) ou False (para comparação falsa)

* `>`: maior que
* `<`: menor que
* `==`: igual a
* `!=`: difernente de
* `>=`: maior ou igual a
* `<=`: menor ou igual a








In [None]:
a = 10
b = 3

In [None]:
a > b

True

In [None]:
a < b

False

In [None]:
a == b

False

In [None]:
a != b

True

In [None]:
a >= b

True

In [None]:
a <= b

False

### Operadores lógicos

* `and`: retorna True se _todas_ as condições forem verdadeiras
* `or`: retorna True se _ao menos uma_ das condições for verdadeira
* `not`: inverte o resultado, se o resultado da operação for verdadeiro, ele retorna falso

In [None]:
# A média das alturas das árvores na Amazônia é 45m
angelim_vermelho = 85.44
tomateiro = 2



In [None]:
# As plantas são maiores ou iguais a média da Amazônia
angelim_vermelho >= 45 and tomateiro >= 45

False

In [None]:
# Ao menos uma das plantas é maior que a média da Amazônia
angelim_vermelho >= 45 or tomateiro >= 45

True

In [None]:
# Inverte o resultado
not angelim_vermelho >= 45 or tomateiro >= 45

False

### Operador de identidade

* `is`: retorna True se as variáveis possuírem o mesmo
* `is not`: retorna True se as variáveis _não_ possuírem o mesmo valor

In [None]:
maior_arvore_amazonia = "angelim vermelho"
planta_modelo = "Arabidopsis thaliana"

In [None]:
maior_arvore_amazonia is planta_modelo

False

In [None]:
maior_arvore_amazonia is not planta_modelo

True

### Operadores de associação

* `in`: retorna True caso o valor esteja na sequência
* `not in`: retorna True caso o valor _não_ esteja na sequência


In [None]:
"Arabidopsis thaliana" in planta_modelo

True

In [None]:
"angelim vermelho" in planta_modelo

False

In [None]:
"angelim vermelho" not in planta_modelo


True

# Ordem de procedência

A ordem de procedência em Python segue a mesma convenção usada na matemática, isto é da maior para a menor procesência:

parênteses > exponenciação > multiplicação e divisão > adição e subtração

Sendo que para aqueles operadores com a mesma ordem de procedêcia a preferência é dada da direita para a esquerda, ou seja, a operação mais a direita tem a maior procedência.

In [None]:
2*(3-1)

4

In [None]:
2*3-1

5

In [None]:
10 / 2 * 2

10.0

In [None]:
10 / (2 * 2)

2.5

a ordem da direita para a esquerda só muda para diversas exponenciações juntas, que começam da esquerda  para a direita

In [None]:
2**3**2

512

In [None]:
2**(3**2)

512

In [None]:
(2**3)**2

64

In [None]:
2**3**2**3

1142356221737793743283481756486439105492181347607440318620287618630719470875915662019281573685695316078270462532079879948049378578353907147530818155895840988613918050776625574526883529564511731350433881926374032688332546457426755549620769428586957231464831651432921593012275157146431886225597936977286944214081623051215720172928118415772138687731430382795105524352709730894410749619582727395293560467726776607154653344689069748325520783793046278268417214857568022519720348777990549245307563007235878967239853404657432739248617369401613412255775972622651500848679828690159246202719195699050229683682647690402306373009376735213034424201965620226088889202645389546822920698807192029500887337968244655336992489435007048889170201007854170822579523483909521108909770911216208512009764733812213983322811060008298939259133843377761654405368479964650041306977068708658148713750248565274771452944193619618600322917775706796412033023123204096385880883918428954822560503117027658771871504304640715953595962621105

In [None]:
2**(3**(2**3))

1142356221737793743283481756486439105492181347607440318620287618630719470875915662019281573685695316078270462532079879948049378578353907147530818155895840988613918050776625574526883529564511731350433881926374032688332546457426755549620769428586957231464831651432921593012275157146431886225597936977286944214081623051215720172928118415772138687731430382795105524352709730894410749619582727395293560467726776607154653344689069748325520783793046278268417214857568022519720348777990549245307563007235878967239853404657432739248617369401613412255775972622651500848679828690159246202719195699050229683682647690402306373009376735213034424201965620226088889202645389546822920698807192029500887337968244655336992489435007048889170201007854170822579523483909521108909770911216208512009764733812213983322811060008298939259133843377761654405368479964650041306977068708658148713750248565274771452944193619618600322917775706796412033023123204096385880883918428954822560503117027658771871504304640715953595962621105

#### Listas

In [None]:
[]

[]

In [None]:
vochysiaceae = []

In [None]:
vochysiaceae = ['Qualea', 'Vochysia', 'Callisthene', 'Salvertia']

#### Funções comuns a sequências

 * Acesso a sublistas usando índices
 * Funções (len, )


In [None]:
vochysiaceae[0]

'Qualea'

In [None]:
vochysiaceae[1]

'vochysia'

In [None]:
vochysiaceae[-1]

'ruizterania'

In [None]:
len(vochysiaceae)

5

In [None]:
'Vochysia' in vochysiaceae

True

In [None]:
"Saccharum" in vochysiaceae

False

In [None]:
"Saccharum" not in vochysiaceae

True

In [None]:
'Ruizterania' in vochysiaceae

False

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma']

In [None]:
vochysiaceae + ['Erisma']

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma']

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia']

In [None]:
vochysiaceae = vochysiaceae + ['Erisma']

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma']

#### Métodos para manipulação de listas

In [None]:
vochysiaceae.append('Ruizterania')

In [None]:
vochysiaceae.append('Saccharum')

In [None]:
vochysiaceae

['Qualea',
 'Vochysia',
 'Callisthene',
 'Salvertia',
 'Erisma',
 'Ruizterania',
 'Saccharum']

In [None]:
vochysiaceae.count('Qualea')

1

In [None]:
vochysiaceae.remove('Saccharum')

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania']

In [None]:
vochysiaceae.append('Saccharum')

In [None]:
vochysiaceae.pop()

'Salvertia'

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene']

In [None]:
vochysiaceae.pop(1)

'Vochysia'

In [None]:
vochysiaceae

['Qualea', 'Callisthene']

In [None]:
vochysiaceae = ['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma',
                'Ruizterania']

In [None]:
vochysiaceae.append(['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania'])

In [None]:
vochysiaceae.pop()

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania']

In [None]:
vochysiaceae

[]

In [None]:
vochysiaceae.extend(['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania'])

In [None]:
vochysiaceae

['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania']

In [None]:
vochysiaceae.append("Luá")

In [None]:
vochysiaceae.append()

['Qualea',
 'Vochysia',
 'Callisthene',
 'Salvertia',
 'Erisma',
 'Ruizterania',
 'Luá']

In [None]:
vochysiaceae.insert(2, 'Callisthene')

In [None]:
vochysiaceae

['Qualea',
 'Vochysia',
 'Callisthene',
 'Callisthene',
 'Salvertia',
 'Erisma',
 'Ruizterania',
 'Luá']

In [None]:
vochysiaceae.index('Callisthene')

2

In [None]:
for genus in ['Qualea', 'Vochysia', 'Callisthene', 'Salvertia', 'Erisma', 'Ruizterania']:
    if vochysiaceae.count(genus) > 1:
        index2remove = vochysiaceae.index('Callisthene')
        vochysiaceae.pop(index2remove)

#### Dicionários

In [None]:
tipos_orgaos = {}

In [None]:
type(tipos_orgaos)

dict

In [None]:
tipos_orgaos

In [None]:
tipos_orgaos = {
 'raiz': ['adventicia', 'pivotante'],
 'caule': 'aéreo',
 'folhas': 'opostas',
}

In [None]:
tipos_orgaos['flor'] = ['petala', 'sepala']

In [None]:
tipos_orgaos

{'caule': 'tortuoso',
 'flor': ['petala', 'sepala'],
 'folhas': 'opostas',
 'raiz': ['adventicia', 'pivotante']}

In [None]:
tipos_orgaos

{'caule': 'tortuoso', 'folhas': 'opostas', 'raiz': ['adventicia', 'pivotante']}

In [None]:
tipos_orgaos['flor']

['petala', 'sepala']