# <font color="red"> Data Science no Agronegócio</font>
## <span style="color:red">Linguagens e Ferramentas para *Data Science* no Agronegócio</span>

### <span style="color:darkred">Python: Sequências (Listas, Tuplas e Strings)</span>

*Dr. Guilherme Martineli Sanches*<br>
*Cropman*

## Sequências

Há três tipos nativos de sequências em Python

#### Tupla - *tuple*
- Sequência ordenada de elementos de qualquer tipo, incluindo outra sequência
- Instanciada com valores entre parênteses separados por vírgula, ex: (1, 2, 3)
- Elementos podem ser de tipos distintos, incluindo outra sequência
- Comumente usadas como "registros" 
- Elementos individuais <font color='red'>não podem ser modificados</font> (imutáveis)

#### Lista - *list*
- Sequência mutável ordenada de elementos de qualquer tipo, incluindo outra sequência
- Instanciada com valores entre colchetes separados por vírgula, ex: [1, 2, 3]
- Elementos podem ser modificados, adicionados, removidos, etc.

#### String - *str*
- Sequência ordenada de caracteres
- Instanciada com caracteres entre aspas simples ou duplas, ex: '123abc'
- Elementos individuais <font color='red'>não podem ser modificados</font> (imutáveis)


Elementos da sequência podem ser acessados pelo índice do elemento (sua posição) entre colchetes após o identificador da sequência.<br> 

O *índice dos elementos* inicia em `0` e vai até `n-1`, onde `n` é o número de elementos na sequência.



Exemplos de **tuplas**

In [7]:
tupla = (23, 'agro', 4.56, (2,3), 2.5)  # Tupla é sequência definida usando parenteses ()
    
# os valores dos elementos podem ser acessados utilizando o índice do elemento entre colchetes
print(tupla[0])
print(tupla[1])
print(tupla[2])
print(tupla[3]) 
# print(tupla[4]) 

23
agro
4.56
(2, 3)


O valor na posição `3` é uma *outra tupla* portanto podemos aninhar sequências.

Para acessar seus valores usamos um novo índice entre colchetes
* elemento na posição 3 da tupla, e dentro dele um elemento na posição 0
* elemento na posição 3 da tupla, e dentro dele um elemento na posição 1

In [4]:
print(tupla[3][0]) 
print(tupla[3][1]) 

2
3


> Erros típicos: 
* alterar elementos de tipos imutáveis
* acessar posições não existentes

In [5]:
# Como tuplas são imutáveis, não se pode mudar o valor dos elementos (mensagem de erro é gerada)
tupla[2] = 1.5

TypeError: ignored

In [8]:
# tentar acessar um elemento fora do intervalo da sequencia gera erro
tupla[4]

2.5

---
Exemplos de **listas** e seus usos

* inclusão de elementos com o método `append()`
* exclusão de elementos com a função `del`

In [9]:
# Listas são definidas utilizando colchetes [ ]
ls = ["agro", 34, 4.34, 23, 9, 98]  
                        
print(ls)
print(ls[0])
print(ls[1])
print(ls[2])
print(ls[3])

# mutável, podemos alterar elementos
ls[3] = 10000
print(ls)

['agro', 34, 4.34, 23, 9, 98]
agro
34
4.34
23
['agro', 34, 4.34, 10000, 9, 98]


In [11]:
lsn = []  # cria um lista lsn vazia
print(lsn)

# inserindo elementos em uma lista após ela ter sido criada
lsn.append('agro')
lsn.append(23)
lsn.append('datascience')
lsn.append('adubo')
print(lsn)

[]
['agro', 23, 'datascience', 'adubo']


In [12]:
# elementos também podem ser removidos com o comando 'del'
print(3*'-','Removendo elememtos inseridos')

print(lsn)
print('-','deleta posição 0')
del(lsn[0])
print(lsn)

print('-','deleta posição 2')
del(lsn[2])
print(lsn)

--- Removendo elememtos inseridos
['agro', 23, 'datascience', 'adubo']
- deleta posição 0
[23, 'datascience', 'adubo']
- deleta posição 2
[23, 'datascience']


## *Slicing*  (fatiamento)

Significa passar um intervalo de índices `[i,j]` e retornar uma sub-sequência.

Esse intervalo retorna elementos de `i` até `j-1` (ou seja o valor final *não* é incluído)

A sintaxe para realizar um slicing é:
```python
[i:j]
```

É possivel omitir um deles com diferentes propósitos:
* omitir `i` para iniciar no primeiro elemento e retornar até `j-1`: `[:j]` 
* omitir `j` para iniciar no em `i` e ir até o final da sequência: `[i:]` 

In [13]:
ls = [1, 5, 13, 50, 1000, 10, 'fim'] 
print(ls)
print(ls[0:2])  # recupera elementos ls[0],ls[1] (note que o elemento ls[2] não é recuperado)
print(ls[2:])   # recupera elementos a partir de ls[2] em diante
print(ls[1:5])  # recupera elementos ls[1],ls[2],ls[3],ls[4] 
print(ls[:3])   # recupera elementos até ls[2]

[1, 5, 13, 50, 1000, 10, 'fim']
[1, 5]
[13, 50, 1000, 10, 'fim']
[5, 13, 50, 1000]
[1, 5, 13]


#### Indexando com valores negativos

Valores negativos de índices podem ser usados:
    - indexam a partir do final da lista, como se fosse uma lista "circular".

Por exemplo o último valor pode ser acessado com -1

Abaixo um exemplo de lista com 5 elementos e seus índices positivos (0 a 4) e negativos (-1 a -5) válidos:

```
 0  1  2   3   4
[1` 5, 13, 50, 100]
-5 -4  -3  -2  -1
```

In [14]:
ls = [1, 5, 13, 50, 1000, 10, 'fim'] 
print(ls[-1])
print(ls[-7])

fim
1


In [15]:
print(ls[-3:])

[1000, 10, 'fim']


---
Exemplos e uso de **strings**

In [16]:
st = 'Agro Data Science'  # Strings são definidas utilizando aspas simples '' ou duplas ""
print(st[0])
print(st[1])
print(st[2])

A
g
r


Strings possui alguns métodos como
* `upper()`
* `replace()` 

Ver lista completa em https://docs.python.org/3/library/string.html

In [17]:
print(st.upper())
print(st)

AGRO DATA SCIENCE
Agro Data Science


In [18]:
st = st.replace('Agro', 'Agronegocio')
print(st)

Agronegocio Data Science


O número de elementos de uma sequência pode ser consultado utilizando a função **len()**

In [19]:
print(tupla)
print("tamanho da tupla: ",len(tupla),"\n")
print(ls)
print("tamanho da lista: ",len(ls),"\n")
print(st)
print("tamanho da string: ",len(st))

(23, 'agro', 4.56, (2, 3), 2.5)
tamanho da tupla:  5 

[1, 5, 13, 50, 1000, 10, 'fim']
tamanho da lista:  7 

Agronegocio Data Science
tamanho da string:  24


---

**<font color="blue">Exercício 4</font>**

Considere a lista `agro` declarada abaixo. 
- Utilizando fatiamento, imprima o subconjunto de elementos entre o segundo e o quarto elemento (inclusive)
- Gere uma nova lista chamada `maiores4` contendo os elementos da lista `agro` que possuam quatro caracteres ou mais, utilizando a função `len()`.
- Gere uma nova lista chamada `p_ou_s` contendo os elementos da lista `agro` que começam com a letra 'p' ou com a letra 's'.

In [None]:
agro = ['python', 'agronegocio', 'tecnologia', 'precisao', 'sensor', 'mapeamento', 'produtividade', 'solo', 'planta', 'clima']