<a href="https://colab.research.google.com/github/labeduc/ciencia-de-dados/blob/main/python/Python_AULA04.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Listas de dados, Conjuntos e Hashes

Até agora trabalhamos com dados simples. Inteiro, ponto flututante, strings, booleanos. Mas o Python vai muito mais além.

Há pelo menos mais 4 tipos de dados especiais que quero apresentar para vocês
- Lista de dados
  - Lista ou vetor (ou array ou matriz)
  - Tuplas
- Conjuntos (set)
- Dicionários (dictionary)

Entender esses tipos de dados é importante, pois à medida que as estruturas de dados ficam mais complexos, ficamos mais pertos da realidade de desenvolvimento. Por exemplo, uma tabela de banco de dados é um conjunto complexo de vetores de dados: Linhas e Colunas. Computação gráfica, os operadores tridimensionais (rotação, translação, escala) usam uma matriz.  Dentre tantos...



## Lista de Dados - Lista, Array ou Vetores

Uma lista é uma coleção de ítems de dados ordenados. Tal qual uma lista no Scratch, o Python tem pelo menos 3 formas de estabelecer uma lista.

Para declarar uma lista, basta atribuir a uma variável o uma sequencia de valores encerrados por um colchete: []


In [None]:
# exemplo de declaração de um array
frutas=["maçã","banana","morangos","jaca"]
for fruta in frutas:
  print(fruta)

maçã
banana
morangos
jaca


Podemos declarar uma lista usando a função **list()**

In [None]:
fib=list()
print(fib)

[]


Diferentemente do scratch, listas em python são indexados a partir do 0. Isto é, o primeiro elemento está na posição zero.

Python também aceita indices negativos nesse caso os elementos são acessados de trás para frente (do final da lista, -1; penúltimo, -2... e assim por diante).

Vamos ver uns exemplos:

In [None]:
# acessando o ítem na lista, na posição 2
print(frutas[2])

# acessando o último item da lista
print(frutas[-1])


morangos
jaca


### Operações com listas
Aprendemos anteriormente como criar uma lista com elementos fixos (quando se usa "[]". E uma lista plenamente vazia (quando se usa **list()**)

Aprendemos também como recuperar um ítem da lista, baseado na sua posição.

Para adicionar, remover, buscar um elemento da lista, precisamos lançar mão de algumas funções especiais que estão no corpo da variável (que armazena os dados a lista).

Eis as funções:
- append(*item*): Adiciona um item na lista
- remove(*item*): Remove o item da lista
- del *lista*[*posição*]: apaga o item da lista, baseado na posição do item.
- pop(): remove sempre o primeiro elemento da lista


In [None]:
print('lista original:', frutas);
# adicionando items à lista de frutas
frutas.append("laranja")
frutas.append("banana")
frutas.append("limão")

print('lista com novas frutas',frutas)

# removendo um ítem da lista (banana está duplicada)
# veja que "banana" está na posição 1 e 4. ele irá remover a primeira ocorrencia - sempre
frutas.remove("banana")
print(frutas)

# atualizando uma fruta
frutas[10]="framboesa"
print(frutas)

lista original: ['maçã', 'banana', 'morangos', 'jaca']
lista com novas frutas ['maçã', 'banana', 'morangos', 'jaca', 'laranja', 'banana', 'limão']
['maçã', 'morangos', 'jaca', 'laranja', 'banana', 'limão']


IndexError: ignored

In [None]:
# EXERCICIO:
# da mesma forma, teste...
# 1 Adicione "tangerina" à lista, usando o append
frutas.?
print(frutas)

# 2 teste o comando pop()
f=frutas.?
print("f=",f)

print(frutas)

### Criando sub listas (ou cópias)

Python é extremamente flexível com suas listas. Com uma sintaxe simples podemos selecionar pedaços da lista.

> *lista*[**inicio**:**fim**]

Se substituirmos *inicio* e *fim* por indices (números) podemos selecionar um pedaço da lista original com valores entre o inicio e o fim.

Se omitirmos um desses indices:
- *lista*[:**fim**] - indica que iremos copiar desde o inicio até o indice *fim*
- *lista*[**inicio**:] - indica que iremos copiar desde o indice de inicio até o final da lista.

NÃO SE ESQUEÇA: o indice de término sempre é exclusivo(não entra na conta). Por exemplo, abaixo, iremos pegar os valores dos índices 1 e 3... mas ele trará 2 valores. 1,2 (3 fica de fora).

Coisas do Python

In [None]:
# pegando um pedaço da lista
print("lista original:", frutas)
print("sublista:",frutas[1:3])

# captura o tamanho da lista
l=len(frutas)//2

print("até a metade",frutas[:l])
print("desde a metade", frutas[l:])



lista original: ['maçã', 'morangos', 'jaca', 'laranja', 'banana', 'limão']
sublista: ['morangos', 'jaca']
até a metade ['maçã', 'morangos', 'jaca']
desde a metade ['laranja', 'banana', 'limão']


### Lista de listas
Aqui temos que fazer um exercício mental. Mas é fácil. Imagine uma matriz de números

 - | Matemática | Portugues | Química | Física | Biologia | Inglês
 -|-|-|-|-|-|-
 Primeiro bimestre|7.0|8.2|7.3|8.8|7.7|6.7
 Segundo bimestre|8.0|8.4|7.0|7.5|6.7|7.2
 Terceiro bimestre|7.1|7.2|6.3|7.8|8.9|9.7

 Veja que temos um elemento bidimensional... nas colunas, as notas por disciplinas; nas linhas, as notas por bimestre.

 Como represento isso em Python?

 Simples, um vetor de vetores. O trabalho mental é de visualizar claramente o que vai ser linhas e o que vai ser as colunas. E assim encerrar uma vetor dentro do outro. Vamos para um exemplo de modelagem:
 - Cria-se um vetor que será responsável pelas linhas; As notas do bimestre
 - E esse vetor de linhas, irá armazenar as notas individuais das das disciplinas.



In [None]:
notas=[]

notas.append([7.0,8.2,7.3,8.8,7.7,6.7]) # notas respectivas às materias, no 1o bimestre
notas.append([8.0,8.4,7.0,7.5,6.7,7.2]) # 2o bimestre
notas.append([7.1,7.2,6.3,7,8,8.9,9.7]) # 30 bimestre

print(notas);

[[7.0, 8.2, 7.3, 8.8, 7.7, 6.7], [8.0, 8.4, 7.0, 7.5, 6.7, 7.2], [7.1, 7.2, 6.3, 7, 8, 8.9, 9.7]]


Olha que interessante. A partir desse momento podemos acessar as notas individualmente usando o operador **[]** mas de uma forma especial, onde podemos informar na primeira posição a "linha", e na 2a posição a coluna.

Portanto:

> *matriz*[*linha*][*coluna*]

In [None]:
print(notas[0][0]) # retorna o a nota de matemátca no primeiro bimestre

# Vamos para um exemplo mais elaborado.. onde iremos exercitar o que aprendemos
# nas aulas anteriores e estatistica!

c=0 # contador de colunas
total=[] # vetor do total de cada materia.
media=[]
while c<6: # processa por coluna; o nosso vetor de notas tem 6 colunas
  sum=0
  l=0
  while l<3: # processa cada linha; e 3 linhas
    sum=sum+notas[l][c]
    l=l+1
  total.append(sum) # calcula a soma total das notas.
  media.append(sum/3) # calcula a média das notas
  c=c+1 # incrementa a coluna

print("Total", total)
print("Media", media)

7.0
Total [22.1, 23.8, 20.6, 23.3, 22.4, 22.8]
Media [7.366666666666667, 7.933333333333334, 6.866666666666667, 7.766666666666667, 7.466666666666666, 7.6000000000000005]


## Lista de Dados - Tuplas

Esse é um tipo especial de lista, onde uma vez criado:
- Seus dados não poderão ser mudados
- não há possibilidade de editar ou adicionar dados nesse tipo de lista - se tentarem algum dos comandos de lista (pop, push, append... etc) VAI FALHAR!

Para criar uma tupla, usa-se parênteses.

Usa-se tuplas para criar listas imutáveis de dados. Use com cuidado. Pois o tipo de dado são bastante restritivos

In [None]:
# criar uma tupla de frutas
frutas=("laranja", "abacate", "ameixa","abacate")
print(frutas)

print(frutas[1])

frutas[3]="limao"


('laranja', 'abacate', 'ameixa', 'abacate')
abacate


TypeError: ignored

## Lista de Dados - Conjuntos

Esse tipo de dados permite que os dados sejam agrupados, sem ordem, não há índices e a duplicidade não é permitida.

Ela possui métodos proprios métodos para manipular os dados, no que veremos nos exercicios abaixo. Como esse tipo de lista nao permite ter ítens duplicados, converter uma lista em um set é uma forma eficiente de remover os duplicados.

Vamos ver como funciona

In [None]:
frutas={"laranja", "banana", "abacate", "banana"}
print(frutas)

# por ser um tipo não indexável, voce não pode acessar via posicão do item
print(frutas)

{'banana', 'laranja', 'abacate'}
{'banana', 'laranja', 'abacate'}


Para converter uma lista em um conjunto, basta usar a função **set()**

In [None]:
frutas=["laranja", "pera", "abacate", "laranja", "mamao"]
setFrutas=set(frutas)
print(frutas)
print(setFrutas)

# voce pode testar se um elemento especifico está num set

if "laranja" in setFrutas:
  print("Tem laranja")

# e para criar um conjunto vazio, voce pode chamar a função set() em vazio.
# usar add() para adicionar items

linguas=set();

linguas.add("latim")
linguas.add("alemao")
linguas.add("ingles")

print(linguas)

## Lista de Dados - Dicionários

Um dicionário é um tipo de dado complexo, que permite mapear uma informação com outra... :P. Vamos esclarecer isso.

Imagine o seguinte problema, vamos montar um programa de agenda eletrônica. Nome e telefones.

nome | telefone
-----|---------
Maria| 555-2300
Jose | 555-1211
Joao| 554-9923
Clovis| 552-8820

Podemos criar 2 listas, uma para nomes e outro para telefones. Onde se pesquisarmos pelo índice de um nome, acharemos na mesma posição o telefone. Funciona... mas E se a pessoa tiver mais de um telefone? Uma outra lista? telefone2?

Bom tem um custo nisso, pois precisaremos percorrer a lista de nomes. achar a posição do nome e usar para achar o telefone, ou em qualquer outra lista. Se na lista telefone 1 tiver somente um registro, ou crio dados vazios para quem não tem outro telefone, ou a lista fica fora de sincronismo...

Complicado.

Se fizermos uma lista de lista, a coisa fica beeeeeem pior. Pois precisaríamos estruturar cada elemento da lista para nao se perder nos dados:
```
[
  ["Maria", "555-2300"],["Jose","555-1211"]...["Clovis","552-8820"]
]
```
muito confuso. Sem milongas...

### O Dicionário

é uma espécie de **CONJUNTO** ou **Set** onde temos a estrutura de *Chave* (key) e *Valor* (value);

Se declara um dicionário assim
```
contatos={"Maria":"555-2300","Jose":"555-1211","Joao":"554-9923", "Clovis":"552-8820"}
```

Para pesquisar um ítem basta pedir pela chave:
```
telefone_maria=contatos["Maria"]
```

Veja que não usei um índice numérico como eu teria que usar se fizesse usando uma lista!

da mesma forma, para adicionar um dado ao dicionário, defino uma chave e associo a um valor

```
contatos["Lucas"]="448-2929"
```

para remover basta invocar o comando *del* (esse é novo)

```
del contatos["Maria"]
```

Vamos brincar um pouco no python

In [None]:
## Criando um dicionário vazio
dicionario=dict()

## Adicionando items no dicionario
dicionario["coelho"]="rabbit";
dicionario["girafa"]="giraffe";
dicionario["cavalo"]="horse";
dicionario["pássaro"]="bird";

print(dicionario)

In [None]:
## Vamos pesquisar um animal
animal=input("digite um animal")

## Antes de buscar o animal no dicionario, verifique se existe o animal antes
if(animal in dicionario.keys()):
  print(dicionario[animal])
else:
  print("Esse animal não existe")

o método **keys()** retorna a lista de dados que compõem a chave. Isso facilita muito em percorrer o dicionário e testar se existe uma chave ou não.

Vamos criar um programa que verifica e pergunta se quer inserir o animal na lista

In [None]:
while True:
  animal=input("digite um animal (fim, para parar)")

  if(animal=="fim"):
    break;

  if(animal in dicionario.keys()):
    print(dicionario[animal])
  else:
    print(animal, "não encontrado")
    beast=input("Qual a tradução de {} ?".format(animal))
    dicionario[animal]=beast

# agora teste,
# camelo -> camel
# peixe -> fish
# macaco -> monkey

Execute com carinho o programa acima. Com um pouco de criatividade, temos um pequeno sisteminha de cadastrar animais em inglês e português.



# Controle de Fluxo - Interação de listas

Vamos adicionar mais um controle de repetição ao nosso cestinho de conhecimento. Instrução **for**

A sintaxe dele é assim

```
for variavel in lista:
  comandos
```

Em suma, esse comando somente funciona em listas. E atribui a cada interação um elemento da lista à variavel, permitindo usar esse valor dentro do bloco

In [None]:
carros=["audi","vw","gm","nissan","kia", "hyundai"]

for carro in carros:
  print(carro)
