<h1 style='color: green; font-size: 36px; font-weight: bold;'> Python e Ciência de Dados </h1>
<hr style='border: 2px solid green;'> <br>

# <font color=red> **Curso de Python Aplicado para Ciência de Dados** </font>
<hr style='border: 2px solid red;'> <br>

**Instrutor:** prof. Bruno Fontana da Silva <br>
**Edição:** 2020/1

# <font color=red> Introdução às Coleções </font>
<hr style='border: 2px solid red;'>

In [None]:
from ipywidgets import interact
import ipywidgets as widgets

Agora conheceremos alguns tipos de dados que possuem uma estrutura mais complexa. <br>
Tratam-se dos [tipos "**sequência**"](https://docs.python.org/3/library/stdtypes.html#sequence-types-list-tuple-range), sendo eles **lista**, **tupla** e **dicionário**. <br>
Como se tratam de agrupamentos de elementos (objetos), também é comum se referir aos mesmos como coleções.

# Mas antes...

Para que possamos explorar melhor o uso das coleções, <br> é importante sabermos como utilizar blocos condicionais e laços no Python.

## Blocos condicionais if, elif

Para testar uma condição lógica (verdadeiro ou falso), utilizamos a função "if" (se). <br>
Quando a condição for verdadeira, o bloco de código indentado "dentro do if" será executado.

Pode-se criar uma alternativa de código para o caso da condição ser falsa (não ser verdadeira):

## Laços: for, while

Quando precisamos programar **tarefas repetitivas**, como por exemplo <br> 
testar o sinal de uma lista de valores ou <br> 
fazer uma atualização no cadastro de uma lista de clientes <br>
podemos fazer uso dos laços de programação.

A função "**range()**" pode ser útil quando queremos fazer um laço sobre uma sequência de valores numéricos. <br> 
Ela cria um gerador de números inteiros que serão percorridos por um contador.

Existem [diversas formas de fazer um laço em Python](https://docs.python.org/3/tutorial/datastructures.html#looping-techniques). <br>
Mas como este curso é para iniciantes, vamos dar um passo de cada vez. <br>
Abaixo, seguem algumas formas de utilizar o laço "**for**". <br>
Observe que esse laço é bastante adequado para um laço cujo número de iterações (repetições) é finito e conhecido.

Outro laço existente é o "**while**" (enquanto). <br>
Sua aplicação é mais conveniente quando o bloco de código será repetido <br> 
tantas vezes quanto forem necessárias até que uma condição (até então verdadeira) seja violada (torna-se falsa).

# Listas

O tipo de dado "**_list_**" consiste em uma sequência de objetos agrupados em uma única variável. <br> 
A lista possui apenas uma dimensão e cada elemento da lista guarda um objeto. <br>
Por exemplo, considere uma lista de palavras:

Observe que para criar uma lista, utilizamos colchetes (**[ ]**) e enumeramos os elementos separando-os por vírgula. <br>
Veja por exemplo uma lista de valores númericos:

Utilidade principal das listas: <br> **agrupar** elementos (objetos) **do mesmo tipo**, <br> para que seja possível **iterar** sobre os mesmos <br> **aplicando métodos** de maneira uniforme <br> (modificando todos os elementos da lista com o mesmo método).

É possível acessar os elementos de uma lista pelo seu índice, da seguinte maneira:

O tipo lista possui [diversos métodos](https://docs.python.org/3/tutorial/datastructures.html) que podem ser bastante úteis:

- Podemos acrescentar um elemento na lista

- Podemos remover um elemento da lista

- Podemos criar uma cópia da lista, criando um novo objeto:

**Obs**: é muito importante fazer cópias em vez de simplesmente atribuir "lista2 = lista1", pois a atribuição é simplesmente uma referência simbólica, e as duas listas estarão conectadas - uma mutação em lista2 vai alterar lista1 também, pois são o mesmo objeto na memória.

Observe, como curiosidade, que _strings_ se comportam de maneira semelhante a uma lista de caracteres, porém não possui os métodos de lista.

Uma técnica muito utilizada em Python é "list comprehension" (compreensão de listas). <br>
Trata-se de uma forma de criação de listas de maneira iterativa e com uma sintaxe bastante "legível" para quem lê o código. <br>
Veja um exemplo:

In [None]:
from numpy.random import uniform

# Tuplas 

Outra estrutura de sequência de dados existente é a **_tuple_** (tupla). <br>
Trata-se de uma sequência de elementos separados por vírgula. <br>
A principal diferença para uma lista é que tuplas são **imutáveis**: você pode ler o valor de uma tupla, mas não pode escrever sobre ele. <br>
Além disso, uma tupla pode ser interpretada como um elemento de um espaço com "N" dimensões.

Utilidade principal das tuplas: <br> **agrupar** elementos de **tipos (tipicamente) diferentes** <br> em uma única estrutura <br> com **ordem pré-definida**.

Veja um exemplo: 
- vamos criar uma tupla que armazena as coordenadas geográficas de locais de interesse, bem como o nome desses locais.

- uma tupla que representa a cor de fundo de uma sequência de imagens 

- coordenadas de um plano cartesiano 3D

Podemos também criar listas onde cada elemento é uma tuplas. <br>
Por exemplo, suponha que cada tupla representa informações de cadastro de um usuário. <br>
Vamos usar a estrutura ordenada (NOME, CPF, e-mail).

Usando a função "zip", conseguimos iterar sobre as três listas simultaneamente e criar as tuplas. <br>
A função zip faz um agrupamento elemento-a-elemento de listas de mesmo tamanho, concatenando-as numa tupla.

Para desfazer a estrutura também podemos usar a função "**zip(**\* _zipped list_ **)**" <br>
para obter os valores do cadastro em variáveis independentes.

Mas note que as saídas são tuplas e não listas!
Podemos converter usando a função **list()**:

# Dicionários

A última estrutura de dados que vamos explorar neste tutorial são os **[dicionários](https://docs.python.org/3/tutorial/datastructures.html#dictionaries)**. <br>
Um dicionário é uma estrutura de duas dimensões, em que cada elemento tem a seguinte organização: <br>
**{<font color=red>'item'</font>: valor}** <br><br>
Assim como uma lista, um dicionário pode ter vários elementos. Veja um exemplo:

Existem outras formas de inicializar um dicionário, [leia mais para aprender](https://docs.python.org/3/library/stdtypes.html#dict). <br>

Para acessar os elementos de uma lista, podemos usar o nome do item em vez de um índice numérico.

Observe que "valor" de um item pode ser qualquer tipo de dado.

Para receber uma lista com todas as "chaves" (nomes dos itens) de um dicionário, usamos o método "**keys()**".

Da mesma maneira, podemos extrair apenas os valores ou ambos em uma tupla:

Podemos verificar se uma chave consta no dicionário:

Leia a documentação para aprender [outros métodos inerentes dos dicionários](https://docs.python.org/3/library/stdtypes.html#dict).