# Capítulo 01 - Exploração e limpeza de dados

### Objetivos

- Executar operações básicas em Python
- Descrever o contexto empresarial dos dados do estudo de caso e sua adequação a tarefa
- Executar operações de limpeza de dados
- Examinar sínteses estatísticas e visualizar os dados do estudo de caso
- Implementar a codificação `one-hot enconding` em variáveis categóricas.

## Criação e indexação de lista | Slicing

Para criar uma lista, que é uma coleção ***mutável*** que pode conter qualquer dado, vamos usar a função `list()`.
Também utilizaremos a função `range()` para preencher nossa lista com números inteiros consecutivos.

Resumindo: A função `range()` vai iterar os números que converteremos em uma lista com a função `list()`.

In [3]:
example_list = list(range(1,6))
example_list

[1, 2, 3, 4, 5]

Apesar de termos colocado nosso `range` de 1 a 6, a função retornou uma lista de 1 a 5.
Isso porque a função retorna todos os números **até** o número final, sendo que esse número não entra na contagem. Portanto, nosso range foi de 1 a 5.
Essa mesma lógica pode ser aplicada quando formos fazer nosso slice. 

O slice serve para fazer uma seleção de múltiplos elementos de uma coleção ordenada dentro de um intevalo.
Em outras palvaras, serve para 'recortar-mos' uma amostra da nossa lista.

Para isso, precisamos colocar entre colchetes a posição do elemento que queremos dentro da lista. As listas em Python começam da posição **0**.

In [4]:
example_list[0]

1

In [5]:
example_list[1]

2

Veja que quando realizamos o slice na posição *0*, temos o retorno do primeiro elemento da nossa lista. Se mudarmos a posição para **1**, o retorno é o segundo elemento, e assim por diante.

Mas e se quisermos fazer o retorno pelo último elemento e ir regredindo? Para isso podemos chamar nossa lista na posição **-1**, que retornará o último elemento, **-2** retornará o penúltimo elemento, e assim por diante.

In [6]:
example_list[-1]

5

In [7]:
example_list[-2]

4

Show de bolete, né? Mas ainda podemos ir mais além. Se precisarmos trazer os três primeiros elementos da lista? E os três últimos? Para isso, podemos incluir o sinal **:**.

- Se colocarmos antes do valor final, ele retornará todos os elementos até a posição final informada. 
- Se colocarmos após o valor final, ele retornará daquela posição informada até a última.

In [8]:
example_list[:3]

[1, 2, 3]

In [12]:
example_list[3:]

[4, 5]

No primeiro caso, o retorno são os elementos da posição 0, 1 e 2. Já no segundo, são retornados os elementos da posição 3 até o final.

Poderiamos usar a mesma lógica para retornar na ordem inversa.

In [16]:
example_list[:-3]

[1, 2]

In [17]:
example_list[-3:]

[3, 4, 5]

No primeiro caso, são retornados todos os elementos anterirores ao antepenúltimo elemento. E no segundo caso, são retornados do antepenúltimo até o final.

E se quisessemos mudar algum valor dessa lista em uma posição específica? É possível fazer a atribuição desse novo valor, puxando o índice que você deseja alterar dentro dessa lista.

Vamos supor que ao ínves do número 1 no primeiro elemento, quisessemos mudar para um texto com a palavra 'primeiro'. Poderiamos atribuir a string 'primeiro, na posição **0** da nossa lista.

In [18]:
example_list[0] = 'primeiro'

In [19]:
example_list

['primeiro', 2, 3, 4, 5]

Como podemos ver, realizamos a alteração de um elemento dentro de uma lista, isso é possível, pois como falamos anteriormente, a lista é uma coleção ordendata ***mutável***.

## Dicionários

As listas são uma forma de coleções ordenadas, porém também temos as coleções não ordenadas e uma das principais delas são os *dicionários*.

Dicionários são coleções de pares **chave:valor**, que difeente das listas, ao invés de procurarmos os elementos pelos índices, nos podemos procura-los pelas suas respectivas chaves, que podem ser tanto números como texto.

A criação de um dicionário é dada pela abertura de chaves {} separando os pares **chave:valor** por virgulas.

In [22]:
example_dict = {'maças':5, 'laranjas': 8}
example_dict

{'maças': 5, 'laranjas': 8}

Podemos ver que temos um par de chave e valor separados por **:** e os elementos desse dicionário separados por **,**

Se quisessemos pegar um elemento desse dicionário, poderiamos chamar a sua respectiva ***chave*** e ele retornaria o ***valor*** referente a essa chave. 

In [23]:
example_dict['maças']

5

In [24]:
example_dict['laranjas']

8

Também seria fácil modificar o valor de um elemento, atribuindo esse novo calor a chave desejada.

In [25]:
example_dict['maças'] = 13
example_dict

{'maças': 13, 'laranjas': 8}

## Convertendo dicionários em listas

É possível realizar converter as chaves do dicionário em uma lista, sabia? Precisariamos só chamar nossa função `list()` para nosso dicionario e atribruir a uma nova variável.

In [37]:
dict_to_list = list(example_dict)
dict_to_list

['maças', 'laranjas']

Se quisessemos pegar o valor do dicionário ao invés da chave, poderiamos acrescentar o método **.values** depois do nosso dicionário.

In [28]:
dict_to_list_values = list(example_dict.values())
dict_to_list_values

[13, 8]

## Adicionando novos valores a uma lista

Se quisermos colocar novas frutas na nossa lista? Como podemos realizar?

Existem algumas formas de colocar novos valores em listas e iremos mostrar alguns

#### Usando a concantenação com **+**

In [38]:
dict_to_list = dict_to_list + ['bananas']
dict_to_list

['maças', 'laranjas', 'bananas']

### Usando append()

- **append**: Adiciona qualquer valor completo, por exemplo, se enviarmos um objeto, ele adiciona o objeto, se enviarmos uma lista, ele adiciona a lista inteira ao invés de seus itens.


In [39]:
dict_to_list.append('peras')
dict_to_list

['maças', 'laranjas', 'bananas', 'peras']