# Introdução ao Python para análise exploratória de dados - aula01

![](../img/intro_python.png)

 Na última aula falamos sobre os tipos mais simples de variáveis do Python. Nesta aula falaremos sobre variáveis mais complexas, mas que ainda assim fazem parte do conjunto de variáveis nativas (*built-in*) do Python: lista, tupla e dicionário.

**Lista:** é uma coleção de itens armazenados de forma sequencial e ordenada.
Podemos colocar qualquer informação em uma lista e os itens dela não precisam ser relacionados. As listas são acessadas por meio de um índice.

**Tupla:** também é uma coleção de itens, porém imutável
Uma vez criada, não podemos remover, adicionar ou alterar nenhum de seus itens.

**Dicionário:** coleção não ordenada de pares chave- valor
Cada item é acessado por uma chave que deve ser um valor imutável de qualquer tipo (string, numérico ou tupla, por exemplo)

## Lista

In [1]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9]

In [2]:
filme[0]

'Pulp fiction'

In [3]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']]

In [4]:
filme[4]

['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']

In [5]:
filme[4][1]

'Uma Thurman'

### Comandos para usar com listas

**.count()** # conta quantas vezes um dado valor ocorre dentro da lista

**.append()** # acrescenta dados ao final de uma lista

**.insert()** # insere um elemento em uma posicão específica da lista. É computacionalmente mais custoso do que append.

**.pop** # operacão inversa do insert, ou seja, remove e retorna um elemento de um índice específico.

**.remove** # localiza o primeiro valor correspondente e o remove da lista

**.join()** # gruda os elementos de uma sequência de strings, usando um parâmetro fornecido. Só funciona com lista de strings

**.split()** # separa uma string com base em algum caracter, criando assim uma lista de strings.

**.sort()** # ordena uma lista *in place*, ou seja, sem criar um novo objeto



In [6]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9,
         ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']]
filme.count(1994)

1

In [7]:
filme.append("Quentin Tarantino")
print(filme)

['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'], 'Quentin Tarantino']


In [8]:
filme.insert(1, "Quentin Tarantino")
filme

['Pulp fiction',
 'Quentin Tarantino',
 1994,
 'Crime/Drama',
 8.9,
 ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'],
 'Quentin Tarantino']

In [9]:
filme.remove("Quentin Tarantino")
filme

['Pulp fiction',
 1994,
 'Crime/Drama',
 8.9,
 ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'],
 'Quentin Tarantino']

In [10]:
atores = ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']
' e '.join(atores)

'John Travolta e Uma Thurman e Samuel L. Jackson'

In [14]:
notas = '9, 94, 5' # notas do filme
notas.split(',')

['9', ' 94', ' 5']

In [15]:
notas = notas.split(',')

In [18]:
notas_int = [] # crio uma lista vazia que vai receber os numeros como int
for n in notas:
    n = int(n)
    notas_int.append(n) # vou salvando cada um dos números transformados para o tipo int
print(type(notas_int[0]))

<class 'int'>


In [20]:
notas_int.sort()
notas_int

[5, 9, 94]

In [21]:
sum(notas_int)

108

In [24]:
atores.sort(key=len) # é possível passar um argumento para o sort ser feito pelo tamanho das strings, se eu deixo () ele ordena em ordem alfabetica
atores

['Uma Thurman', 'John Travolta', 'Samuel L. Jackson']

Podemos checar se uma lista contém um dado valor usando o operador *in*.
Tamb[em podemos checar se uma lista **não** contém um dado valor usando o operador *not* em conjunto.

In [25]:
1994 in filme

True

In [26]:
1994 not in filme

False

## Tupla

In [27]:
avaliacao = 'ótimo', 'bom', 'regular', 'ruim', 'péssimo'
opiniao = ('ótimo', 'bom', 'regular', 'ruim', 'péssimo')
avaliacao == opiniao

True

In [28]:
a = (1,) # para criar uma tupla de 1 elemento usamos a vírgula

In [29]:
type(a)

tuple

In [30]:
b = (1)

In [31]:
type(b)

int

Enquanto os objetos armazenados em uma tupla podem ser mutáveis, uma vez que ela é criada não é possível modificar os objetos que estão armazenados em cada índice dela.

In [37]:
lista = ['foo', [1, 2], True]
tup = tuple(lista)
tup[2] = False

TypeError: 'tuple' object does not support item assignment

Se um objeto dentro da tupla é mutável, como uma lista, você pode alterá-lo.

In [39]:
tup[1].append(3) # estamos mudando a lista que está dentro da tupla e não a tupla em si
tup

('foo', [1, 2, 3, 3], True)

In [40]:
tup[1] = [1,2]

TypeError: 'tuple' object does not support item assignment

### Comandos para usar com tuplas
Já que o tamanho e o conteúdo de uma tupla não podem ser modificados, os comandos (ou métodos) relacionados a este tipo de objeto são poucos. Um método útil é o método *.count()* que também vimos disponível para listas

In [41]:
tup.count("foo")

1

## Dicionário

In [42]:
participante = {} # cria um dicionário vazio

Usamos colchetes para criar um dicionário e dois pontos para separa os pares de chave-valor.

In [43]:
participante = {'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

Podemos acessar, inserir ou configurar os elementos de um dicionário com a mesma sintaxe usada para acessar elementos de uma lista ou tupla

In [44]:
participante['faltas'] = 2 # adiciona um novo par chave-valor
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10, 'faltas': 2}

In [45]:
participante["faltas"]

2

In [46]:
"curso" in participante # também podemos usar o operador in com dicionários

True

### Comandos para usar com dicionários
**del** # deleta um valor
**.pop()** # simultâneamente retorna o valor e deleta a chave
**.keys()** # retorna as chaves que o dicionário possui
**.values()** # retorna os valores armazenados no dicionário
**.update()** # junta dois dicionários
**.items()** # retorna o par chave-valor como tupla. Útil quando precisamos iterar sobre os dois.



In [47]:
del participante['faltas'] # apaga um item
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [48]:
participante[5] = "número da chamada"
participante

{'nome': 'Bruna',
 'curso': 'Lógica de programação',
 'nota': 10,
 5: 'número da chamada'}

In [49]:
participante.pop(5)

'número da chamada'

In [50]:
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [51]:
participante.keys()

dict_keys(['nome', 'curso', 'nota'])

In [52]:
participante.values()

dict_values(['Bruna', 'Lógica de programação', 10])

In [53]:
participante.items()

dict_items([('nome', 'Bruna'), ('curso', 'Lógica de programação'), ('nota', 10)])

In [54]:
notas = {"curso": "Introdução à Lógica de Programação com Python", "nota": 10, "provas": [8.7, 9.5, 10], "exercícios": [7, 8.5, 7.8, 10]}

participante.update(notas)
participante

{'nome': 'Bruna',
 'curso': 'Introdução à Lógica de Programação com Python',
 'nota': 10,
 'provas': [8.7, 9.5, 10],
 'exercícios': [7, 8.5, 7.8, 10]}

## Estruturas condicionais e de repetição

## *if* *else*
Checa se uma condicão é um booleano verdadeiro ou pode ser avaliado como True

In [56]:
sol = 'não'
if sol == 'sim':
    print('Durante a viagem fará sol!')
else:
    print('Durante a viagem o tempo ficará fechado!')

Durante a viagem o tempo ficará fechado!


Podemos colocar mais condicões no nosso código:

In [61]:
sol = 'não'
temp = 23
if sol == 'sim':
    if temp >= 25:
        print('Durante a viagem fará sol e muito calor!')
    else:
        print('Durante a viagem fará sol mas pouco calor')
else:
    if temp >= 25:
        print('Durante a viagem o tempo ficará fechado e abafado!')
    else:
        print("Durante a viagem o sol não aparecerá e ficará frio")

Durante a viagem o sol não aparecerá e ficará frio


![](../img/elif_meme.png)

Se há mais de duas possibilidades a serem testadas, use para a primeira, elif (que significa else
if) para as possibilidades intermediárias, e else para a última:

In [65]:
cor = "de burro quando foge"

if cor == "vermelho":
    print("A cor é vermelho que nem tomate")
elif cor == "verde":
    print("A cor é verde que nem pimentão")
elif cor == "amarela":
    print("A cor é amarelo que nem banana")
else:
    print("Nunca ouvi falar da cor ", cor)

Nunca ouvi falar da cor  de burro quando foge


Abaixo temos a lista de operadores de comparacão que usamos para construir as regras com o comando if/elif/else

![](../img/operadores_logicos.png)

In [70]:
caixa = 1000
divida = 500
(caixa > 800) and not (divida < 100)

True

Se você tiver de fazer várias comparacões com o operador *or*, podemos usar o operador de filiacão do Python (membership operator).

In [73]:
letra = "a"

if letra == "a" or letra == "e" or letra == "i" or letra == "o" or letra == "u":
    print(letra, " é uma vogal!")
else:
    print(letra, " não é uma vogal!")

a  é uma vogal!


In [77]:
vogais = "aeiou"
letra = "a"
if letra in vogais:
    print(letra, " é uma vogal!")

a  é uma vogal!


## While

O while é usado quando precisamos repetir uma ação enquanto determinadas condições permanecem verdadeiras

In [85]:
conta = 1
while conta <= 5:
    print(conta)
    conta +=1 # mesma coisa que conta = conta + 1

1
2
3
4
5


Se quisermos iterar até algo ocorrer, mas não sabemos quando essa coisa vai ocorrer, podemos usar um *loop* infinito com o comando break

In [86]:
while True:
    value = input("teste")
    if value == "teste":
        break
    print(value.capitalize())

KeyboardInterrupt: Interrupted by user

Às vezes só queremos avancar para o próximo item ao invés de para o *loop*. Nesse caso usamo o comando continue

In [87]:
while True:
    value = input("Digite um numero inteiro[digite q para sair]: ")
    if value == 'q':
        break
    number = int(value) # transforma em inteiro
    if number % 2 == 0: # numero par
        continue
    print(number, "ao quadrado é", number*number)

## For
Com o laço for podemos executar a mesma ação em todos os elementos de uma string, lista, dicionário e tipos de variáveis e estruturas de dados do Python. Essa é uma das maneiras mais comuns para um computador automatizar tarefas repetitivas.

In [78]:
palavra = "tempo"

for letra in palavra:
    print(letra)


t
e
m
p
o


In [79]:
frutas = ['abacaxi', 'melancia', 'amora','abacate', 'uva', 'morango', 'banana']

for fruta in frutas:
    print(fruta)

abacaxi
melancia
amora
abacate
uva
morango
banana


In [80]:
# a funcão range gera uma sequência de valores dentro de um intervalo
for item in range(0,3): # o ultimo valor a ser criado é o 2
    print(item)

0
1
2


In [81]:
for item in range(2, -1, -1): # range(start, stop, step) -1 decrescente, se 1 crescente passo
    print(item)

2
1
0


Abacaxi
A fruta melancia não começa com a letra a!
Amora
Abacate
A fruta uva não começa com a letra a!
A fruta morango não começa com a letra a!
A fruta banana não começa com a letra a!


Podemos iterar sobre múltiplas listas em paralelo usando a funcão *zip()*

In [83]:
dias = ["segunda", "terca", "quarta", "quinta", "sexta"] # 5 dias
frutas = ['abacaxi', 'melancia', 'amora'] # 3 frutas
bebidas = ["café", "suco", "água", "cerveja", "vinho"] # 5 bebidas
sobremesas = ["pudim", "chocolate", "sorvete","torta", "cookie"] # 5 sobremesas

for dia, fruta, bebida, sobremesa in zip(dias, frutas, bebidas, sobremesas):
    print(dia, ": beber", bebida, " - comer", fruta, "- sair da dieta com", sobremesa) # ordem pode trocar aqui
    # a interação termina na lista menor

segunda : beber café  - comer abacaxi - sair da dieta com pudim
terca : beber suco  - comer melancia - sair da dieta com chocolate
quarta : beber água  - comer amora - sair da dieta com sorvete


In [84]:
portugues = ["Segunda-feira", "Terca-feira", "Quarta-feira", "Quinta-feira", "Sexta-feira", "Sábado", "Domingo"]

ingles = ["Monday", "Tuesday", "Wednesday", "Thursday", "Saturaday", "Sunday"]

dicionario = dict(zip(ingles, portugues))
print(dicionario)

{'Monday': 'Segunda-feira', 'Tuesday': 'Terca-feira', 'Wednesday': 'Quarta-feira', 'Thursday': 'Quinta-feira', 'Saturaday': 'Sexta-feira', 'Sunday': 'Sábado'}
