# Introdução ao Python para análise exploratória de dados - aula01

![](../img/intro_python.png)

 Na última aula falamos sobre os tipos mais simples de variáveis do Python. Nesta aula falaremos sobre variáveis mais complexas, mas que ainda assim fazem parte do conjunto de variáveis nativas (*built-in*) do Python: lista, tupla e dicionário.

**Lista:** é uma coleção de itens armazenados de forma sequencial e ordenada.
Podemos colocar qualquer informação em uma lista e os itens dela não precisam ser relacionados. As listas são acessadas por meio de um índice.

**Tupla:** também é uma coleção de itens, porém imutável
Uma vez criada, não podemos remover, adicionar ou alterar nenhum de seus itens.

**Dicionário:** coleção não ordenada de pares chave- valor
Cada item é acessado por uma chave que deve ser um valor imutável de qualquer tipo (string, numérico ou tupla, por exemplo)

## Lista

In [1]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9]

In [5]:
filme[0]

'Pulp fiction'

In [6]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']]

In [7]:
filme[4]

['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']

In [8]:
filme[4][1]

'Uma Thurman'

### Comandos para usar com listas

**.count()** # conta quantas vezes um dado valor ocorre dentro da lista

**.append()** # acrescenta dados ao final de uma lista

**.insert()** # insere um elemento em uma posicão específica da lista. É computacionalmente mais custoso do que append.

**.pop** # operacão inversa do insert, ou seja, remove e retorna um elemento de um índice específico.

**.remove** # localiza o primeiro valor correspondente e o remove da lista

**.join()** # gruda os elementos de uma sequência de strings, usando um parâmetro fornecido. Só funciona com lista de strings

**.split()** # separa uma string com base em algum caracter, criando assim uma lista de strings.

**.sort()** # ordena uma lista *in place*, ou seja, sem criar um novo objeto



In [34]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9,
         ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']]
filme.count(1994)

1

In [35]:
filme.append("Quentin Tarantino")
print(filme)

['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'], 'Quentin Tarantino']


In [None]:
filme.insert(1, "Quentin Tarantino")
filme

In [None]:
filme.remove("Quentin Tarantino")
filme

In [12]:
atores = ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']
' e '.join(atores)

'John Travolta e Uma Thurman e Samuel L. Jackson'

In [38]:
notas = '9, 94, 5' # notas do filme
notas.split(',')

['9', ' 94', ' 5']

In [39]:
notas = notas.split(',')

In [40]:
notas_int = [] # crio uma lista vazia que vai receber os numeros como int
for n in notas:
    notas_int.append(int(n)) # vou salvando cada um dos números transformados para o tipo int
print(type(notas_int[0]))

<class 'int'>


In [45]:
notas_int.sort()
notas_int

[5, 9, 94]

In [48]:
atores.sort(key=len) # é possível passar um argumento para o sort ser feito pelo tamanho das strings
atores

['Uma Thurman', 'John Travolta', 'Samuel L. Jackson']

Podemos checar se uma lista contém um dado valor usando o operador *in*.
Tamb[em podemos checar se uma lista **não** contém um dado valor usando o operador *not* em conjunto.

In [36]:
1994 in filme

True

In [37]:
1994 not in filme

False

## Tupla

In [None]:
avaliacao = 'ótimo', 'bom', 'regular', 'ruim', 'péssimo'
opiniao = ('ótimo', 'bom', 'regular', 'ruim', 'péssimo')
avaliacao == opiniao

In [None]:
a = (1,) # para criar uma tupla de 1 elemento usamos a vírgula

In [None]:
type(a)

In [None]:
b = (1)

In [None]:
type(b)

Enquanto os objetos armazenados em uma tupla podem ser mutáveis, uma vez que ela é criada não é possível modificar os objetos que estão armazenados em cada índice dela.

In [26]:
tup = tuple(['foo', [1, 2], True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

Se um objeto dentro da tupla é mutável, como uma lista, você pode alterá-lo.

In [28]:
tup[1].append(3) # estamos mudando a lista que está dentro da tupla e não a tupla em si
tup

('foo', [1, 2, 3, 3], True)

In [29]:
tup[1] = [1,2]

TypeError: 'tuple' object does not support item assignment

### Comandos para usar com tuplas
Já que o tamanho e o conteúdo de uma tupla não podem ser modificados, os comandos (ou métodos) relacionados a este tipo de objeto são poucos. Um método útil é o método *.count()* que também vimos disponível para listas

## Dicionário

In [52]:
participante = {} # cria um dicionário vazio

Usamos colchetes para criar um dicionário e dois pontos para separa os pares de chave-valor.

In [53]:
participante = {'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

Podemos acessar, inserir ou configurar os elementos de um dicionário com a mesma sintaxe usada para acessar elementos de uma lista ou tupla

In [54]:
participante['faltas'] = 2 # adiciona um novo par chave-valor
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10, 'faltas': 2}

In [55]:
participante["faltas"]

2

In [57]:
"curso" in participante # também podemos usar o operador in com dicionários

True

### Comandos para usar com dicionários
**del** # deleta um valor
**.pop()** # simultâneamente retorna o valor e deleta a chave
**.keys()** # retorna as chaves que o dicionário possui
**.values()** # retorna os valores armazenados no dicionário
**.update()** # junta dois dicionários
**.items()** # retorna o par chave-valor como tupla. Útil quando precisamos iterar sobre os dois.



In [56]:
del participante['faltas'] # apaga um item
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [62]:
participante[5] = "número da chamada"
participante

{'nome': 'Bruna',
 'curso': 'Lógica de programação',
 'nota': 10,
 5: 'número da chamada'}

In [63]:
participante.pop(5)

'número da chamada'

In [64]:
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [69]:
participante.keys()

dict_keys(['nome', 'curso', 'nota'])

In [71]:
participante.values()

dict_values(['Bruna', 'Introdução à Lógica de Programação com Python', 10, [8.7, 9.5, 10], [7, 8.5, 7.8, 10]])

In [68]:
participante.items()

dict_items([('nome', 'Bruna'), ('curso', 'Lógica de programação'), ('nota', 10)])

In [70]:
notas = {"curso": "Introdução à Lógica de Programação com Python", "nota": 10, "provas": [8.7, 9.5, 10], "exercícios": [7, 8.5, 7.8, 10]}

participante.update(notas)
participante

{'nome': 'Bruna',
 'curso': 'Introdução à Lógica de Programação com Python',
 'nota': 10,
 'provas': [8.7, 9.5, 10],
 'exercícios': [7, 8.5, 7.8, 10]}

## Estruturas condicionais e de repetição

## *if* *else*
Checa se uma condicão é um booleano verdadeiro ou pode ser avaliado como True

In [None]:
sol = 'sim'
if sol == 'sim':
    print('Durante a viagem fará sol!')
else:
    print('Durante a viagem o tempo ficará fechado!')

Podemos colocar mais condicões no nosso código:

In [None]:
sol = 'sim'
temp = 30
if sol == 'sim':
    if temp >= 25:
        print('Durante a viagem fará sol e muito calor!')
    else:
        print('Durante a viagem fará sol mas pouco calor')
else:
    if temp >= 25:
        print('Durante a viagem o tempo ficará fechado e abafado!')
    else:
        print("Durante a viagem o sol não aparecerá e ficará frio")

![](../img/elif_meme.png)

Se há mais de duas possibilidades a serem testadas, use para a primeira, elif (que significa else
if) para as possibilidades intermediárias, e else para a última:

In [1]:
cor = "cor de burro quando foge"

if cor == "vermelho":
    print("A cor é vermelho que nem tomate")
elif cor == "verde":
    print("A cor é verde que nem pimentão")
elif cor == "amarela":
    print("A cor é amarelo que nem banana")
else:
    print("Nunca ouvi falar da cor ", cor)

Nunca ouvi falar da cor  cor de burro quando foge


Abaixo temos a lista de operadores de comparacão que usamos para construir as regras com o comando if/elif/else

![](../img/operadores_logicos.png)

In [10]:
caixa = 1000
divida = 500
(caixa > 800) and (divida < 100)

False

Se você tiver de fazer várias comparacões com o operador *or*, podemos usar o operador de filiacão do Python (membership operator).

In [11]:
letra = "o"

if letra == "a" or letra == "e" or letra == "i" or letra == "o" or letra == "u":
    print(letra, " é uma vogal!")
else:
    print(letra, " não é uma vogal!")

o  é uma vogal!


In [None]:
vogais = "aeiou"
letra = "o"
if letra in vogais:
    print(letra, " é uma vogal!")

## While

O while é usado quando precisamos repetir uma ação enquanto determinadas condições permanecem verdadeiras

In [13]:
conta = 1
while conta <= 5:
    print(conta)
    conta +=1 # mesma coisa que conta = conta + 1

1
2
3
4
5


Se quisermos iterar até algo ocorrer, mas não sabemos quando essa coisa vai ocorrer, podemos usar um *loop* infinito com o comando break

In [15]:
while True:
    value = input("Digite a string a ser capitalizada [digite q para sair]: ")
    if value == "q":
        break
    print(value.capitalize())

Testando
Teste
Bruna
Chat
Um


Às vezes só queremos avancar para o próximo item ao invés de para o *loop*. Nesse caso usamo o comando continue

In [18]:
while True:
    value = input("Digite um numero inteiro[digite q para sair]: ")
    if value == 'q':
        break
    number = int(value) # transforma em inteiro
    if number % 2 == 0: # numero par
        continue
    print(number, "ao quadrado é", number*number)

3 ao quadrado é 9


## For
Com o laço for podemos executar a mesma ação em todos os elementos de uma string, lista, dicionário e tipos de variáveis e estruturas de dados do Python. Essa é uma das maneiras mais comuns para um computador automatizar tarefas repetitivas.

In [30]:
palavra = "tempo"

for letra in palavra:
    print(letra)


t
e
m
p
o


In [32]:
frutas = ['abacaxi', 'melancia', 'amora','abacate', 'uva', 'morango', 'banana']

for fruta in frutas:
    print(fruta)

abacaxi
melancia
amora
abacate
uva
morango
banana


In [36]:
# a funcão range gera uma sequência de valores dentro de um intervalo
for item in range(0,3): # o ultimo valor a ser criado é o 2
    print(item)

0
1
2


In [38]:
for item in range(2, -1, -1): # range(start, stop, step)
    print(item)

2
1
0


In [35]:
for fruta in frutas:
 	if fruta.startswith('a'):
  		print(fruta.capitalize())
 	else:
  		print('A fruta {} não começa com a letra a!'.format(fruta))

Abacaxi
A fruta melancia não começa com a letra a!
Amora
Abacate
A fruta uva não começa com a letra a!
A fruta morango não começa com a letra a!
A fruta banana não começa com a letra a!


Podemos iterar sobre múltiplas listas em paralelo usando a funcão *zip()*

In [51]:
dias = ["segunda", "terca", "quarta", "quinta", "sexta"] # 5 dias
frutas = ['abacaxi', 'melancia', 'amora'] # 3 frutas
bebidas = ["café", "suco", "água", "cerveja", "vinho"] # 5 bebidas
sobremesas = ["pudim", "chocolate", "sorvete","torta", "cookie"] # 5 sobremesas

for dia, fruta, bebida, sobremesa in zip(dias, frutas, bebidas, sobremesas):
    print(dia, ": beber", bebida, " - comer", fruta, "- sair da dieta com", sobremesa) # ordem pode trocar aqui

segunda : beber café  - comer abacaxi - sair da dieta com pudim
terca : beber suco  - comer melancia - sair da dieta com chocolate
quarta : beber água  - comer amora - sair da dieta com sorvete


In [52]:
portugues = ["Segunda-feira", "Terca-feira", "Quarta-feira", "Quinta-feira", "Sexta-feira", "Sábado", "Domingo"]

ingles = ["Monday", "Tuesday", "Wednesday", "Thursday", "Saturaday", "Sunday"]

dicionario = dict(zip(ingles, portugues))
print(dicionario)

{'Monday': 'Segunda-feira', 'Tuesday': 'Terca-feira', 'Wednesday': 'Quarta-feira', 'Thursday': 'Quinta-feira', 'Saturaday': 'Sexta-feira', 'Sunday': 'Sábado'}
