# Introdução ao Python para análise exploratória de dados - aula01

![](../img/intro_python.png)

 Na última aula falamos sobre os tipos mais simples de variáveis do Python. Nesta aula falaremos sobre variáveis mais complexas, mas que ainda assim fazem parte do conjunto de variáveis nativas (*built-in*) do Python: lista, tupla e dicionário.

**Lista:** é uma coleção de itens armazenados de forma sequencial e ordenada.
Podemos colocar qualquer informação em uma lista e os itens dela não precisam ser relacionados. As listas são acessadas por meio de um índice entre colchetes (lembrando que o Python inicia a indexação do 0).

**Tupla:** também é uma coleção de itens, porém imutável.
Uma vez criada, não podemos remover, adicionar ou alterar nenhum de seus itens. Contudo, se um dos itens da mesma é um objeto mutável (uma lista, por exemplo), é possível altera-lo, mas a tupla em si não muda.

**Dicionário:** coleção não ordenada de pares chave-valor, onde cada elemento possui uma chave (um nome) associado.
Cada item pode ser acessado por essa chave que deve ser um valor imutável de qualquer tipo (string, numérico ou tupla, por exemplo)

## Lista

In [2]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9] # atribuição da lista na variável filme
print(filme)

['Pulp fiction', 1994, 'Crime/Drama', 8.9]


In [3]:
filme[0] # acessando os elementos da lista através do índica, onde o Python indexa a partir do 0

'Pulp fiction'

In [4]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']] # lista dentro lista

In [5]:
filme[4]

['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']

In [10]:
filme[4][1] # para acessar um dos elementos da lista dentro da lista

'Uma Thurman'

### Comandos para usar com listas

Os principais métodos (comandos) associados ao objeto lista são:

**.count()** # conta quantas vezes um dado valor ocorre dentro da lista.

**.append()** # acrescenta dados ao final de uma lista.

**.insert()** # insere um elemento em uma posicão específica da lista. É computacionalmente mais custoso do que append, pois internamente o Python terá que atualizar todos os índices.

**.pop** # operacão inversa do insert, ou seja, remove um elemento de um índice específico e o mostra na tela.

**.remove** # localiza o primeiro valor correspondente e o remove da lista.

**.join()** # gruda os elementos de uma sequência de strings, usando um parâmetro fornecido. Só funciona com lista de strings.

**.split()** # separa uma string com base em algum caracter, criando assim uma lista de strings.

**.sort()** # ordena uma lista *in place*, ou seja, sem criar um novo objeto, salvando em cima do mesmo.



In [13]:
filme = ['Pulp fiction', 1994, 'Crime/Drama', 8.9,
         ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']]
filme.count(1994) # neste caso, ele não conta os itens da lista dentro da lista

1

In [14]:
filme.append("Quentin Tarantino")
print(filme)

['Pulp fiction', 1994, 'Crime/Drama', 8.9, ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'], 'Quentin Tarantino']


In [15]:
filme.insert(1, "Quentin Tarantino")
filme

['Pulp fiction',
 'Quentin Tarantino',
 1994,
 'Crime/Drama',
 8.9,
 ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'],
 'Quentin Tarantino']

In [16]:
filme.remove("Quentin Tarantino") # remove somente a primeira ocorrência do termo utilizado no argumento
filme

['Pulp fiction',
 1994,
 'Crime/Drama',
 8.9,
 ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson'],
 'Quentin Tarantino']

In [12]:
atores = ['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']
' e '.join(atores) # junta todos os elementos da lista em uma única string com a string indicada na função (neste caso, ' e ')

'John Travolta e Uma Thurman e Samuel L. Jackson'

In [15]:
notas = '9, 94, 5' # string de números atribuidos à variável notas
notas.split(',') # para separar a string, criando uma lista de strings, basta usar o split baseado na ',' (elemento que está separando)
# Logo, split é o contrário do join

['9', ' 94', ' 5']

In [16]:
notas = notas.split(',') # salvando a lista na variável notas

In [23]:
notas # nota-se que os números foram separados, mas estão entre aspas e, consequentemente, o Python os interpreta como strings, ou seja, não é possível
# realizar cálculos

['9', ' 94', ' 5']

In [20]:
# Uma das formas de transformar as strings em números, utiliza o laço for
notas_int = [] # crio uma lista vazia que vai receber os numeros como int
for n in notas: # o laço for olha cada elemento da lista, ou seja, para cada n dentro da lista notas
    n = int(n) # transforma o n em inteiro
    notas_int.append(n) # vou salvando cada um dos números transformados para o tipo int na lista vazia criada
print(notas_int)
print(type(notas_int[0]))

[9, 94, 5]
<class 'int'>


In [45]:
notas_int.sort()
notas_int

[5, 9, 94]

In [24]:
atores

['John Travolta', 'Uma Thurman', 'Samuel L. Jackson']

In [27]:
atores.sort(key=len) # o sort sem argumento organiza a string por ordem alfabética
# Contudo, é possível passar o argumento key=len para o sort , onde a ordenação é feita pelo tamanho das strings
atores

['Uma Thurman', 'John Travolta', 'Samuel L. Jackson']

In [31]:
# no caso de uma lista de números, é possível organizar em ordem crescente não usando nenhum argumento ou usando o argumento reverse=false,
# e para ordem decrescente se utiliza o argumento reverse=true

idade = [1, 5, 2]
# idade.sort() # ordem crescente
idade.sort(reverse=True)  # ordem decrescente
idade

[5, 2, 1]

Podemos checar se uma lista contém um dado valor usando o operador *in*.
Também podemos checar se uma lista **não** contém um dado valor usando o operador *not* em conjunto.

In [36]:
1994 in filme

True

In [37]:
1994 not in filme

False

## Tupla

In [2]:
# Enquanto para a criação de listas se utiliza []. Para a criação de tuplas não se usa nada ou ():
avaliacao = 'ótimo', 'bom', 'regular', 'ruim', 'péssimo'
opiniao = ('ótimo', 'bom', 'regular', 'ruim', 'péssimo')
avaliacao == opiniao # para verificar igualdade. Atribuição usa apenas um "="

True

In [3]:
a = (1,) # para criar uma tupla de 1 elemento usamos o parênteses e a vírgula

In [4]:
type(a)

tuple

In [7]:
b = (1) # como não usei a vírcula, então a variável criada é um int

In [6]:
type(b)

int

Enquanto os objetos armazenados em uma tupla podem ser mutáveis, uma vez que ela é criada não é possível modificar os objetos que estão armazenados em cada índice dela.

In [3]:
tup = tuple(['foo', [1, 2], True]) # comando tuple transforma uma lista em tupla
# tup[2] = False # a tupla é imutável
type(tup)

tuple

Se um objeto dentro da tupla é mutável, como uma lista, você pode alterá-lo.

In [4]:
# Para mudar a lista localizada dentro da tupla, temos que acessar a posição dela, no caso [1]
tup[1].append(3) # estamos mudando a lista que está dentro da tupla e não a tupla em si
tup

('foo', [1, 2, 3], True)

In [5]:
tup[1] = [1,2] # neste caso, ao tentar inserir uma lista nova dentro da tupla, ocorre um erro, pois a tupla é imutável

TypeError: 'tuple' object does not support item assignment

### Comandos para usar com tuplas
Já que o tamanho e o conteúdo de uma tupla não podem ser modificados, os comandos (ou métodos) relacionados a este tipo de objeto são poucos. Um método útil é o método *.count()* que também vimos disponível para listas

In [8]:
tup.count('foo')

1

Nota-se que a tupla é útil ao desenvolvermos uma análise em que alguns dados não podem mudar em nenhum momento, por mais que o usuário tente de forma voluntária ou involuntária.

## Dicionário

In [52]:
participante = {} # cria um dicionário vazio

Usamos colchetes para criar um dicionário e dois pontos para separa os pares de chave-valor.

In [9]:
participante = {'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

Podemos acessar, inserir ou configurar os elementos de um dicionário com a mesma sintaxe usada para acessar elementos de uma lista ou tupla, ou no caso específico de dicionários, através das chaves.

In [12]:
# Inserção de um novo par chave-valor, onde dentro do colchete colocamos a chave e atribuimos o valor correspondente
participante["faltas"] = 2
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10, 'faltas': 2}

In [16]:
# Para consultar o número de faltas
participante["nome"]

'Bruna'

In [18]:
"curso" in participante # também podemos usar o operador in com dicionários, o qual vai ler somente as chaves

True

### Comandos para usar com dicionários
**del** # deleta um valor

**.pop()** # simultâneamente retorna o valor e deleta a chave

**.keys()** # retorna todas as chaves que o dicionário possui

**.values()** # retorna os valores armazenados no dicionário

**.update()** # junta dois dicionários

**.items()** # retorna o par chave-valor como tupla. Útil quando precisamos iterar sobre os dois.



In [19]:
del participante['faltas'] # apaga o item através da indicação da chave dentro dos colchetes
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [21]:
participante[5] = "número da chamada" # criação de um novo par chave-valor (a chave pode ser número)
participante

{'nome': 'Bruna',
 'curso': 'Lógica de programação',
 'nota': 10,
 5: 'número da chamada'}

In [22]:
participante.pop(5) # remove o elemento do dicionário a partir da sua chave e retorna qual o valor associado que foi deletado

'número da chamada'

In [23]:
participante

{'nome': 'Bruna', 'curso': 'Lógica de programação', 'nota': 10}

In [24]:
participante.keys() # retorna as chaves do dicionário

dict_keys(['nome', 'curso', 'nota'])

In [25]:
participante.values() # retorna os valores do dicionário

dict_values(['Bruna', 'Lógica de programação', 10])

In [28]:
participante.items() # retorna os pares chave-valor em tuplas. No exemplo, três tuplas

dict_items([('nome', 'Bruna'), ('curso', 'Lógica de programação'), ('nota', 10)])

In [30]:
notas = {"curso": "Introdução à Lógica de Programação com Python", "nota": 10, "provas": [8.7, 9.5, 10], "exercícios": [7, 8.5, 7.8, 10]}

participante.update(notas) # junta os dicionários participante e notas. Neste caso, participante recebe notas
participante

{'nome': 'Bruna',
 'curso': 'Introdução à Lógica de Programação com Python',
 'nota': 10,
 'provas': [8.7, 9.5, 10],
 'exercícios': [7, 8.5, 7.8, 10]}

In [39]:
adrian = {"curso": "Introdução à Lógica de Programação com Python", "nota": 10, "faltas": 3}
alan = {"curso": "Introdução à Lógica de Programação com Python", "nota": 9, "faltas": 5}
andrei = {"curso": "Introdução à Lógica de Programação com Python", "nota": 7, "faltas": 0}
claudio = {"curso": "Introdução à Lógica de Programação com Python", "nota": 8.5, "faltas": 1}
simone = {"curso": "Introdução à Lógica de Programação com Python", "nota": 9.5, "faltas": 2}
alunos = {1111:adrian,2222:alan,3333:andrei,4444:claudio,5555:simone} # dicionário com chave matrícula e valor a outra biblioteca contendo
# as características de cada aluno
alunos

{1111: {'curso': 'Introdução à Lógica de Programação com Python',
  'nota': 10,
  'faltas': 3},
 2222: {'curso': 'Introdução à Lógica de Programação com Python',
  'nota': 9,
  'faltas': 5},
 3333: {'curso': 'Introdução à Lógica de Programação com Python',
  'nota': 7,
  'faltas': 0},
 4444: {'curso': 'Introdução à Lógica de Programação com Python',
  'nota': 8.5,
  'faltas': 1},
 5555: {'curso': 'Introdução à Lógica de Programação com Python',
  'nota': 9.5,
  'faltas': 2}}

In [41]:
alunos[1111] # consulta o conteúdo da chave 1111

{'curso': 'Introdução à Lógica de Programação com Python',
 'nota': 10,
 'faltas': 3}

In [44]:
alunos[1111]['curso'] # consulta o conteúdo do dicionário do dicionário

'Introdução à Lógica de Programação com Python'

## Estruturas condicionais e de repetição

## *if* *else*
Checa se uma condicão é um booleano verdadeiro ou pode ser avaliado como True

In [45]:
sol = 'sim'
if sol == 'sim':
    print('Durante a viagem fará sol!')
else:
    print('Durante a viagem o tempo ficará fechado!')

Durante a viagem fará sol!


Podemos colocar mais condicões no nosso código:

In [46]:
sol = 'sim'
temp = 30
if sol == 'sim':
    if temp >= 25:
        print('Durante a viagem fará sol e muito calor!')
    else:
        print('Durante a viagem fará sol mas pouco calor')
else:
    if temp >= 25:
        print('Durante a viagem o tempo ficará fechado e abafado!')
    else:
        print("Durante a viagem o sol não aparecerá e ficará frio")

Durante a viagem fará sol e muito calor!


![](../img/elif_meme.png)

Se há mais de duas possibilidades a serem testadas, use if para a primeira, elif (que significa else
if) para as possibilidades intermediárias, e else para a última:

In [50]:
cor = "cor de burro quando foge"

if cor == "vermelho":
    print("A cor é vermelho que nem tomate")
elif cor == "verde":
    print("A cor é verde que nem pimentão")
elif cor == "amarela":
    print("A cor é amarelo que nem banana")
else:
    print("Nunca ouvi falar da cor", cor)

Nunca ouvi falar da cor cor de burro quando foge


Abaixo temos a lista de operadores de comparação que usamos para construir as regras com o comando if/elif/else

![](../img/operadores_logicos.png)

In [51]:
caixa = 1000
divida = 500
(caixa > 800) and (divida < 100)

False

Se você tiver de fazer várias comparacões com o operador *or*, podemos usar o operador de filiacão do Python (membership operator).

In [52]:
letra = "o"

if letra == "a" or letra == "e" or letra == "i" or letra == "o" or letra == "u":
    print(letra, "é uma vogal!")
else:
    print(letra, "não é uma vogal!")

o é uma vogal!


In [56]:
vogais = 'aeiou'
letra = "o"
if letra in vogais:
    print(letra, "é uma vogal!")

o é uma vogal!


## While

O while é usado quando precisamos repetir uma ação enquanto determinadas condições permanecem verdadeiras

In [60]:
conta = 1
while conta <= 5:
    print(conta)
    conta +=1 # mesma coisa que conta = conta + 1

# ou seja, o print e o incremento da variável conta ocorre enquanto a condição permanece verdadeira. A partir do momento que conta > 5, o Python sai
# sai desse trecho de código 

1
2
3
4
5


Se quisermos iterar até algo ocorrer, mas não sabemos quando essa coisa vai ocorrer, podemos usar um *loop* infinito com o comando break

In [7]:
while True:
    value = input("Digite a string a ser capitalizada [digite q para sair]: ")
    if value == "q":
        break
    print(value.capitalize())


Simone
Jose
Andrei
Adrian
Alan


Às vezes só queremos avançar para o próximo item ao invés de para o *loop*. Nesse caso usamo o comando continue

In [9]:
while True:
    value = input("Digite um numero inteiro[digite q para sair]: ")
    if value == 'q':
        break
    number = int(value) # transforma em inteiro
    if number % 2 == 0: # numero par
        continue
    print(number, "ao quadrado é", number*number)

1 ao quadrado é 1
3 ao quadrado é 9
5 ao quadrado é 25
7 ao quadrado é 49
9 ao quadrado é 81
11 ao quadrado é 121
13 ao quadrado é 169
15 ao quadrado é 225


## For
Para consolidar os dados em uma única planilha, muitas vezes precisamos busca-los de diversas fontes. Nesse processo, se utiliza muito a estrutura de repetição ou laço for. Com o laço for podemos executar a mesma ação em todos os elementos de uma string, lista, dicionário e tipos de variáveis e estruturas de dados do Python. Essa é uma das maneiras mais comuns para um computador automatizar tarefas repetitivas.

In [11]:
# Uso do for com uma string
palavra = "tempo"

for letra in palavra: # a variável tempo é criada agora, ou seja, só existe nesse laço
    print(letra)


t
e
m
p
o


In [21]:
# Uso do for com uma lista
frutas = ['abacaxi', 'melancia', 'amora','abacate', 'uva', 'morango', 'banana']

for fruta in frutas:
    print(fruta)

abacaxi
melancia
amora
abacate
uva
morango
banana


In [16]:

# a funcão range gera uma sequência de valores dentro de um intervalo (só funciona dentro do for)
for item in range(0,3): # o ultimo valor a ser criado é o 2
    print(item)
# No lugar do range, poderiamos criar uma lista de números, mas ele facilita caso seja uma lista muito grande

0
1
2


In [20]:
# No range, é possível determinar o número de casas step a serem puladas. Por exemplo:
for item in range(2, -1, -1): # range(start, stop, step), onde o -1 indica que é uma lista decrescente
    print(item)

2
1
0


In [26]:
frutas

['abacaxi', 'melancia', 'amora', 'abacate', 'uva', 'morango', 'banana']

In [30]:
for fruta in frutas:
	if fruta.startswith('a'):
		print(fruta.capitalize())
	else:
		print('A fruta {} não começa com a letra a!'.format(fruta)) # forma 2 de usar o print
#		print('A fruta', fruta, 'não começa com a letra a!') # forma 1 de usar o print
		

Abacaxi
A fruta melancia não começa com a letra a!
Amora
Abacate
A fruta uva não começa com a letra a!
A fruta morango não começa com a letra a!
A fruta banana não começa com a letra a!


Podemos iterar sobre múltiplas listas em paralelo usando a funcão *zip()*, ou seja, fazendo um loop em todas as listas ao mesmo tempo olhando cada um dos elementos 

In [31]:
dias = ["segunda", "terca", "quarta", "quinta", "sexta"] # 5 dias
frutas = ['abacaxi', 'melancia', 'amora'] # 3 frutas
bebidas = ["café", "suco", "água", "cerveja", "vinho"] # 5 bebidas
sobremesas = ["pudim", "chocolate", "sorvete","torta", "cookie"] # 5 sobremesas

for dia, fruta, bebida, sobremesa in zip(dias, frutas, bebidas, sobremesas): # listas zipadas
    print(dia, ": beber", bebida, " - comer", fruta, "- sair da dieta com", sobremesa) # ordem pode trocar aqui

# Notar que a iteração só ocorre até o último elemento da menor lista

segunda : beber café  - comer abacaxi - sair da dieta com pudim
terca : beber suco  - comer melancia - sair da dieta com chocolate
quarta : beber água  - comer amora - sair da dieta com sorvete


In [1]:
portugues = ["Segunda-feira", "Terca-feira", "Quarta-feira", "Quinta-feira", "Sexta-feira", "Sábado", "Domingo"]

ingles = ["Monday", "Tuesday", "Wednesday", "Thursday", "Saturaday", "Sunday"]

dicionario = dict(zip(ingles, portugues))
print(dicionario)

# para atrelar as duas listas, uso o comando o zip, e para transformar em um dicionário, usa o comando dict

{'Monday': 'Segunda-feira', 'Tuesday': 'Terca-feira', 'Wednesday': 'Quarta-feira', 'Thursday': 'Quinta-feira', 'Saturaday': 'Sexta-feira', 'Sunday': 'Sábado'}
