# Estruturas de dados

As estruturas de dados mais comuns em Python são as seguintes:

1. Listas
2. Dicionários
3. Tuplas
4. Conjuntos

Mais tarde, vamos acrescentar mais dois elementos a essa lista: os arrays e os data frames.

Agora, vamos falar sobre listas.

## Listas

Listas são sequências de objetos.  
Cada objeto é identificado pela sua posição na lista.

Uma lista pode conter números...

In [5]:
pares = [0, 2, 4, 6, 8, 10]

... strings...

In [6]:
espiãs = ['Sam','Alex','Clover']

... booleanos...

In [7]:
bools = [True, False, False, True]

... tipos misturados, e até outras listas:

In [8]:
zoeira = [0, 1, 2, 'três', 4.0, [5,6,7,8]]

### Indices e _slicing_

Os elementos de uma lista são identificados pela sua posição na lista, começando a contar do **zero**.  
Essa posição se chama **índice**.  

In [9]:
#Vamos usar essa lista de exemplo
espiãs

['Sam', 'Alex', 'Clover']

In [10]:
espiãs[0]

'Sam'

In [11]:
espiãs[1]

'Alex'

In [12]:
espiãs[2]

'Clover'

Também podemos percorrer uma lista de trás para frente. Para isso, usamos índices negativos:

In [13]:
#Para recordar
espiãs

['Sam', 'Alex', 'Clover']

In [14]:
espiãs[-1]

'Clover'

In [15]:
espiãs[-2]

'Alex'

In [16]:
espiãs[-3]

'Sam'

Também podemos pegar um pedaço de uma lista.

In [17]:
#Vamos usar uma lista maior como exemplo:
skywalkers = ['Luke', 'Leia','Shmi', 'Anakin', 'Han','Ben','Rey']

In [18]:
skywalkers[2:4]

['Shmi', 'Anakin']

Note que o primeiro elemento é incluído. O último não.

Quando um índice é omitido, ele representa o início ou o final da lista.

In [19]:
skywalkers[:3]

['Luke', 'Leia', 'Shmi']

In [20]:
skywalkers[3:]

['Anakin', 'Han', 'Ben', 'Rey']

### Acrescentando um elemento a uma lista

Podemos acrescentar elementos à lista usando o método `.append`

In [21]:
skywalkers.append('Johny Walker')

In [24]:
skywalkers

['Luke', 'Leia', 'Shmi', 'Anakin', 'Han', 'Ben', 'Rey', 'Johny Walker']

### Criando uma lista

Podemos criar uma lista usando uma regra:

In [25]:
divisores_de_60 = []
for i in range(1, 61):
    if 60 % i == 0:
        divisores_de_60.append(i)

divisores_de_60

[1, 2, 3, 4, 5, 6, 10, 12, 15, 20, 30, 60]

Uma forma mais suscinta de fazer isso é usando _list comprehension_:

In [26]:
divisores_de_60 = [i for i in range(1,61) if 60 % i == 0]
divisores_de_60

[1, 2, 3, 4, 5, 6, 10, 12, 15, 20, 30, 60]

### Iterando por uma lista

Uma lista é um **iterável**. Isso significa que podemos percorrer todos os elementos de uma lista usando um _for loop_:

In [27]:
for jedi in skywalkers:
    print('The Force is strong with you, ' + jedi + ' Skywalker!')

The Force is strong with you, Luke Skywalker!
The Force is strong with you, Leia Skywalker!
The Force is strong with you, Shmi Skywalker!
The Force is strong with you, Anakin Skywalker!
The Force is strong with you, Han Skywalker!
The Force is strong with you, Ben Skywalker!
The Force is strong with you, Rey Skywalker!
The Force is strong with you, Johny Walker Skywalker!


Às vezes queremos iterar pelos elementos de uma lista _sabendo em que posição estamos_. Para isso, podemos usar o comando __enumerate__:

In [28]:
for i, jedi in enumerate(skywalkers):
    print(f'Jedi número {i}: {jedi} Skywalker')

Jedi número 0: Luke Skywalker
Jedi número 1: Leia Skywalker
Jedi número 2: Shmi Skywalker
Jedi número 3: Anakin Skywalker
Jedi número 4: Han Skywalker
Jedi número 5: Ben Skywalker
Jedi número 6: Rey Skywalker
Jedi número 7: Johny Walker Skywalker


### Aplicando funções a listas

In [29]:
#Vamos usar essa lista como exemplo
numeros = [5,3,2,1,4]
numeros

[5, 3, 2, 1, 4]

Podemos calcular o número de elementos de uma lista...

In [30]:
len(numeros)

5

...colocá-la em ordem...

In [31]:
sorted(numeros)

[1, 2, 3, 4, 5]

In [32]:
sorted(numeros, reverse=True)

[5, 4, 3, 2, 1]

...somar seus elementos...

In [33]:
sum(numeros)

15

... e, com a ajuda de outros pacotes, podemos também calcular o produto...

In [34]:
from numpy import prod
prod(numeros)

120

... e a média:

In [35]:
from numpy import mean
mean(numeros)

3.0

Também podemos aplicar uma função que não exista previamente usando `list`, `map` e `lambda`:

In [38]:
list(map(lambda x: 2*x, numeros))

[10, 6, 4, 2, 8]

Uma lista também pode ser filtrada com base em uma condição:

In [39]:
#Selecionar apenas os elementos maiores que 3
list(filter(lambda x: x > 3, numeros))

[5, 4]

### Desempacotando uma lista

In [40]:
a, b, c, _ = [10, 11, 12, 13]

In [41]:
a

10

In [42]:
b

11

In [43]:
c

12

### Alguns tipos especiais de lista

#### Lista de números consecutivos

In [44]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [45]:
list(range(15, 21))

[15, 16, 17, 18, 19, 20]

#### Lista de números seguidos mas "pulando"
(vulgo Progressão Aritmética)

In [46]:
list(range(10, 20, 2))

[10, 12, 14, 16, 18]

#### Lista de números aleatórios

In [47]:
from numpy.random import random
list(random(5))

[0.06327460849358446,
 0.9332043776551415,
 0.9050386814489007,
 0.2696388312230047,
 0.29198999175103146]

In [48]:
from numpy.random import normal
list(normal(size=5))

[0.03461394833285447,
 -1.262778636266097,
 -1.5559536149409403,
 -1.011733901914601,
 0.4929606318857703]

In [49]:
list(normal(loc=6, scale=0.3, size=5))

[5.609855969951211,
 5.968415947223859,
 6.006393100546251,
 6.122196765604371,
 6.406068363048941]

In [50]:
from numpy.random import poisson
list(poisson(3, size=5))

[1, 2, 3, 1, 3]

## Tuplas
Uma tupla é que nem uma lista, mas ela não pode ser alterada.

In [51]:
pokemons = ('Pikachu','Bulbassauro','Charmander')

In [52]:
pokemons[1]

'Bulbassauro'

In [53]:
for p in pokemons:
    print(p + ', eu escolho você!!!')

Pikachu, eu escolho você!!!
Bulbassauro, eu escolho você!!!
Charmander, eu escolho você!!!


Se tentamos modificar uma tupla, o Python ou dá erro...

In [54]:
pokemons.append('Magicarp')

AttributeError: 'tuple' object has no attribute 'append'

... ou transforma a tupla em uma lista:

In [55]:
sorted(pokemons)

['Bulbassauro', 'Charmander', 'Pikachu']

Para transformar uma tupla numa lista ou uma lista numa tupla, podemos usar os comandos `list` e `tuple`:

In [56]:
list(pokemons)

['Pikachu', 'Bulbassauro', 'Charmander']

In [58]:
tuple(skywalkers)

('Luke', 'Leia', 'Shmi', 'Anakin', 'Han', 'Ben', 'Rey', 'Johny Walker')

Em uma igualdade de tuplas, cada termo da primeira tupla é igual ao termo correspondente da segunda:

In [64]:
a, b = (1, 2)
print(f'a = {a} e b = {b}')

a = 1 e b = 2


Não precisamos dos parêntesis para definir uma tupla:

In [65]:
a, b = 1, 2
print(f'a = {a} e b = {b}')

a = 1 e b = 2


Isso pode ser usado para trocar variáveis:

In [69]:
a = 1
b = 2

a, b = b, a

print(f'a = {a} e b = {b}')

a = 2 e b = 1


Quando uma função retorna vários outputs, é usual que a resposta venha em uma tupla:

In [71]:
def dobro_triplo_quadruplo(x):
    return(2*x, 3*x, 4*x)

dobro_triplo_quadruplo(5)

(10, 15, 20)

In [89]:
from scipy.stats import norm, ttest_ind

x1 = norm.rvs(loc=0, scale = 1, size=100)
x2 = norm.rvs(loc=1, scale = 1, size=100)

print("x1: ", x1)
print("\n")
print("x2: ", x2)

x1:  [ 1.92016599 -1.02065341 -1.35050716  0.52694381  0.58725958 -1.6431059
 -0.93712062 -1.28155859 -1.76122572  0.31165797  1.2581435   1.23499619
  0.03353346  2.28392755 -1.08260785  0.28509081 -1.0053617   0.56614829
 -0.11993373 -0.74797521 -0.15656596  1.51518917 -0.91411746 -0.66967175
  0.13519602 -0.29174042 -0.05494518  0.14013783  0.65403494 -0.603377
  1.74391112 -0.52862416 -0.84401474  2.03992736 -0.26230975  0.94852255
  0.00372446  1.4998793   0.43979442  0.48758074  0.9683589   0.59044252
 -1.04326995  0.80246692  1.46698755  0.52057657  1.1741249   2.07921732
 -0.34442651 -0.14715581  0.76725577  0.53378399 -0.69953212 -0.85045546
 -1.04070413 -0.30815709 -0.42886859 -0.32959428 -1.04989179  0.62958199
  0.33295349 -1.25872474 -1.06659449 -1.74808148  0.66865335 -0.52592726
 -3.07526252 -0.38058286  0.77919039  0.65099851  2.01574685 -0.61517072
 -0.78530673 -2.16181982  0.61326122 -0.05330667 -0.56545309 -0.11386375
 -0.99166638  0.25014531  0.82148586  0.60104814 

In [90]:
ttest_ind(x1,x2, equal_var=True)

Ttest_indResult(statistic=-8.252180702704944, pvalue=2.1555891868289663e-14)

In [91]:
t, p = ttest_ind(x1,x2)
print(f't = {t}')
print(f'valor-p = {p}')

t = -8.252180702704944
valor-p = 2.1555891868289663e-14


## Conjuntos

Em uma lista/tupla, os elementos têm uma ordem.  
Em um conjunto, não.
Além disso, um conjunto não têm elementos repetidos.

In [92]:
#Uma turma de 5 alunos.
#Cada aluno votou em quem é o melhor professor...
votos_dos_alunos = ['Felipe','Felipe','Felipe','Socrates','Felipe']

professores_que_receberam_votos = set(votos_dos_alunos)

list(professores_que_receberam_votos)

['Socrates', 'Felipe']

Nós não vamos usar muito conjuntos. Quando usarmos, falaremos mais sobre eles.