# Estruturas de Dados em Python

## Trabalhando com listas, dicionários, sets, tuplas e strings

In [78]:
# Só carregando um dado qualquer pra gente brincar
import json
with open('musicas.json') as f:
    response = json.loads(f.read())

### Listas

In [76]:
# Listas
# 
#
# São objetos **mutáveis** que podem conter valores de um ou mais tipos.
lista = [1, 'a']
print(lista)

# Aonde cada elemento pode ser modificado
lista[1] = 2
print(lista)

# E suportam adições de outros iteráveis
lista2 = [3,4]
lista += lista2
print(lista)
lista3 = [5,6]
lista + lista3
print(lista)
# Percebe que o operador + só retorna uma nova lista contendo todos os valores?

# Uma forma de não criar uma nova lista é usar o extend - tende a ser mais rápido.
lista.extend(lista3)
print(lista)

# Pra adicionar um único objeto
lista.append(7)
print(lista)

[1, 'a']
[1, 2]
[1, 2, 3, 4]
[1, 2, 3, 4]
[1, 2, 3, 4, 5, 6]
[1, 2, 3, 4, 5, 6, 7]


In [81]:
# List comprehensions
#
#
# São formas simples de criarmos listas aonde cada elemento é um resultado de
# uma ou mais operações aplicada a cada membro de uma sequência ou iterável.
#
# No exemplo abaixo, estamos criando uma lista a partir de um dicionário.
track_names = [x['name'] for x in response['recenttracks']['track']]

In [84]:
# Slices - recap
#
# Listas também são sequências (https://docs.python.org/3/glossary.html#term-sequence)
# Sequências podem ser indexadas e "fatiadas".
print(track_names[:5]) # apenas os 5 primeiros
print(track_names[-5:]) # apenas os 5 últimos
print(len(track_names)) # tamanho da lista
print(track_names[len(track_names)-5:]) # se tiverem duvidando
print(track_names[len(track_names)-5:len(track_names)]) # se tiverem duvidando mais ainda

# Utilize os recursos da linguagem pra ganhar legibilidade!

['Every Breath You Take (feat. Liza Anne)', 'Take Me Home, Country Roads', 'Fast Car (feat. Tall Heights)', 'God is a Woman (615 Sessions)', "I'm Not The Only One - Live From Spotify, London"]
['All Night', 'Talking Body', 'Let Me Hold You (Turn Me On)', 'Bloom', 'Take Me on the Floor']
201
['All Night', 'Talking Body', 'Let Me Hold You (Turn Me On)', 'Bloom', 'Take Me on the Floor']
['All Night', 'Talking Body', 'Let Me Hold You (Turn Me On)', 'Bloom', 'Take Me on the Floor']


In [44]:
# Voltando em list comprehensions - uma outra forma de usar.
numbers = [1,2,3,4,5,6,7,8,9,10]
squares = [x**2 for x in numbers]
print(squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [94]:
# Encontrando itens na lista
for i in range(len(track_names)):
    if track_names[i] == 'Debaser':
        print(i)

# Ou... s
track_names.index('Debaser')

7
33
48


7

In [92]:
# E se não existir?
track_names.index('Halo')

ValueError: 'Halo' is not in list

In [115]:
# Ordenando items
track_names.sort()
print(track_names[:5])
# E revertendo items
track_names.reverse()
print(track_names[:5])

# Ou sortear por uma key (https://docs.python.org/3/howto/sorting.html#key-functions)
track_names.sort(key = lambda s: len(s))
print(track_names[:5])
# Ou ainda... 
track_names.sort(key = len)
print(track_names[:5])

track_names.sort() # restaurando a lista

['(Hey Why) Miss You Sometime', '(Hey Why) Miss You Sometime', 'All Night', 'Alma Sebosa', 'Amor Marginal']
["You've Got the Love", 'You Only Live Once', 'Wild Things - Acoustic Version', "Why'd You Only Call Me When You're High?", 'Where Is My Mind?']
['Tua', 'Sex', 'Sex', 'Hey', 'DIY']
['Tua', 'Sex', 'Sex', 'Hey', 'DIY']


In [116]:
# Contando items na lista
print(track_names.count('Wave of Mutilation (UK Surf)'))

2


### Dicionários

In [117]:
# Gerando um dicionário com o count das músicas e dict comprehensions
dict_tracks = {track_name:track_names.count(track_name) for track_name in track_names}
print(dict_tracks)
## Porque não tivemos chaves repetidas?

{'(Hey Why) Miss You Sometime': 2, 'All Night': 1, 'Alma Sebosa': 1, 'Amor Marginal': 1, 'Asleep - 2011 Remaster': 1, 'Back to Bad': 1, 'Bang Bang': 1, 'Beautiful War': 1, 'Bird of Prey': 1, 'Bloom': 1, "Boys Don't Cry": 1, 'Brasa': 1, 'Brick by Boring Brick': 1, 'Broken Face (Live from the Fallout Shelter)': 1, 'Bédi Beat': 1, 'Caetano Veloso': 1, 'Caeu': 1, 'Can We Pretend (feat. Cash Cash)': 1, 'Candura': 1, 'Caribou (Live from the Fallout Shelter)': 1, 'Catfish Kate': 4, 'Celebrity Skin': 1, 'Chandelier': 1, 'Cherub Rock - Remastered 2011': 1, 'Circle Game': 1, 'City Grrrl': 1, 'Corpo Fechado': 1, 'Counting Bodies Like Sheep to the Rhythm of the War Drums': 1, 'Creep': 1, 'Crise de Carência': 1, 'DIY': 1, 'Daniel Boone': 1, 'Death Horizon': 1, 'Debaser': 3, 'Dia a dia, lado a lado': 1, 'Do I Wanna Know?': 1, 'Do the Evolution': 1, 'Dog Days Are Over': 1, "Don't Cry (original)": 1, 'Dói D+': 1, 'Eat Greens': 1, 'Ensaio Sobre Ela': 1, 'Eu Vou Fazer uma Macumba pra te Amarrar, Maldito

In [118]:
# Ou fazendo na mão...
dict_tracks = {}
for track_name in track_names:
    if dict_tracks.get(track_name) is None:
        dict_tracks[track_name] = 0
    dict_tracks[track_name] += 1
print(dict_tracks)

{'(Hey Why) Miss You Sometime': 2, 'All Night': 1, 'Alma Sebosa': 1, 'Amor Marginal': 1, 'Asleep - 2011 Remaster': 1, 'Back to Bad': 1, 'Bang Bang': 1, 'Beautiful War': 1, 'Bird of Prey': 1, 'Bloom': 1, "Boys Don't Cry": 1, 'Brasa': 1, 'Brick by Boring Brick': 1, 'Broken Face (Live from the Fallout Shelter)': 1, 'Bédi Beat': 1, 'Caetano Veloso': 1, 'Caeu': 1, 'Can We Pretend (feat. Cash Cash)': 1, 'Candura': 1, 'Caribou (Live from the Fallout Shelter)': 1, 'Catfish Kate': 4, 'Celebrity Skin': 1, 'Chandelier': 1, 'Cherub Rock - Remastered 2011': 1, 'Circle Game': 1, 'City Grrrl': 1, 'Corpo Fechado': 1, 'Counting Bodies Like Sheep to the Rhythm of the War Drums': 1, 'Creep': 1, 'Crise de Carência': 1, 'DIY': 1, 'Daniel Boone': 1, 'Death Horizon': 1, 'Debaser': 3, 'Dia a dia, lado a lado': 1, 'Do I Wanna Know?': 1, 'Do the Evolution': 1, 'Dog Days Are Over': 1, "Don't Cry (original)": 1, 'Dói D+': 1, 'Eat Greens': 1, 'Ensaio Sobre Ela': 1, 'Eu Vou Fazer uma Macumba pra te Amarrar, Maldito

In [119]:
# Dá pra ser mais elegante?
from collections import defaultdict
dict_tracks = defaultdict(int)
for track_name in track_names:
    dict_tracks[track_name] += 1
print(dict_tracks)

defaultdict(<class 'int'>, {'(Hey Why) Miss You Sometime': 2, 'All Night': 1, 'Alma Sebosa': 1, 'Amor Marginal': 1, 'Asleep - 2011 Remaster': 1, 'Back to Bad': 1, 'Bang Bang': 1, 'Beautiful War': 1, 'Bird of Prey': 1, 'Bloom': 1, "Boys Don't Cry": 1, 'Brasa': 1, 'Brick by Boring Brick': 1, 'Broken Face (Live from the Fallout Shelter)': 1, 'Bédi Beat': 1, 'Caetano Veloso': 1, 'Caeu': 1, 'Can We Pretend (feat. Cash Cash)': 1, 'Candura': 1, 'Caribou (Live from the Fallout Shelter)': 1, 'Catfish Kate': 4, 'Celebrity Skin': 1, 'Chandelier': 1, 'Cherub Rock - Remastered 2011': 1, 'Circle Game': 1, 'City Grrrl': 1, 'Corpo Fechado': 1, 'Counting Bodies Like Sheep to the Rhythm of the War Drums': 1, 'Creep': 1, 'Crise de Carência': 1, 'DIY': 1, 'Daniel Boone': 1, 'Death Horizon': 1, 'Debaser': 3, 'Dia a dia, lado a lado': 1, 'Do I Wanna Know?': 1, 'Do the Evolution': 1, 'Dog Days Are Over': 1, "Don't Cry (original)": 1, 'Dói D+': 1, 'Eat Greens': 1, 'Ensaio Sobre Ela': 1, 'Eu Vou Fazer uma Macu

In [120]:
# Ou até usar counters...
from collections import Counter
counter = Counter(track_names)
print(counter.most_common(15))

[('Catfish Kate', 4), ('Debaser', 3), ('(Hey Why) Miss You Sometime', 2), ('Every Breath You Take (feat. Liza Anne)', 2), ('Fast Car (feat. Tall Heights)', 2), ("Free Fallin' - Live at the Nokia Theatre, Los Angeles, CA - December 2007", 2), ('Gigantic', 2), ('God is a Woman (615 Sessions)', 2), ('Gouge Away', 2), ("I'm Not The Only One - Live From Spotify, London", 2), ('In the Arms of Mrs. Mark of Cain', 2), ('Long Rider', 2), ('Los Surfers Muertos', 2), ('Monkey Gone to Heaven', 2), ('On Graveyard Hill', 2)]


### Sets

In [121]:
# Sets são listas que não aceitam duplicidade
unique_list = set(track_names)
print(len(unique_list))

175


In [15]:
# E tem set comprehension também
unique_list = { x for x in track_names }
print(len(unique_list))

175


In [122]:
# Criando sets vazioss ^
set_vazio = set() # e nunca set = {}, apesar de...
set_com_conteudo = {1,2,3} # ser um set
print(set_com_conteudo)
print(type(set_com_conteudo))

{1, 2, 3}
<class 'set'>


In [128]:
# Brincando com conjuntos
pares = {2,4,6}
impares = {3,5,7}
fib = {1,2,3,5,8,13}
# União
print('pares e impares ::', pares | impares)
print('ou com union :: ', pares.union(impares))

# Interseção
print('numeros comuns entre pares e fib :: ', pares & fib)
print('numeros comuns entre impares e fib :: ', impares & fib)
print('também funciona com intersection()', pares.intersection(fib))
print('também funciona com intersection()', impares.intersection(fib))

# Diferença
print('diferença de pares pra fib :: ',fib - pares)

# Ou exclusivo
print('ou exclusivo entre pares e fib :: ', pares ^ fib)

pares e impares :: {2, 3, 4, 5, 6, 7}
ou com union ::  {2, 3, 4, 5, 6, 7}
numeros comuns entre pares e fib ::  {2}
numeros comuns entre impares e fib ::  {3, 5}
também funciona com intersection() {2}
também funciona com intersection() {3, 5}
diferença de pares pra fib ::  {1, 3, 5, 8, 13}
ou exclusivo entre pares e fib ::  {1, 3, 4, 5, 6, 8, 13}


### Tuplas

In [135]:
# Tuplas
#
# Conjuntos de valores **imutáveis**
tupla = (1,2,3)
print(tupla[0])
print(tupla[1])
print(tupla[1])

# No, can't do.
tupla[0] = 1

1
2
2


TypeError: 'tuple' object does not support item assignment

In [141]:
# Unpacking
one, two, three = tupla
print(one, two, three)

1 2 3


### Strings

In [37]:
track_name = track_names[0]
print(track_name)
print(track_name[:6])
print(track_name[7:-5])

You've Got the Love
You've
Got the


In [137]:
string = 'oi, sou uma string'
print(string)
string = "oi, também sou uma string"
print(string)
string = """oi sou uma string
mas posso ter varias linhas"""
print(string)

oi, sou uma string
oi, também sou uma string
oi sou uma string
mas posso ter varias linhas


In [146]:
# Formatando strings
print("{}, {}".format('oi', 'tudo bom?'))
print("{1}, {0}".format('oi', 'tudo bom?'))
oi = 'olá'
print(f'{oi}')
print('%s %s' % ('oi', 'tudo bom?'))

oi, tudo bom?
tudo bom?, oi
olá
oi tudo bom?


### Sobrando tempo....
#### Queues

In [140]:
# Para operaçoes first-in, first-out, podemos usar deques ao invés de listas, que são mais performáticos
# Deques são listas encadeadas duplamente terminadas (double ended queues)
from collections import deque
queue = deque([1, 2, 3])
queue.popleft()

1

#### Stacks

In [None]:
# Listas podem perfeitamente ser stacks (operações last-in)
stack 