# Estrutura de Dados

Prof. Daniel de Abreu Pereira Uhr

### Conteúdo

* lists
* tuples
* sets
* dictionaries
* numpy arrays
* pandas DataFrames
* pyspark DataFrames


### Referências

* Géron, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2019.
* Athey, S., & Imbens, G. (2017). "The State of Applied Econometrics: Causality and Policy Evaluation." *Journal of Economic Perspectives*.
* Mullainathan, S., & Spiess, J. (2017). "Machine Learning: An Applied Econometric Approach." *Journal of Economic Perspectives*.
* Varian, H. R. (2014). "Big Data: New Tricks for Econometrics." *Journal of Economic Perspectives*.

### Listas

Uma lista é uma estrutura de dados de matriz mutável em Python com as seguintes características:

* pode conter qualquer tipo de dado
* pode conter diferentes tipos de dados ao mesmo tempo
* pode ser modificado

Podemos gerar listas usando colchetes.

In [1]:
l = [12, "world", [3,4,5]]
print(l)

[12, 'world', [3, 4, 5]]


Como as listas são ordenadas , podemos acessar seus elementos chamando a posição do elemento na lista.

In [2]:
l[0]

12

Como as listas são mutáveis , podemos modificar seus elementos.

In [23]:
l[0] = 'hello'
print(l)

['hello', 'world', [3, 4, 5]]


Podemos adicionar elementos a uma lista usando .append().

In [24]:
l.append(23)
l

['hello', 'world', [3, 4, 5], 23]

Podemos remover elementos chamando del-o.

In [25]:
del l[0]
print(l)

['world', [3, 4, 5], 23]


Podemos combinar duas listas usando +. Note que esta operação não modifica a lista, mas gera uma nova.

In [26]:
l + [23]

['world', [3, 4, 5], 23, 23]

Também podemos gerar listas usando compreensões .

In [27]:
l = [n for n in range(3)]
print(l)

[0, 1, 2]


A compreensão é uma ferramenta poderosa!

In [28]:
l = [n+10 for n in range(10) if (n%2==0) and (n>4)]
print(l)

[16, 18]


### Tuples

Uma tupla é uma estrutura de dados de matriz imutável em Python com as seguintes características:

* pode conter qualquer tipo de dado
* pode conter diferentes tipos de dados ao mesmo tempo
* não pode ser modificado

Podemos gerar tuplas usando colchetes de curva.

In [29]:
# Uma lista com diferentes tipos de dados
t = (12, "world", [3,4,5])
print(t)

(12, 'world', [3, 4, 5])


Como as tuplas são ordenadas , podemos acessar seus elementos chamando a posição do elemento na lista.

In [30]:
t[0]

12

Como as tuplas são imutáveis , não podemos modificar seus elementos.

In [31]:
# Tentar (Try) modificar o elemento
try:
    t[0] = 'hello'
except Exception as e:
    print(e)

'tuple' object does not support item assignment


In [32]:
try:
    t.append('hello')
except Exception as e:
    print(e)

'tuple' object has no attribute 'append'


In [33]:
try:
    del t[0]
except Exception as e:
    print(e)

'tuple' object doesn't support item deletion


Podemos combinar duas tuplas usando +. Note que esta operação não modifica a tupla, mas gera uma nova. Note também que para gerar uma tupla de 1 elemento precisamos inserir uma vírgula.

In [34]:
t + (23,)

(12, 'world', [3, 4, 5], 23)

Podemos gerar tuplas usando compreensões , mas precisamos especificar que é um tuple.

In [35]:
t = tuple(n for n in range(3))
print(t)

(0, 1, 2)


### Conjuntos

Um conjunto é uma estrutura de dados de matriz mutável em Python com as seguintes características:

* pode conter apenas tipos hasháveis
* pode conter diferentes tipos de dados ao mesmo tempo
* não pode ser modificado
* não pode conter duplicatas


Podemos gerar usando chaves.

In [36]:
s = {12, "world", (3,4,5)}
print(s)

{'world', (3, 4, 5), 12}


Como os conjuntos não são ordenados nem indexados , não podemos acessar elementos individuais chamando sua posição.

In [37]:
# Tentar (Try) acessar o elemento pela posição
try:
    s[0]
except Exception as e:
    print(e)

'set' object is not subscriptable


Como os conjuntos não são ordenados , não podemos modificar seus elementos especificando a posição.

In [38]:
# Tentar modificar o elemento
try:
    s[0] = 'hello'
except Exception as e:
    print(e)

'set' object does not support item assignment


Entretanto, como os conjuntos são mutáveis , podemos adicionar elementos usando .add().

In [39]:
s.add('hello')
print(s)

{'world', (3, 4, 5), 12, 'hello'}


Entretanto, não podemos adicionar duplicatas .

In [40]:
s.add('hello')
print(s)

{'world', (3, 4, 5), 12, 'hello'}


Podemos excluir elementos de um conjunto usando .remove().

In [41]:
s.remove('hello')
print(s)

{'world', (3, 4, 5), 12}


Também podemos gerar conjuntos usando compreensões .

In [43]:
s = {n for n in range(3)}
print(s)

{0, 1, 2}
