#  1.4. Estructuras de datos: Lists, Tuples y Sets.

- Son estructuras para almacenar objetos.

## Lists

- Las listas son la estructura más usada.
- Secuencia de datos separados por coma entre corchetes.
- Se pude acceder a estos datos a partir de índice.
- Se declaran con 'list' o '[]'.

In [None]:
a = []

In [None]:
type(a)

In [None]:
a = list()

In [None]:
type(a)

- Se puede asignar directamente los datos:

In [None]:
x = ['apple', 'orange']

### Indexing

- El índice empieza con 0 como en los strings.

In [None]:
x[0]

In [None]:
x[1]

- Puede accederse en orden inverso
- El último elemento se puede acceder el primero.

In [None]:
x[-1]

In [None]:
x[-2]

- Observa que: x[0] = x[-2], x[1] = x[-1].
- Este comportamiento es válido para todos los elementos.

- Las listas pueden tener otras listas dento. A este concepto se le denomina: *nested lists*
- Esta manera es como veremos la forma de declarar arrays en numpy.

In [None]:
y = ['carrot','potato']

In [None]:
z  = [x, y]
print(z)

- Indexing en nested lists puede ser confuso.
- En la primera lista, índice 0, tenemos x: ['apple','orange']  y en la segunda, índice 1 tenemos y: ['carrot','potato'].

In [None]:
print(z[0][1])

In [None]:
print(z[1][1])

- Las listas no tienen por que ser homogeneas.
- Cada elemento puede ser de un tipo diferente.

In [None]:
["this is a valid list", 2, 3.6, (1+2j), ["a", "sublist"]]

- La forma correcta de partir las listas según PEP es la siguinte:

In [None]:
lista = [
    "this is a valid list",
    2,
    3.6,
    (1+2j), 
    ["a", "sublist"],
]

### Slicing

- Indexing no está limitado a un solo elemento.
- Slicing permite acceder a una sequencia de datos del interior de la lista.
- Se realiza definiendo el índice del primer y el último elemento que requerimos.
- Se escribe de la siguiente manera: [ a : b ], donde a y b son los índices del primer y último (sin incluir) que queremos extraer.
- Si no se definen a o b, se considera el primero y el último.

In [None]:
num = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(num[0:4])
print(num[4:])

- Se puede incluir un tercer parámetro [a:step:b] para ir extrayendo los elementos con saltos de longitud step.

In [None]:
num[1:9:3]

### Unpacking
- Podemos sacar los objetos de dentro de la lista a variables indivudalmente.
- A esta operación se la denomina *unpacking*

In [None]:
a, b, c = [1, 2, 3]

In [None]:
print(a, b, c)

### Range function
- La función **range()** sirve para generar listas de números enteros.
* range(n) =  0, 1, ..., n-1
* range(m,n)= m, m+1, ..., n-1
* range(m,n,s)= m, m+s, m+2s, ..., m + ((n-m-1)//s) * s

```python
<range> = range(to_exclusive)
<range> = range(from_inclusive, to_exclusive)
<range> = range(from_inclusive, to_exclusive, ±step_size)
```

In [None]:
range(10)

In [None]:
list(range(10))

In [None]:
list(range(2, 10))

In [None]:
list(range(3, 10, 3))

### Built in List Functions

```python
<list> = <list>[from_inclusive : to_exclusive : ±step_size]
```

```python
<list>.append(<el>)            # Or: <list> += [<el>]
<list>.extend(<collection>)    # Or: <list> += <collection>
```

```python
<list>.sort()
<list>.reverse()
<list> = sorted(<collection>)
<iter> = reversed(<list>)
```

```python
sum_of_elements  = sum(<collection>)
elementwise_sum  = [sum(pair) for pair in zip(list_a, list_b)]
sorted_by_second = sorted(<collection>, key=lambda el: el[1])
sorted_by_both   = sorted(<collection>, key=lambda el: (el[1], el[0]))
flatter_list     = list(itertools.chain.from_iterable(<list>))
product_of_elems = functools.reduce(lambda out, x: out * x, <collection>)
list_of_chars    = list(<str>)
```

```python
index = <list>.index(<el>)     # Returns first index of item.
<list>.insert(index, <el>)     # Inserts item at index and moves the rest to the right.
<el> = <list>.pop([index])     # Removes and returns item at index or from the end.
<list>.remove(<el>)            # Removes first occurrence of item or raises ValueError.
<list>.clear()                 # Removes all items.
```


- **len(x)** para obtener el número de elementos en la lista.

In [None]:
len(num)

- Si la lista está compuesta de números enteros:
 - **min( )** y **max( )** devuelve el máximo y mínimo valor.
 - **sum** suma todos los elementos.

In [None]:
print("min =", min(num),"  max =", max(num), "  total =", sum(num))

In [None]:
max(num)

- Las listas se pueden concatenar con '+'.
- Otra opción para concatenar, serí utilizar el operador *unpacking* [*list_1, *list_2]
- El resultado no es una *nested list*.

In [None]:
[1, 2, 3] + [5, 4, 7]

In [None]:
a = [1, 2, 3]
b = [5, 4, 7]
[*a, *b]

- Para saber si un elemento está en una lista podemos usar el operador **in**.

In [None]:
names = ['Earth', 'Air', 'Fire', 'Water']

In [None]:
'Fire' in names

In [None]:
'Space' in names

- Si la lista es de string.
 - **max(list)** y **min(list)** retornar el primer y último elemento en orden léxico (por valor ASCII)

In [None]:
mlist = ['bzaa', 'ds', 'nc', 'az', 'z', 'klm', 'zz']
print("max =", max(mlist))
print("min =", min(mlist))

- Si los números son strings sigue funcionando.

In [None]:
nlist = ['1', '94', '93', '1000']
print("max =", max(nlist))
print('min =', min(nlist))

- **max(list, key=fun)**  tiene un parámetro key, donde se especifica una función que retorne una clave.
- Para encontra el elemento más largo podemos usar `len`.

In [None]:
print('longest =', max(mlist, key=len))
print('shortest =', min(mlist, key=len))

- **list.sort()** ordena los elementos de la lista.
- Se le puede pasar también una funcíon con el argumento **key**, **list.sort(key=fun)**.
- La operación se realiza inplace, la función no devuelve nada, la lista se ordena internamente.

In [None]:
mlist.sort()

In [None]:
mlist

In [None]:
mlist.sort(key=len)

In [None]:
mlist

- Un string se puede convertir a una lista usando el operador **list()**
- El método de la clase string **string.split()**, da una lista con los string separados por espacio o con el separador que se le pase: **string.split(sep)**

In [None]:
list('hello world !')

In [None]:
'Hello   World !!'.split()

In [None]:
'Hello   World !!'.split('l')

- **list.append(list)** para añadir un elemento al final de la lista.

In [None]:
lst = [1, 1, 4, 8, 7]
lst.append(1)
print(lst)

- Añadir una lista a otra con *append* crea una nested list.
- Para evitar este comportamiente usar  **list.extend(list)** 

In [None]:
list_1 = [1, 1, 4, 8, 7]
list_2 = [10, 11, 12]

In [None]:
list_1.append(list_2)

In [None]:
list_1

In [None]:
list_1 = [1, 1, 4, 8, 7]
list_2 = [10, 11, 12]

In [None]:
list_1.extend(list_2)

In [None]:
list_1

- **count(list_1)** cuenta el número de veces que el elementos aparece en la lista.

In [None]:
list_1.count(1)

- **list.index(val)** se usa para encontrar el índice del elemento **val** en la lista.
- Si hay múltiples elementos con el mismo valor da el índice del primero.

In [None]:
lst.index(1)

- **list.insert(ele, pos)** inserta un elemento, **ele** en la posición **pos**.
- **list.append(ele)** es equivalente a  **list.insert(ele, len(list))** 

In [None]:
lst.insert(5, 'name')
print(lst)

- **list.insert(ele, pos)** no remplaza.
- Para remplazar **list[pos] = ele**


In [None]:
lst[5] = 'Python'
print(lst)

- **list.pop()** devuelve el último elemento de la lista.
- El elemento se elimina de la lista.
- Se puede especificar un índice **list.pop(idx)**

In [None]:
lst.pop()

In [None]:
lst

- Se puede eliminar un elemento en concreto con **list.remove(ele)**
- Se puede eliminar un elemento sabiendo el índice con del lst[1].

In [None]:
lst = ['Python', 'rocks!']

In [None]:
lst.remove('Python')
print(lst)

In [None]:
del lst[0]
print(lst)

- Los elementos de la lista pueden ser revertidos usando **list.reverse()**.
- Las nested list se tratan como un único elemento.

In [None]:
lst = list(range(10))
print(lst)

In [None]:
lst.reverse()
print(lst)

- **list.sort()** ordena la lista de manera ascendente.
- **list.sort(reverse=True)** ordena la lista de manera descendente.
- **list.sort(key=fun)** se puede pasar una función para ordenar.
- La operación es *inplace*.
- Para obtener una copia ordenanda usar **sorted(list)**, también con parámetros **key** y **reverse**.

In [None]:
lst.sort()
print(lst)

In [None]:
print(sorted([3, 2, 1]))

In [None]:
lst.sort(reverse=True)
print(lst)

- Para listas que contienen strings  **sort( )** ordena los elementos de forma ascendente por valor ASCII.

In [None]:
names = ['Air', 'Earth', 'Fire', 'Water']

In [None]:
names.sort()
print(names)

In [None]:
names.sort(reverse=True)
print(names)

In [None]:
names.sort(key=len)
print(names)

In [None]:
print(sorted(names,key=len,reverse=True))

### Copia de listas

- La asignación de una lista a una variable no implica la copia de la misma.
- Una variable es una referencia a la lista.
- Induce a errores al principio.

In [None]:
list_a = [2, 1, 4, 3]
list_b = list_a

In [None]:
print(list_a)

In [None]:
print(list_b)

In [None]:
# realizamos operaciones el list_a
list_a.sort()
list_a.pop()
list_a.append(9)

In [None]:
print(f"A = {list_a}")
print(f"B = {list_b}")

- Ambas listas han cambiado.
- Las dos variables están asignadas al mismo espacio de la memoria.
- Uno de los métodos para copiar es usar un *slide* completo de la lista: **list_b = list_a[:]**


In [None]:
list_a = [2, 1, 4, 3]
list_b = list_a[:] # make a copy by taking a slice from beginning to end
print("Starting with:")
print(f"A = {list_a}")
print(f"B = {list_b}")
list_a.sort()
list_a.pop()
list_a.append(9)
print("Finnished with:")
print(f"A = {list_a}")
print(f"B = {list_b}")

### List comprehension
- Una opción de Python muy potente y usada para definir listas (también aplicable para tuplas y dicts) es la posibilidad de definir listas usado *list comprehension*.
- Usamos un bucle para definir la lista.

In [None]:
# definimos una lista a partir de otra iterándola y elevando al cuadrado cada elemento
[i**2 for i in [1, 2, 3]]

- Incluso podemos filtrar con un **if** despues del **for**.

In [None]:
[i**2 for i in [1, 2, 3] if i > 1]

- Podemos realizar esta iteración sobre más de un objeto.

In [None]:
[10*i+j for i in [1, 2, 3] for j in [5, 7]]

In [None]:
[10*i+j for i in [1,2,3] if i%2==1 for j in [4,5,7] if j >= i+4] # keep odd i and  j larger than i+3 only

## Tuples

- Las tuplas son como las lisas, con la diferencia de ser inmutables.
- Los elementos de la lista no pueden ser modificados.
- Piensa en situaciones donde los elementos no deben de ser cambiados (ej: resultados de una función).
- Para definirlas: **()** o **tuple**.

In [None]:
tup_1 = ()
tup_2 = tuple()

In [None]:
type(tup_1)

- Con una coma al final del objeto se genera también una tupla.

In [None]:
27,

- Si multiplicamos la expresión se crea una tupla con tantas veces ese valor.

In [None]:
2*(27,)

- Podemos asignar valores como en las listas.

In [None]:
tup_3 = (1, 2, 3)
print(tup_3)

In [None]:
tup_4 = tuple([1, 2, 3])
print(tup_4)

In [None]:
tup_5 = tuple('Hello')
print(tup4)

- Sigue las mismas reglas de *indexing* y *slicing* que las listas.

In [None]:
print(tup_3[1])
tup_6 = tup_5[:3]
print(tup_6)

### Mapping tuplas
- Las tuplas pueden ser usadas en la derecha de una asignación.
- Tienen que tener la longitud correcta.

In [None]:
(a, b, c) = ('alpha', 'beta', 'gamma') # are optional
print(a,b,c)
a, b, c = 'alpha', 'beta', 'gamma' # The same as the above 
print(a,b,c)

In [None]:
# can assign lists
a, b, c = ['Alpha', 'Beta', 'Gamma'] 
print(a, b, c)
# even this is OK - Not Recomended
[a, b, c]=('this', 'is', 'ok') 
print(a, b, c)

In [None]:
# El más usado
a, b, c = 'alpha', 'beta', 'gamma'

In [None]:
# podemos usar unpackings más complicados obteniendo todos los valores posibles
(w, (x, y), z)=(1,(2,3),4)
print(w, x, y, z)
(w, xy, z)=(1, (2,3), 4)
print(w, xy, z) # notice that xy is now a tuple

- Con *_ podemos obtener el primero, el último o ambos.
- Muy útil para funciones que devuelven valores que no necesitamos.

In [None]:
a, b, c, d = 'alpha', 'beta', 'gamma', 'delta'
print(a, b, c, d)

In [None]:
first, *_ = 'alpha', 'beta', 'gamma', 'delta'
print(a)

In [None]:
*_, last = 'alpha', 'beta', 'gamma', 'delta'
print(last)

In [None]:
first, *_, last = 'alpha', 'beta', 'gamma', 'delta'
print(f'First: {first} Last: {last}')

### Built In Tuple functions

- Similares a las listas, menos los que modifican.
- **tuple.count(ele)** cuenta el número de elementos **ele**.

In [None]:
d = tuple('a string with many "a"s')
d.count('a')

- **tuple.index(ele)** da el índice del elemento **ele**.

In [None]:
d.index('a')

## Strings

- Los strings puden ser tratados como listas o tuplas.

In [None]:
str_1 = 'Taj Mahal is beautiful'

In [None]:
# list of lower case charactes
print([x for x in str_1 if x.islower()])

In [None]:
# list of words
words = str_1.split() 
print(f"Words are: {words}")

In [None]:
# add -- between words 
print("--".join(words))

In [None]:
# capitalise words
cap_words = [w.capitalize() for w in words]
cap_str = " ".join(cap_words) 
print(cap_str)

- String *Indexing* y *Slicing* similar a las listas.

In [None]:
print(str_1[4])
print(str_1[4:])

## Sets

- Los sets se usan para eliminar los elementos repetidos en una sequencia/lista.
- Se pueden realizar operacioness sobre ellos como unión, intersección, etc.
- Declarados con `set()`, `{}` o `set([sequence])`


In [None]:
set_0 = set()
print(type(set_0))

In [None]:
set_1 = {1, 2, 2, 3, 3, 4} 
print(set_1)

In [None]:
set_2 = set([1, 2, 2, 3, 3, 4])
print(set_2)

- Los elementos repetidos solo se introducen una vez.
- Cada elemento del set es distinto.
- Precaución:  **{}** vacio  **NO** es un set es un diccionario.

In [None]:
type({})

In [None]:
type({1})

### Built-in Functions

|Function| Description|
|----|--- |
|`<set> = set()`||



```python
<set>.add(<el>)                               # Or: <set> |= {<el>}
<set>.update(<collection>)                    # Or: <set> |= <set>
```

```python
<set>  = <set>.union(<coll.>)                 # Or: <set> | <set>
<set>  = <set>.intersection(<coll.>)          # Or: <set> & <set>
<set>  = <set>.difference(<coll.>)            # Or: <set> - <set>
<set>  = <set>.symmetric_difference(<coll.>)  # Or: <set> ^ <set>
<bool> = <set>.issubset(<coll.>)              # Or: <set> <= <set>
<bool> = <set>.issuperset(<coll.>)            # Or: <set> >= <set>
```

```python
<set>.remove(<el>)                            # Raises KeyError.
<set>.discard(<el>)                           # Doesn't raise an error.
```

In [None]:
set_1 = set([1, 2, 3])

In [None]:
set_2 = set([2, 3, 4, 5])

- **set.pop()** elimina un elemento arbitrario del set.

In [None]:
ele = set_1.pop()
print(f"{ele} {set_1}")

- **set.remove(ele)** elimina un elemento específico del set.

In [None]:
set_1.remove(2)
set_1

- **set.clear( )** elimina todos los elementos del set.

In [None]:
set_1.clear()
set_1

- **set.add(ele)**  añade un elemento al set, el índice del elemento añadido es arbitrario.

In [None]:
set_1.add(0)
set_1

- **set_1.union(set_2)** da un set que contiene los elementos presentes en los dos sets.

In [None]:
set_1.union(set_2)

- **set_1.intersection(set_2)** da un set que contiene los elementos presentes en ambos sets.

In [None]:
set_1.intersection(set_2)

- **set_1.difference(set_2)** da un set con los elementos presentes en el set_1 y no en set_2

In [None]:
set_1.difference(set_2)

- **set_1.issubset(set_2)** da True/False si el set_1 es subset de set_2. 
- **set_1.issuperset(set_2)** lo mismo para superset.

In [None]:
set_1.issubset(set_2)

In [None]:
set_1.issuperset(set_2)