# Sesión 3: estructuras de datos y ficheros

En esta sesión vamos a incidir de nuevo en el manejo de estructuras de alto nivel (listas, tuplas, conjuntos y diccionarios). Además, tratamos brevemente el asunto de los ficheros en Python. No vamos a entrar de lleno en ello, ya que, para los objetivos del curso, resulta más conveniente esperar a tratar el manejo de ficheros usando librerías (Pandas y Numpy).

Podemos encontrar explicación con un nivel suficiente de detalle en la [Sección 5 del tutorial de Python](https://docs.python.org/3/tutorial/datastructures.html).

También es adecuda la sección dedicada a ["data structures and sequences" del libro "Python for data analysis"](https://wesmckinney.com/book/python-builtin#tut_data_structures).

## Listas

Las listas de Python son objetos heterogéneos mutables.
El acceso habitual es por índice o a través de slices.
Se dispone de un importante grupo de métodos (de los objetos de la clase List) para operar con listas.

In [73]:
#para añadir al final append
J=["pepe",3]
print(J.index("pepe"))
L=[23,45,67,89]
L.append(7)
L

0


[23, 45, 67, 89, 7]

In [74]:
#Se puede extender una lista con cualquier objeto iterable. Una tupla,
#L.extend((3,4))

L.extend(range(1,9))
#Lo siguiente no es correcto porque...
#L1=L.extend((1,))
#print(L1)
#Lo siguiente tampoco
#L1=L.extend((1,)).copy()
#print(L1)
L.extend((1,))
L1=L.copy()
L1

[23, 45, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1]

In [75]:
#Si extendemos una lista con un diccionario, añadimos las claves del diccionario
L.extend({2:"hola",3:"adiós"})
L

[23, 45, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]

In [76]:
#Añadir por posición
L.insert(2,444)
L

[23, 45, 444, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]

In [77]:
#Borrar un dato (su primera aparición)
#L.remove(3)
#print(L)
L.remove(888)
L

ValueError: list.remove(x): x not in list

In [None]:
L.insert(3,33)
L.insert(7,33)
L.insert(0,3)


In [None]:
#primer índice que ocupa un elemento a partir de una determinada posición (opcional)
L.index(3)

In [None]:
L.index(3,5)

In [None]:
L.index(3,27)

In [None]:
#Aunque no es un método de listas, el "operador del" permite eliminar por posición
print(L)
del (L[0])
print(L)

In [None]:
del(L[5:8])
print(L)
#dir(L)

**Trabajo personal**: hacer pruebas con ``pop``, ``cont``, ``sort``, ``copy``, ``clear``, ...

Consultar la documentación para ver el uso de las listas Python como pilas y colas.

###### Muy importante.

In [None]:
L.insert(0,8)
L
type(L.insert(0,8))
# help(list.insert)

Como ya hemos visto antes, los métodos modificadores no devuelven, es decir, devuelven ``None``.
Por eso, no funciona lo siguiente (algo que choca desde el punto de vista funcional)

In [None]:

L.insert(0,8).insert(4,5)


### Listas por comprensión

Una herramienta importante de Python es la definición de listas por comprensión, un mecanismo propio de la Programación Funcional y que veremos con más detalle en sesiones posteriores.
Corresponde a un tipo de definición habitual en matemáticas, conjuntos definidos por "comprensión". De momento, nos limitamos a presentarlo.

In [None]:
dobles=[2*x for x in [1,2,3,4,5,6]]
print(dobles)

In [78]:
#Es una forma muy cómoda y compacta de calcular expresiones de tipo list
#Equivale a:
duplos=[]
for x in [1,2,3,4,5,6]:
    duplos.append(2*x)
print(duplos)

[2, 4, 6, 8, 10, 12]


In [79]:
#Se pueden filtrar elementos
triples=[3*x for x in range(1,7) if (x%2==0)]
triples

[6, 12, 18]

In [80]:
#Equivale a
triplos=[]
for x in [1,2,3,4,5,6]:
    if (x%2==0):
        triplos.append(3*x)
print(triplos)

[6, 12, 18]


In [81]:
#Se admiten expresiones lista, tupla,..
#Se admite concatenación de parejas for...if
combi=[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
combi

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [82]:
combs = []
for x in [1,2,3]:
    for y in [3,11,4]:
        if x != y:
            combs.append((x, y))
combs

[(1, 3), (1, 11), (1, 4), (2, 3), (2, 11), (2, 4), (3, 11), (3, 4)]

In [83]:
#Se pueden anidar listas definidas por conprensión.
ani=[[x*x for x in range(1,i)] for i in range(2,7)]
ani

[[1], [1, 4], [1, 4, 9], [1, 4, 9, 16], [1, 4, 9, 16, 25]]

In [84]:
def ident(n):
    return([[int(i==x) for i in range(0,n)] for x in range (0,n)])

print(ident(3))

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]


###### Otros tipos secuencia (además de listas): tuplas y rangos

Los tres tipos secuencia básicos son listas, tuplas y rangos.
Los operadores comunes  todos ellos los encontramos en:
    https://docs.python.org/3/library/stdtypes.html#typesseq

In [85]:
#Respecto de TUPLAS, se trata de secuencias inmutables y heterogéneas
t=3,[3,4],"pepe"
print(t)

(3, [3, 4], 'pepe')


In [86]:
#Ya dijimos que son objetos inmutables
t[2]=4

TypeError: 'tuple' object does not support item assignment

In [None]:
#El acceso por índice y slice es el común a todos los tipos de secuencias
t[1]

In [None]:
t[0:1]

In [None]:
#La tupla vacía
s=()
s

In [None]:
#los átomos llevan una coma
s=(3,)
s
type ((3))
#type((3,))

In [None]:
s=3,
s

In [87]:
#Se construyen a partir de cualquier iterable. Una lista, por ejemplo.
s=tuple([x*x for x in range(2,5)])
s

(4, 9, 16)

In [88]:
#Empaquetado y desempquetado. Corresponde con la idea de matching
s=3,4,5
x,y,z=s
y

4

In [89]:
#Más adelante en el curso trataremos con rigor los rangos.
#Aunque no es el uso habitual, los rangos pueden ser utilizados directamente
#como secuencias
#Se basan en la idea de evluación perezosa (no se calculan sus elementos hasta que no se demanda)
range (1,25,2)

range(1, 25, 2)

In [90]:
print(range(1, 25, 2))

range(1, 25, 2)


In [91]:
4 in range(1,25,2)

False

In [92]:
s=range(1,25,7)
s.step

7

In [93]:
5 not in s

True

In [94]:
s=tuple(range(4,8))
s

(4, 5, 6, 7)

In [95]:
min(range(5,8))+max(range(3,7))


11

In [96]:
range(2,4)[1]

3

In [97]:
#Accesores a rangos mediante índices
l=range(2,17)[2:7:3]
print(l)

range(4, 9, 3)


**Trabajo personal**: respecto de conjuntos y diccionarios, consultad el Tutorial de Python.

In [98]:
list(l)
l.count(6)

0

-------------------------------

## Ejercicios

A continuación se listan los ejercicios a realizar para esta sesión. Para cada uno de ellos se proporciona la cabecera de la función a definir junto con unos casos de prueba para verificar el comportamiento correcto de los métodos. Lo único que deberás hacer es reemplazar el ``pass`` por la definición de la función.

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la suma de los cuadrados de los números menores que un entero dado.

In [99]:
def suma_cuadrados_menores_entero(lista,x):
  '''
  >>> suma_cuadrados_menores_entero([],2)
  0
  >>> suma_cuadrados_menores_entero(range(0,10),5)
  30
  >>> suma_cuadrados_menores_entero(range(-10,10,2),0)
  220
  '''

  return sum([e**2 for e in lista if e < x])


In [100]:
import doctest
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la lista de los divisores de un número.

In [101]:
def divisores(x):
  '''
  >>> divisores(0)
  []
  >>> divisores(7)
  [1, 7]
  >>> divisores(12)
  [1, 2, 3, 4, 6, 12]
  '''
  return [n for n in range(1,x+1) if x % n ==0]

In [102]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Mediante listas definidas por comprensión define una función que determine si un número es primo.

In [103]:
def es_primo(x):
  '''
  >>> es_primo(1)
  False
  >>> es_primo(7)
  True
  >>> es_primo(12)
  False
  '''
  return len(divisores(x)) == 2

In [104]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Mediante listas definidas por comprensión define una función que
calcule los primos menores que un entero dado.

In [105]:
def primos_menores(x):
  '''
  >>> primos_menores(1)
  []
  >>> primos_menores(10)
  [2, 3, 5, 7]
  >>> primos_menores(50)
  [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]
  '''
  return [el for el in range(2,x) if es_primo(el)]


In [106]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Implementa el método para [ordenar por mezcla](https://es.wikipedia.org/wiki/Ordenamiento_por_mezcla) una lista.

In [107]:
def mergesort(lista):
  '''
  >>> mergesort([])
  []
  >>> mergesort([1])
  [1]
  >>> mergesort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> mergesort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  if len(lista) <= 1:
      return lista

  mid = len(lista) // 2
  izquierda = mergesort(lista[:mid])
  derecha = mergesort(lista[mid:])
  return merge(izquierda, derecha)


def merge(izquierda, derecha):
  resultado = []
  i, j = 0, 0

  while i < len(izquierda) and j < len(derecha):
      if izquierda[i] <= derecha[j]:
          resultado.append(izquierda[i])
          i += 1
      else:
          resultado.append(derecha[j])
          j += 1

  resultado.extend(izquierda[i:])
  resultado.extend(derecha[j:])
  return resultado

In [108]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Implementa el método [quicksort](https://es.wikipedia.org/wiki/Quicksort) para ordenar una lista.

In [109]:
def quicksort(lista):
  '''
  >>> quicksort([])
  []
  >>> quicksort([1])
  [1]
  >>> quicksort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> quicksort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  lista = list(lista)  # evita modificar el argumento original
  if len(lista) <= 1:
      return lista
  pivote = lista[len(lista)//2]
  menores = [x for x in lista if x < pivote]
  iguales = [x for x in lista if x == pivote]
  mayores = [x for x in lista if x > pivote]
  return quicksort(menores) + iguales + quicksort(mayores)



In [110]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Implementa el cálculo de la transpuesta de una matriz mediante listas por comprensión. Se proporciona como ayuda la implementación de la transpuesta de una matriz "a pelo".

In [111]:
#La siguiente función calcula la traspuesta de una matriz "a pelo".
def traspuestaAPelo (m):
    tras=[]
    for i in range(len(m[0])):
        filaT=[]
        for j in range(len(m)):
            filaT.append(m[j][i])
        tras.append(filaT)
    return(tras)
traspuestaAPelo([[1,2,3],[4,5,6]])

[[1, 4], [2, 5], [3, 6]]

In [112]:
def transpuesta(lista):
  '''
  >>> transpuesta([[1,2,3],[4,5,6]])
  [[1, 4], [2, 5], [3, 6]]
  >>> transpuesta([[1, 4], [2, 5], [3, 6]])
  [[1, 2, 3], [4, 5, 6]]
  >>> transpuesta([[1, 4, 5], [2, 5, 7], [3, 6, 1]])
  [[1, 2, 3], [4, 5, 6], [5, 7, 1]]
  '''
  return [[elemento[lon_interna] for elemento in lista] for lon_interna in range(len(lista[0]))]

In [113]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Dado un grafo orientado (representado mediante un diccionario en el cual las claves son los vértices y los valores son listas con los vertices adyacentes)  y uno de sus vértices, decidir si ese vértice es un sumidero (ninguna arista sale desde él). Además, mediante listas por comprensión, dado un grafo orientado decidir si contiene algún sumidero.

In [114]:
def es_sumidero(grafo,vertice):
  '''
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 2)
  True
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 1)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 3)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 4)
  False
  '''
  return (grafo[vertice] == [])

In [115]:
doctest.testmod()

TestResults(failed=0, attempted=33)

In [116]:
def contiene_sumidero(grafo):
  '''
  >>> contiene_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]})
  True
  >>> contiene_sumidero({})
  False
  >>> contiene_sumidero({1: [2,4], 2: [3,4], 3: [1],4: [3]})
  False
  '''
  return len([1 for clave in grafo if es_sumidero(grafo,clave)]) > 0

In [117]:
doctest.testmod()

TestResults(failed=0, attempted=33)

**Ejercicio:** Implementa tu propio método zip de una lista de listas usando listas por comprensión.

In [118]:
def mizip(lista1,lista2):
  '''
  >>> mizip([1,2,3],[4,5])
  [(1, 4), (2, 5)]
  >>> mizip([1,2,3],[4,5,6])
  [(1, 4), (2, 5), (3, 6)]
  >>> mizip([1,2],[4,5,6])
  [(1, 4), (2, 5)]
  '''
  return [(lista1[i],lista2[i]) for i in range(min(len(lista1),len(lista2)))]

In [119]:
doctest.testmod()

TestResults(failed=0, attempted=33)

# Entrega
Recuerda guardar este notebook en tu repositorio de GitHub.