# Sesión 3: estructuras de datos y ficheros

En esta sesión vamos a incidir de nuevo en el manejo de estructuras de alto nivel (listas, tuplas, conjuntos y diccionarios). Además, tratamos brevemente el asunto de los ficheros en Python. No vamos a entrar de lleno en ello, ya que, para los objetivos del curso, resulta más conveniente esperar a tratar el manejo de ficheros usando librerías (Pandas y Numpy).

Podemos encontrar explicación con un nivel suficiente de detalle en la [Sección 5 del tutorial de Python](https://docs.python.org/3/tutorial/datastructures.html).

También es adecuda la sección dedicada a ["data structures and sequences" del libro "Python for data analysis"](https://wesmckinney.com/book/python-builtin#tut_data_structures).

## Listas

Las listas de Python son objetos heterogéneos mutables.
El acceso habitual es por índice o a través de slices.
Se dispone de un importante grupo de métodos (de los objetos de la clase List) para operar con listas.

In [1]:
#para añadir al final append
J=["pepe",3]
print(J.index("pepe"))
L=[23,45,67,89]
L.append(7)
L

0


[23, 45, 67, 89, 7]

In [2]:
#Se puede extender una lista con cualquier objeto iterable. Una tupla,
#L.extend((3,4))

L.extend(range(1,9))
#Lo siguiente no es correcto porque...
#L1=L.extend((1,))
#print(L1)
#Lo siguiente tampoco
#L1=L.extend((1,)).copy()
#print(L1)
L.extend((1,))
L1=L.copy()
L1

[23, 45, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1]

In [3]:
#Si extendemos una lista con un diccionario, añadimos las claves del diccionario
L.extend({2:"hola",3:"adiós"})
L

[23, 45, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]

In [4]:
#Añadir por posición
L.insert(2,444)
L

[23, 45, 444, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]

In [6]:
#Borrar un dato (su primera aparición)
#L.remove(3)
#print(L)
L.remove(444)
L

[23, 45, 67, 89, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]

In [7]:
L.insert(3,33)
L.insert(7,33)
L.insert(0,3)


In [10]:
#primer índice que ocupa un elemento a partir de una determinada posición (opcional)
print(L)
L.index(3)

[3, 23, 45, 67, 33, 89, 7, 1, 33, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]


0

In [11]:
L.index(3,5)

10

In [15]:
L.index(3,1)

10

In [16]:
#Aunque no es un método de listas, el "operador del" permite eliminar por posición
print(L)
del (L[0])
print(L)

[3, 23, 45, 67, 33, 89, 7, 1, 33, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]
[23, 45, 67, 33, 89, 7, 1, 33, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]


In [17]:
del(L[5:8])
print(L)
#dir(L)

[23, 45, 67, 33, 89, 2, 3, 4, 5, 6, 7, 8, 1, 2, 3]


**Trabajo personal**: hacer pruebas con ``pop``, ``cont``, ``sort``, ``copy``, ``clear``, ...

In [19]:
print(L)
print(L.pop())
print(L)

[23, 45, 67, 33, 89, 2, 3, 4, 5, 6, 7, 8, 1, 2]
2
[23, 45, 67, 33, 89, 2, 3, 4, 5, 6, 7, 8, 1]
Object `cont` not found.


In [22]:
L.count(23)

1

In [23]:
print(L)
L.sort()
print(L)

[23, 45, 67, 33, 89, 2, 3, 4, 5, 6, 7, 8, 1]
[1, 2, 3, 4, 5, 6, 7, 8, 23, 33, 45, 67, 89]


In [27]:
L1 = L.copy()
print(L1)
L1.clear()
print(L1)

[1, 2, 3, 4, 5, 6, 7, 8, 23, 33, 45, 67, 89]
[]


Consultar la documentación para ver el uso de las listas Python como pilas y colas.

###### Muy importante.

In [28]:
L.insert(0,8)
L
type(L.insert(0,8))
# help(list.insert)

NoneType

Como ya hemos visto antes, los métodos modificadores no devuelven, es decir, devuelven ``None``.
Por eso, no funciona lo siguiente (algo que choca desde el punto de vista funcional)

In [29]:

L.insert(0,8).insert(4,5)


AttributeError: 'NoneType' object has no attribute 'insert'

### Listas por comprensión

Una herramienta importante de Python es la definición de listas por comprensión, un mecanismo propio de la Programación Funcional y que veremos con más detalle en sesiones posteriores.
Corresponde a un tipo de definición habitual en matemáticas, conjuntos definidos por "comprensión". De momento, nos limitamos a presentarlo.

In [30]:
dobles=[2*x for x in [1,2,3,4,5,6]]
print(dobles)

[2, 4, 6, 8, 10, 12]


In [31]:
#Es una forma muy cómoda y compacta de calcular expresiones de tipo list
#Equivale a:
duplos=[]
for x in [1,2,3,4,5,6]:
    duplos.append(2*x)
print(duplos)

[2, 4, 6, 8, 10, 12]


In [32]:
#Se pueden filtrar elementos
triples=[3*x for x in range(1,7) if (x%2==0)]
triples

[6, 12, 18]

In [33]:
#Equivale a
triplos=[]
for x in [1,2,3,4,5,6]:
    if (x%2==0):
        triplos.append(3*x)
print(triplos)

[6, 12, 18]


In [34]:
#Se admiten expresiones lista, tupla,..
#Se admite concatenación de parejas for...if
combi=[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
combi

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [35]:
combs = []
for x in [1,2,3]:
    for y in [3,11,4]:
        if x != y:
            combs.append((x, y))
combs

[(1, 3), (1, 11), (1, 4), (2, 3), (2, 11), (2, 4), (3, 11), (3, 4)]

In [36]:
#Se pueden anidar listas definidas por conprensión.
ani=[[x*x for x in range(1,i)] for i in range(2,7)]
ani

[[1], [1, 4], [1, 4, 9], [1, 4, 9, 16], [1, 4, 9, 16, 25]]

In [37]:
def ident(n):
    return([[int(i==x) for i in range(0,n)] for x in range (0,n)])

print(ident(3))

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]


###### Otros tipos secuencia (además de listas): tuplas y rangos

Los tres tipos secuencia básicos son listas, tuplas y rangos.
Los operadores comunes  todos ellos los encontramos en:
    https://docs.python.org/3/library/stdtypes.html#typesseq

In [38]:
#Respecto de TUPLAS, se trata de secuencias inmutables y heterogéneas
t=3,[3,4],"pepe"
print(t)

(3, [3, 4], 'pepe')


In [39]:
#Ya dijimos que son objetos inmutables
t[2]=4

TypeError: 'tuple' object does not support item assignment

In [40]:
#El acceso por índice y slice es el común a todos los tipos de secuencias
t[1]

[3, 4]

In [41]:
t[0:1]

(3,)

In [42]:
#La tupla vacía
s=()
s

()

In [43]:
#los átomos llevan una coma
s=(3,)
s
type ((3))
#type((3,))

int

In [44]:
s=3,
s

(3,)

In [45]:
#Se construyen a partir de cualquier iterable. Una lista, por ejemplo.
s=tuple([x*x for x in range(2,5)])
s

(4, 9, 16)

In [46]:
#Empaquetado y desempquetado. Corresponde con la idea de matching
s=3,4,5
x,y,z=s
y

4

In [47]:
#Más adelante en el curso trataremos con rigor los rangos.
#Aunque no es el uso habitual, los rangos pueden ser utilizados directamente
#como secuencias
#Se basan en la idea de evluación perezosa (no se calculan sus elementos hasta que no se demanda)
range (1,25,2)

range(1, 25, 2)

In [48]:
print(range(1, 25, 2))

range(1, 25, 2)


In [49]:
4 in range(1,25,2)

False

In [50]:
s=range(1,25,7)
s.step

7

In [51]:
5 not in s

True

In [52]:
s=tuple(range(4,8))
s

(4, 5, 6, 7)

In [53]:
min(range(5,8))+max(range(3,7))


11

In [54]:
range(2,4)[1]

3

In [55]:
#Accesores a rangos mediante índices
l=range(2,17)[2:7:3]
print(l)

range(4, 9, 3)


**Trabajo personal**: respecto de conjuntos y diccionarios, consultad el Tutorial de Python.

In [56]:
list(l)
l.count(6)

0

-------------------------------

## Ejercicios

A continuación se listan los ejercicios a realizar para esta sesión. Para cada uno de ellos se proporciona la cabecera de la función a definir junto con unos casos de prueba para verificar el comportamiento correcto de los métodos. Lo único que deberás hacer es reemplazar el ``pass`` por la definición de la función.

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la suma de los cuadrados de los números menores que un entero dado.

In [122]:
def suma_cuadrados_menores_entero(lista,x):
  '''
  >>> suma_cuadrados_menores_entero([],2)
  0
  >>> suma_cuadrados_menores_entero(range(0,10),5)
  30
  >>> suma_cuadrados_menores_entero(range(-10,10,2),0)
  220
  '''
  return sum([i*i for i in lista if i < x])

In [128]:
import doctest
doctest.testmod()

TestResults(failed=0, attempted=12)

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la lista de los divisores de un número.

In [124]:
def divisores(x):
  '''
  >>> divisores(0)
  []
  >>> divisores(7)
  [1, 7]
  >>> divisores(12)
  [1, 2, 3, 4, 6, 12]
  '''
  return [i for i in range(1,x+1) if x%i == 0]

In [125]:
doctest.testmod()

TestResults(failed=0, attempted=12)

**Ejercicio:** Mediante listas definidas por comprensión define una función que determine si un número es primo.

In [120]:
def es_primo(x):
  '''
  >>> es_primo(1)
  False
  >>> es_primo(7)
  True
  >>> es_primo(12)
  False
  '''
  return len([i for i in range(1,x+1) if x%i == 0]) == 2

In [121]:
doctest.testmod()

TestResults(failed=0, attempted=12)

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule los primos menores que un entero dado.

In [116]:
def primos_menores(x):
  '''
  >>> primos_menores(1)
  []
  >>> primos_menores(10)
  [2, 3, 5, 7]
  >>> primos_menores(50)
  [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]
  '''
  return [p for p in range(2, x) if len([div for div in range(2,p) if p%div == 0]) == 0]

In [117]:
doctest.testmod()

TestResults(failed=0, attempted=12)

**Ejercicio:** Implementa el método para [ordenar por mezcla](https://es.wikipedia.org/wiki/Ordenamiento_por_mezcla) una lista.

In [133]:
def mergesort(lista):
  '''
  >>> mergesort([])
  []
  >>> mergesort([1])
  [1]
  >>> mergesort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> mergesort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  if(len(lista) < 2):
    return lista
  corte = int(len(lista)/2)
  l = mergesort(lista[:corte])
  r = mergesort(lista[corte:])
  ret = []
  fL = l.pop(0)
  fR = r.pop(0)
  while len(l) > 0 and len(r) > 0:
    if fL < fR:
      ret.append(fL)
      fL = l.pop(0)
    else:
      ret.append(fR)
      fR = r.pop(0)
  if len(l) > 0:
    last = l
    lastAl = fR
    lastEl = fL
  else:
    last = r
    lastAl = fL
    lastEl = fR
  while lastAl > lastEl and len(last) > 0:
    ret.append(lastEl)
    lastEl = last.pop(0)
  ret.append(min(lastAl,lastEl))
  ret.append(max(lastAl,lastEl))
  ret.extend(last)
  return ret

In [134]:
doctest.testmod()

TestResults(failed=0, attempted=16)

**Ejercicio:** Implementa el método [quicksort](https://es.wikipedia.org/wiki/Quicksort) para ordenar una lista.

In [170]:
def quicksort(lista):
  '''
  >>> quicksort([])
  []
  >>> quicksort([1])
  [1]
  >>> quicksort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> quicksort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  if len(lista) < 2:
    return lista
  if len (lista) == 2:
    if(lista[0] > lista[1]):
      return [lista[1],lista[0]]
    return [lista[0],lista[1]]
  pivPos = int(len(lista)/2)
  piv = lista[pivPos]
  del(lista[pivPos])
  l = quicksort([x for x in lista if x <= piv])
  l.append(piv)
  l.extend(quicksort([x for x in lista if x > piv]))
  return l

In [171]:
doctest.testmod()

TestResults(failed=0, attempted=20)

**Ejercicio:** Implementa el cálculo de la transpuesta de una matriz mediante listas por comprensión. Se proporciona como ayuda la implementación de la transpuesta de una matriz "a pelo".

In [172]:
#La siguiente función calcula la traspuesta de una matriz "a pelo".
def traspuestaAPelo (m):
    tras=[]
    for i in range(len(m[0])):
        filaT=[]
        for j in range(len(m)):
            filaT.append(m[j][i])
        tras.append(filaT)
    return(tras)
traspuestaAPelo([[1,2,3],[4,5,6]])

[[1, 4], [2, 5], [3, 6]]

In [173]:
def transpuesta(m):
  '''
  >>> transpuesta([[1,2,3],[4,5,6]])
  [[1, 4], [2, 5], [3, 6]]
  >>> transpuesta([[1, 4], [2, 5], [3, 6]])
  [[1, 2, 3], [4, 5, 6]]
  >>> transpuesta([[1, 4, 5], [2, 5, 7], [3, 6, 1]])
  [[1, 2, 3], [4, 5, 6], [5, 7, 1]]
  '''
  return [[m[j][i] for j in range(len(m))] for i in range(len(m[0]))]

In [174]:
doctest.testmod()

TestResults(failed=0, attempted=23)

**Ejercicio:** Dado un grafo orientado (representado mediante un diccionario en el cual las claves son los vértices y los valores son listas con los vertices adyacentes)  y uno de sus vértices, decidir si ese vértice es un sumidero (ninguna arista sale desde él). Además, mediante listas por comprensión, dado un grafo orientado decidir si contiene algún sumidero.

In [177]:
def es_sumidero(grafo,vertice):
  '''
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 2)
  True
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 1)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 3)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 4)
  False
  '''
  return len(grafo[vertice]) == 0

In [178]:
doctest.testmod()

TestResults(failed=0, attempted=27)

In [179]:
def contiene_sumidero(grafo):
  '''
  >>> contiene_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]})
  True
  >>> contiene_sumidero({})
  False
  >>> contiene_sumidero({1: [2,4], 2: [3,4], 3: [1],4: [3]})
  False
  '''
  return len([sum for sum in grafo if len(grafo[sum]) == 0]) != 0

In [180]:
doctest.testmod()

TestResults(failed=0, attempted=30)

**Ejercicio:** Implementa tu propio método zip de una lista de listas usando listas por comprensión.

In [182]:
def mizip(lista1,lista2):
  '''
  >>> mizip([1,2,3],[4,5])
  [(1, 4), (2, 5)]
  >>> mizip([1,2,3],[4,5,6])
  [(1, 4), (2, 5), (3, 6)]
  >>> mizip([1,2],[4,5,6])
  [(1, 4), (2, 5)]
  '''
  return [(lista1[i],lista2[i]) for i in range(0, min(len(lista1),len(lista2)))]

In [183]:
doctest.testmod()

TestResults(failed=0, attempted=33)

# Entrega
Recuerda guardar este notebook en tu repositorio de GitHub.