# Sesión 3: estructuras de datos y ficheros

En esta sesión vamos a incidir de nuevo en el manejo de estructuras de alto nivel (listas, tuplas, conjuntos y diccionarios). Además, tratamos brevemente el asunto de los ficheros en Python. No vamos a entrar de lleno en ello, ya que, para los objetivos del curso, resulta más conveniente esperar a tratar el manejo de ficheros usando librerías (Pandas y Numpy).

Podemos encontrar explicación con un nivel suficiente de detalle en la [Sección 5 del tutorial de Python](https://docs.python.org/3/tutorial/datastructures.html).

También es adecuda la sección dedicada a  "data structures and sequences" del Apéndice del libro "Python for data anlysis".

## Listas

Las listas de Python son objetos heterogéneos mutables.
El acceso habitual es por índice o a través de slices.
Se dispone de un importante grupo de métodos (de los objetos de la clase List) para operar con listas.

In [None]:
#para añadir al final append
J=["pepe",3]
print(J.index("pepe"))
L=[23,45,67,89]
L.append(7)
L

In [None]:
#Se puede extender una lista con cualquier objeto iterable. Una tuppla,
#L.extend((3,4))

L.extend(range(1,9))
#Lo siguiente no es correcto porque...
#L1=L.extend((1,))
#print(L1)
#Lo siguiente tampoco
#L1=L.extend((1,)).copy()
#print(L1)
L.extend((1,))
L1=L.copy()
L1

In [None]:
#Si extendemos una lista con un diccionario, añadimos las claves del diccionario
L.extend({2:"hola",3:"adiós"})
L

In [None]:
#Añadir por posición
L.insert(2,444)
L

In [None]:
#Borrar un dato (su primera aparición)
#L.remove(3)
#print(L)
L.remove(888)
L

In [None]:
L.insert(3,33)
L.insert(7,33)
L.insert(0,3)


In [None]:
#primer índice que ocupa un elemento a partir de una determinada posición (opcional)
L.index(3)

In [None]:
L.index(3,5)

In [None]:
L.index(3,27)

In [None]:
#Aunque no es un método de listas, el "operador del" permite eliminar por posición
print(L)
del (L[0])
print(L)

In [None]:
del(L[5:8])
print(L)
#dir(L)

###### Trabajo:
Hacer pruebas con pop,cont, sort, copy, clear,...

Consultar la documentación para ver el uso de las listas Python como pilas y colas.

###### Muy importante.

In [None]:
L.insert(0,8)
L
type(L.insert(0,8))
# help(list.insert)

Como ya hemos visto antes, los métodos modificadores no devuelven, es decir, devuelven None.
Por eso, no funciona lo siguiente (algo que choca desde el punto de vista funcional)

In [None]:

L.insert(0,8).insert(4,5)


### Listas por comprensión

Una herramienta importante de Python es la definición de listas por comprensión, un mecanismo propio de la Programación Funcional y que veremos con más detalle en sesiones posteriores.
Corresponde a un tipo de definición habitual en matemáticas, conjuntos definidos por "comprensión". De momento, nos limitamos a presentarlo.

In [None]:
dobles=[2*x for x in [1,2,3,4,5,6]]
print(dobles)

In [None]:
#Es una forma muy cómoda y compacta de calcular expresiones de tipo list
#Equivale a:
duplos=[]
for x in [1,2,3,4,5,6]:
    duplos.append(2*x)
print(duplos)

In [None]:
#Se pueden filtrar elementos
triples=[3*x for x in range(1,7) if (x%2==0)]
triples

In [None]:
#Equivale a
triplos=[]
for x in [1,2,3,4,5,6]:
    if (x%2==0):
        triplos.append(3*x)
print(triplos)

In [None]:
#Se admiten expresiones lista, tupla,..
#Se admite concatenación de parejas for...if
combi=[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
combi

In [None]:
combs = []
for x in [1,2,3]:
    for y in [3,11,4]:
        if x != y:
            combs.append((x, y))
combs

In [None]:
#Se pueden anidar listas definidas por conprensión.
ani=[[x*x for x in range(1,i)] for i in range(2,7)]
ani

Ejercicio: calcular directamente la lista anterior
    

In [None]:
def ident(n):
    return([[int(i==x) for i in range(0,n)] for x in range (0,n)])

print(ident(3))

###### Otros tipos secuencia (además de listas): tuplas y rangos

Los tres tipos secuencia básicos son listas, tuplas y rangos.
Los operadores comunes  todos ellos los encontramos en:
    https://docs.python.org/3/library/stdtypes.html#typesseq

In [None]:
#Respecto de TUPLAS, se trata de secuencias inmutables y heterogéneas
t=3,[3,4],"pepe"
print(t)

In [None]:
#Ya dijimos que son objetos inmutables
t[2]=4

In [None]:
#El acceso por índice y slice es el común a todos los tipos de secuencias
t[1]

In [None]:
t[0:1]

In [None]:
#La tupla vacía
s=()
s

In [None]:
#los átomos llevan una coma
s=(3,)
s
type ((3))
#type((3,))

In [None]:
s=3,
s

In [None]:
#Se construyen a partir de cualquier iterable. Una lista, por ejemplo.
s=tuple([x*x for x in range(2,5)])
s

In [None]:
#Empaquetado y desempquetado. Corresponde con la idea de matching
s=3,4,5
x,y,z=s
y

In [None]:
#Más adelante en el curso trataremos con rigor los rangos.
#Aunque no es el uso habitual, los rangos pueden ser utilizados directamente
#como secuencias
#Se basan en la idea de evluación perezosa (no se calculan sus elementos hasta que no se demanda)
range (1,25,2)

In [None]:
print(range(1, 25, 2))

In [None]:
4 in range(1,25,2)

In [None]:
s=range(1,25,7)
s.step

In [None]:
5 not in s

In [None]:
s=tuple(range(4,8))
s

In [None]:
min(range(5,8))+max(range(3,7))


In [None]:
range(2,4)[1]

In [None]:
#Accesores a rangos mediante índices
l=range(2,17)[2:7:3]
print(l)

##### Trabajo personal:
Respecto de conjuntos y diccionarios, consultad el Tutorial de Python

In [None]:
list(l)
l.count(6)

-------------------------------

## Ejercicios

A continuación se listan los ejercicios a realizar para esta sesión. Para cada uno de ellos se proporciona la cabecera de la función a definir junto con unos casos de prueba para verificar el comportamiento correcto de los métodos. Lo único que deberás hacer es reemplazar el ``pass`` por la definición de la función.

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la suma de los cuadrados de los números menores que un entero dado.

In [None]:
def suma_cuadrados_menores_entero(lista,x):
  '''
  >>> suma_cuadrados_menores_entero([],2)
  0
  >>> suma_cuadrados_menores_entero(range(0,10),5)
  30
  >>> suma_cuadrados_menores_entero(range(-10,10,2),0)
  220
  '''
  pass

In [None]:
import doctest
doctest.testmod()

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule la lista de los divisores de un número.

In [None]:
def divisores(x):
  '''
  >>> divisores(0)
  []
  >>> divisores(7)
  [1, 7]
  >>> divisores(12)
  [1, 2, 3, 4, 6, 12]
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Mediante listas definidas por comprensión define una función que determine si un número es primo.

In [None]:
def es_primo(x):
  '''
  >>> es_primo(1)
  False
  >>> es_primo(7)
  True
  >>> es_primo(12)
  False
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Mediante listas definidas por comprensión define una función que calcule los primos menores que un entero dado.

In [None]:
def primos_menores(x):
  '''
  >>> primos_menores(1)
  []
  >>> primos_menores(10)
  [2, 3, 5, 7]
  >>> primos_menores(50)
  [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Implementa el método para [ordenar por mezcla](https://es.wikipedia.org/wiki/Ordenamiento_por_mezcla) una lista.

In [None]:
def mergesort(lista):
  '''
  >>> mergesort([])
  []
  >>> mergesort([1])
  [1]
  >>> mergesort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> mergesort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Implementa el método [quicksort](https://es.wikipedia.org/wiki/Quicksort) para ordenar una lista.

In [None]:
def quicksort(lista):
  '''
  >>> quicksort([])
  []
  >>> quicksort([1])
  [1]
  >>> quicksort([5,1,-1,4,5,7])
  [-1, 1, 4, 5, 5, 7]
  >>> quicksort([5,1,-1,4,5,7,8])
  [-1, 1, 4, 5, 5, 7, 8]
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Implementa el cálculo de la transpuesta de una matriz mediante listas por comprensión. Se proporciona como ayuda la implementación de la transpuesta de una matriz "a pelo".

In [None]:
#La siguiente función calcula la traspuesta de una matriz "a pelo".
def traspuestaAPelo (m):
    tras=[]
    for i in range(len(m[0])):
        filaT=[]
        for j in range(len(m)):
            filaT.append(m[j][i])
        tras.append(filaT)
    return(tras)
traspuestaAPelo([[1,2,3],[4,5,6]])

In [None]:
def transpuesta(lista):
  '''
  >>> transpuesta([[1,2,3],[4,5,6]])
  [[1, 4], [2, 5], [3, 6]]
  >>> transpuesta([[1, 4], [2, 5], [3, 6]])
  [[1, 2, 3], [4, 5, 6]]
  >>> transpuesta([[1, 4, 5], [2, 5, 7], [3, 6, 1]])
  [[1, 2, 3], [4, 5, 6], [5, 7, 1]]
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Dado un grafo orientado (representado mediante un diccionario en el cual las claves son los vértices y los valores son listas con los vertices adyacentes)  y uno de sus vértices, decidir si ese vértice es un sumidero (ninguna arista sale desde él). Además, mediante listas por comprensión, dado un grafo orientado decidir si contiene algún sumidero.

In [None]:
def es_sumidero(grafo,vertice):
  '''
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 2)
  True
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 1)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 3)
  False
  >>> es_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]}, 4)
  False
  '''
  pass

In [None]:
doctest.testmod()

In [None]:
def contiene_sumidero(grafo):
  '''
  >>> contiene_sumidero({1: [2,3,4], 2: [], 3: [2,4],4: [2]})
  True
  >>> contiene_sumidero({})
  False
  >>> contiene_sumidero({1: [2,4], 2: [3,4], 3: [1],4: [3]})
  False
  '''
  pass

In [None]:
doctest.testmod()

**Ejercicio:** Implementa tu propio método zip de una lista de listas usando listas por comprensión.

In [None]:
def mizip(lista1,lista2):
  '''
  >>> mizip([1,2,3],[4,5])
  [(1, 4), (2, 5)]
  >>> mizip([1,2,3],[4,5,6])
  [(1, 4), (2, 5), (3, 6)]
  >>> mizip([1,2],[4,5,6])
  [(1, 4), (2, 5)]
  '''
  pass

In [None]:
doctest.testmod()

# Entrega
Recuerda guardar este notebook en tu repositorio de GitHub.