# Listas: conceptos avanzados
**Autores**: Rogelio Mazaeda Echevarría, Félix Miguel Trespaderne.   

## Cortes o _slices_ en listas

Existe un modo muy conveniente para hacer referencia a un conjunto de elementos (una sub-lista) dentro de la lista. Son los llamados **cortes** (**slices**).

La especificación del **corte** involucra el uso del signo `:` dentro de los corchetes, flanqueado opcionalmente por dos enteros que especifican los extremos del **slice**. El extremo inferior estará incluido en el corte, pero el superior no.

Ver los ejemplos que siguen (ejecutar las celdas en orden):

In [7]:
datos = [1, 20, 30, 40, 5]
datos[1:3]

[20, 30]

Si alguno de los extremos falta, eso implica que todos los elmentos desde el principio de la lista (en caso de que falte el primero) y/o hasta el final (en caso de que falte el segundo) son incluídos en el corte:

```python
print(datos[1:])   #imprime los elementos desde el segundo hasta el final de la lista

print(datos[:3])   #imprime los elementos desde el primero hasta el índice 2 incluído

print(datos[:])    #imprime todos los elementos de la lista

print(datos[:-1])  #imprime todos los elementos de la lista, exluyendo el último
```


In [8]:
datos[:-2]

[1, 20, 30]

In [9]:
datos[2:2]

[]

¿Que ha pasado en el último ejemplo? Si los índices superior e inferior del _corte_ coinciden, la lista resultante es la lista vacía. Más adelante encontraremos utilidad a este tipo de construcción.

En realidad, la sintaxis del corte permite un tercer parámetro entero opcional que indica el _paso_ con el que se van a tomas los datos. Si falta, el _paso_ por defecto es 1. Ver ejemplo a continuación:

In [5]:
a = list(range(20))
b = a[2:11:2]
print(a)
print(b)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
[2, 4, 6, 8, 10]


Observe el uso del *paso* para elegir de la lista original los número de dos en dos.

## La mutabilidad de las listas

### Creando _Alias_

Las listas son objetos mutables que pueden ser modificados _in situ_. Cuando se utiliza el signo `=` para realizar una _asignación_ de listas completas, en realidad lo que ocurre es que existirán, a partir de ese momento, dos _nombres_ (dos _etiquetas_ por así decirlo) que hacen referencia al mismo objeto en memoria: los datos de la lista original.

In [8]:
a = [1 ,2 ,3]
b = a
a[0] = 10
print(a)
print('A través de b vemos el cambio hecho con a.')
print(b)

[10, 2, 3]
A través de b vemos el cambio hecho con a.
[10, 2, 3]


¿Que ha pasado? Es importante comprender, que a diferencia de lo que ocurren en otros lenguajes de programación, cuando se utiliza el signo de asignación `=`, como en la línea 2 del código previo, no se crea un nuevo objeto en memoria, sino que se define un nuevo nombre (un *alias*) para referirnos al objeto previamente existente.

Para los objetos **inmutables**, como los las cadenas de caracteres, este hecho no tiene mayores implicaciones, porque el dato referenciado nunca va a cambiar. Sin embargo en el caso de las listas (y otras colecciones que veremos), como son **mutables**, el hecho de que se modifique el objeto subyacente a través de uno de los identificadores, hace que la operación también se *percibida* a través de los otros identificadores que constituyen *alias* del primero. Este resultado suele sorprender a aquellos programadores sin experiencia previa en Pyhton.

El siguiente esquema ilustra lo que ha pasado.

![Listas2.jpg](img/Listas2.jpg)

De manera que ahora se entiende por qué el cambio del primer elemento de `a` implique también un cambio en `b` puesto que hacen referencia al mismo conjunto de datos

#### La función `id()` y operador `is`

En este contexto, la función nativa `id()` y el operador `is` son recursos que nos ayuda a verificar los conceptos que se están discutiendo.

* `id()` nos devuelve un entero que identifica de manera única los valores en memoria y puede concebirse como una identificación de la localización de memoria en que se encuentra el dato.
* `is` es un operado binario que devuelve un valor lógico que será `True` si dos identificadores hacer referencia a al mismo valor en memoria.


In [14]:
a = [1 ,2 ,3]
b = a
c = [1, 2, 3]

print("La dirección en memoria de 'a' es {} y la de su alias 'b' es {}".format(id(a),id(b)))
print("Por tanto podemos concluir que 'a' es 'b' y viceversa es una afirmación", a is b)

print("Sin embargo, 'c' (aunque tiene el mismo contenido) tiene dirección: ", id(c))
print("Por tanto que 'a' (y 'b') no son el mismo objeto es:", a is not c)

print("Pero afirmar que si tienen contenidos idénticos es: ", a == b)

La dirección en memoria de 'a' es 2361388501576 y la de su alias 'b' es 2361388501576
Por tanto podemos concluir que 'a' es 'b' y viceversa es una afirmación True
Sin embargo, 'c' (aunque tiene el mismo contenido) tiene dirección:  2361388712584
Por tanto que 'a' (y 'b') no son el mismo objeto es: True
Pero afirmar que si tienen contenidos idénticos es:  True


### Revisitando las asignaciones de valores simples
Los valores simples como los de tipo `int`, `float` o lógicos que hemos visto hasta ahora son calificados por Python como **valores inmutables**. Esta afirmación puede resultar sorprendente. ¿Qué pasa entonces cuando se ejecuta un simple código de actualización como el siguiente?

```Python
cont = 1
cont = cont + 1
```
La interpretación correcta, si se tratará de un lenguaje como C/C++, sería la que se muestra en el siguiente diagrama.
![Listas3.jpg](img/Listas3.jpg)

El lenguaje asignaría una localización de memoria concreta a la **variable** `cont` (en el ejemplo se ha utilizado para propósitos de ilustración una *localización* de memoria concreta de dirección 0x00FF en hexadecimal) y esta asociación entre las celdas de memoria y el nombre de la variable perduraría mientras dicha variable existiera). De manera que cuando se ejecuta la segunda línea del programa, la localización de memoria que antes contenía un `1` ahora pasaría a contener un `2` (el valor que resulta de evaluar la expresión a la derecha del signo `=`).

Por otra parte, si el mismo código lo interpretáramos como perteneciente a un programa de Python, aunque desde el punto de vista práctico el resultado sea idéntico, la _mecánica_ interna sería completamente diferente.

![Listas4.jpg](img/Listas4.jpg)

Evidentemente, también en el caso de Python, los valores serán almacenados en localizaciones de memoria concretas. Para ser consecuentes con el caracter de *alto nivel* no hemos supuesto ningún valor de dirección de memoria específico en el esquema. Lo que si es cierto es que, cuando se ejecuta la segunda sentencia, el resultado da lugar a un nuevo valor y ese valor será almacenado en una localización de memoria que en principio es completamente diferente. ¿Qué pasa con el antiguo valor del `1`? Bueno, en principio no es necesario que permanezca en memoria. Eventualmente el **motor de tiempo de ejecución** (**runtime engine**) de Python se encargará de eliminarlo de la memoria utilizando un proceso que se conoce como **recolección de basura** (**garbage collection**). 

#### Mecanismo del recolector de basura
Python mantiene internamente un *contador* que registra cuántos **identificadores** están en cada momento haciendo referencia a una localización en memoria. Cuando ese contador llega a cero, quiere decir que la memoria que el mismo ocupaba deja de ser necesaria y puede ser devuelta al Sistema Operativo, para ser reutilizado posteriormente, por nuestro programa o por cualquier otro. Esta es otra de las tantas diferencias notables entre el C/C++ y el Python. En C/C++, siendo un lenguaje de más bajo nivel, el programador es completamente responsable del manejo de memoria.

#### Ejemplo que muestra la inmutabilidad de los datos simples
¿Por qué en el caso de los datos simples no nos habíamos percatado del comportamiento derivado de los **alias** como hemos visto más arriba con las listas? 

Precisamente debido a que los datos simples son **inmutables**. Vea la siguiente situación:

```Python
lado1 = lado2 = 2.0
lado2 = 3.0
print(lado1*lado2)
```

¿Qué saldrá por pantalla? Nuestra intuición (y probablemente la intención del programador) nos dice que saldrá el valor `6.0`. 

Pero ¿acaso saldrá el valor `9.0` y tendremos un comportamiento similar al experimentado antes con las listas? 

Afortundamente la respuesta es `6.0` (pueden comprobarlo) y la razón es precisamente que aunque es cierto que en Python los identificadores de valores actúan como etiquetas, en este caso, como los valores son inmutables, cualquier asignación crea un valor nuevo diferente en una localización de memoria también distinta. Ver la traza y el esquema de lo que ocurre.

![Listas5.jpg](img/Listas5.jpg)

Inicialmente, tanto `lado1`como `lado2` hacían referencia al mismo valor `2.0`. En la siguiente sentencia, `lado2` deja de hacer referencia al valor previo y ahora apunta a un nuevo valor (`3.0`) en alguna otra localización de memoria. Pero el valor `2.0` sigue en memoria, donde antes estaba, porque todavía hay una referencia (`lado1`) que *apunta* a él y eso impide que dicha memoria sea reclamada por el **recolector de basura**.

La discusión previa, en lo que se refiere a los datos simples, puede ser ignorada en el día a día de la programación. En el caso de los datos mutables como las listas, estas consideraciones si que son relavantes.

In [18]:
lado1 = lado2 = 2.0
print("id(lado1) =", id(lado2), "  id(lado2) =", id(lado2), "   lado1 is lado2 =", lado1 is lado2)

lado2 = 3.0
print("id(lado1) =", id(lado1), "  id(lado2) =", id(lado2), "   lado1 is lado2 =", lado1 is lado2)

print(lado1*lado2)

id(lado1) = 2361387884048   id(lado2) = 2361387884048    lado1 is lado2 = True
id(lado1) = 2361387884048   id(lado2) = 2361388484048    lado1 is lado2 = False
6.0


## Copia Superficial
Hemos visto que el uso del operador `=` para copiar una lista completa, en realidad lo que logra es crear una nueva referencia al mismo objeto de memoria, que es además mutable. Muchas veces es precisamente esto lo que se quiere lograr: dar un nuevo nombre, un *alias* al objeto subyacente: el contenido de la lista almacenado en memoria.

Pero en otras ocasiones queremos obtener otra lista que tenga los mismos elementos pero que haga referencia a objetos distintos en memoria. En este caso, lo apropiado es hacer realmente una copia de los datos. Esto se puede realizar, para el caso de las listas no anidadas, utilizando el concepto de **corte** (**slice**) de la forma que se recoge a continuación:

```python
vector1 = [1.1, 2.0, 4.5]
vector2 = vector1[:]
```

![Listas6.jpg](img/Listas6.jpg)

La copia que se realiza con código similar al anterior, utilizando **slices** realiza una copia *bit a bit* desde la fuente al destino. Este tipo de copia funciona perfectamente para listas simples como las del ejemplo, como se puede comprobar en la celda siguiente:

In [15]:
vector1 = [1.1, 2.0, 4.5]
vector2 = vector1[:]
vector2[2] = 0
print(vector1)
print(vector2)

[1.1, 2.0, 4.5]
[1.1, 2.0, 0]


Otra forma de realizar la copia superficial anterior es utilizando la función `list()` de la siguiente forma:

```python
vector2 = list(vector1)
```

o usando el método `copy()` de las listas.

In [19]:
a = [1, 2, 3, "a"]
b = a
print("'a' es igual a 'b'", a == b)
print("porque de hecho b es un 'alias de a: la memoria es la misma'", a is b)
c = b.copy()
print("'b' sigue siendo igual a 'c'", b == c)
print("pero ya no constiuyen el mismo objeto en memoria", b is c)

'a' es igual a 'b' True
porque de hecho b es un 'alias de a: la memoria es la misma' True
'b' sigue siendo igual a 'c' True
pero ya no constiuyen el mismo objeto en memoria False


## Copia Profunda
Para estructuras más complicadas, como por ejemplo, para la lista del ejemplo siguiente, la copia con *slices* tampoco brinda el resultado satisfactorio que se busca de obtener dos listas completamente separadas.

```python
a = [1, 2, [3, 4]]
b = a[:]
```
![Listas7.jpg](img/Listas7.jpg)

Se puede observar en el diagrama que la sublista `[3, 4]` que está incluida en `a`, es accedida a su vez mediante un referencia que apunta a las localizaciones de memoria que realmente la almacenan. Cuando ahora se realiza la copia *bit a bit* de `a` hacia `b` utilizando *slices*, se copian, no los datos de la sublista, sino los bits (apuntadores) que hacen referencia a la misma. La copia que se logra de esta forma es una copia **superficial**.

Si ahora se cambia el valor del primer elemento de la lista a:

```python
a[0] = 10
```
solamente se modifica la copia que pertenece en exclusiva a dicha variable.

Pero si se intenta modificar un elemento de la sublista que aparece como tercer elemento de a, se modificará la lista compartida común entre a y b.

```python
a[2][0] = 20
```

In [17]:
a = [1, 2, [3, 4]]
b = a[:]
a[0] = 10
a[2][0] = 20
print('a: ', a)
print('b: ', b)

a:  [10, 2, [20, 4]]
b:  [1, 2, [20, 4]]


### Copia profunda
Se puede realizar una **copia profunda** (**deep copy**) que funcione para listas anidadas. Pero para ello hay que recurrir a bibliotecas de funciones: en particular en el módulo `copy` tenemos la función `deepcopy()`.

```python
from copy import deepcopy

a = [1, 2, [3, 4]]
b = deepcopy(a)
```
El diagrama resultante después de la copia profunda será el que se muestra a continuación.

![Listas8.jpg](img/Listas8.jpg)

In [17]:
from copy import deepcopy

a = [1, 2, [3, 4]]
b = deepcopy(a)
a[0] = 10
a[2][0] = 20
print('a: ', a)
print('b: ', b)


a:  [10, 2, [20, 4]]
b:  [1, 2, [3, 4]]


## Matrices matemáticas utilizando lista anidadas
Las matrices son uno de los conceptos matemáticos más importantes. Aunque hay módulos, como **Numpy** que permiten trabajar con matrices de forma eficiente Una forma de implementarlas en Python es utilzar listas, y en particular listas anidadas, como en el ejemplo que sigue:

```python
mat = [[a11, a12, ..., a1n],[a21, a22, ..., a2n],..., [am1, am2, ..., amn]]
```

El anterior código podría interpretarse como la creación de una matriz de **nxm**: ```n``` columnas y ```m``` filas. Nótese que otra manera de verla, sería como una lista de **m** sublistas (filas) cada una de las cuales tiene __n__ elementos (columnas).

En el código que sigue se utiliza esta representación para realizar la suma (matemática) de dos matrices de enteros.

In [1]:
a = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
b = [[1, 1, 1, 1], [2 ,2 ,2, 2], [3, 3, 3, 3]]

#Inicializamos matriz suma 
mat_suma=[]

#Recorremos la matriz con un doble bucle anidado, sumando elementos correspondientes
for i in range(len(a)):
    fila = []
    for j in range(len(a[i])):
        suma= a[i][j]+b[i][j]
        fila.append(suma)
    mat_suma.append(fila)

#Sacamos por pantalla la lista anidada en forma de matriz matemática
for fila in mat_suma:
    for elem in fila:
        print ('{:5d}'.format(elem), end = " ")
    print()

    2     3     4     5 
    7     8     9    10 
   12    13    14    15 


En el codigo anterior se utiliza un doble bucle anidado para recorrer las filas y las columnas de las dos matrices de igual dimensión que actúan como sumandos.

Al inicio y fuera de ambos bucles, se inicializa la lista que actuará como matriz resultado de la suma.

En cada iteración del bucle externo, primero se inicializa una lista vacía (```fila```) que actuará precisamente como la fila actual de la matriz resultado. En el bucle interno se va actualizando la lista fila, añadiendo el elemento que toca como suma de los elementos correspondientes de los dos sumandos. 

Una vez creada la fila, se añade a la matriz suma también utilizando el método ```.append()```, pero en este caso de la matriz resultado.

El siguiente doble bucle anidado se encarga de sacar por pantalla el contenido de la lista resultante en forma de matriz matemática.

El código anterior es correcto. Muchas veces, a la hora de recorrer listas (también en el caso de las listas anidadas) se utiliza una construcción como la que se muestra a continuación:

```python
for i in range(len(lista)):
    # Hacer algo con los elementos
    print(lista[i])
```
Esta construcción es válida, pero un estilo mucho más en consonancia con las posibilidades y el estilo de Python, es acceder directamente al los elementos del iterable:

```python
for elem in lista:
    # Hacer algo con los elementos
    print(elem)
```

¿Como resultaría el código anterior, utilizando esta última construcción? Se debe tomar como referencia el bucle del programa principal que muestra por pantalla la matriz.

Un posible resultado se muestra a continuación, utilizando también una función:

In [11]:
# Función (no pura) para sacar matriz por pantalla
def muestra_matriz(a):
    for fila in a:
        for elem in fila:
            print ('{:5d}'.format(elem), end = " ")
        print()
    
# Función (pura) para sumar dos matrices 
def suma_mat(a,b): 
    mat_suma=[]
    for i,fila in enumerate(a):
        fila = []
        for j,elem in enumerate(fila):
            suma= elem+b[i][j]
            fila.append(suma)
        mat_suma.append(fila)
    return mat_suma

# Programa principal para probar las funciones previas

suma = suma_mat(a, b)
muestra_matriz(suma)

    2     3     4     5 
    7     8     9    10 
   12    13    14    15 


En el código previo se utiliza el **for** de la manera correcta para recorrer el **iterable** que es la lista. Surge, sin embargo, la necesidad de obtener no sólo el elemento adecuado de la matriz ```a```, sino también el elemento correspondiente (en la misma fila y columna) de la matriz ```b```. Para ello resulta conveniente obtener adicionalmente el índice de las listas (```i``` para la fila y ```j``` para la columna) para utilizar la sintaxis de los corchetes (```b[i][j]```). Esto se puede lograr utilizando el **iterable** que devuelve **enumerate**.

Una alternativa al uso de **enumerate**, para este caso concreto, sería el uso de la función **zip()** que permite _unir_ dos listas, para obtener simultáneamente los elementos a sumar de ambas matrices.

In [12]:
# Función (no pura) para sacar matriz por pantalla
def muestra_matriz(a):
    for row in a:
        for elem in row:
            print ('{:5d}'.format(elem), end = " ")
        print()
    
# Función (pura) para sumar dos matrices 
def suma_mat(a, b): 
    mat_suma=[]
    for fila_a, fila_b in zip(a, b):
        fila = []
        for elem_a, elem_b in zip(fila_a, fila_b):
            suma= elem_a + elem_b
            fila.append(suma)
        mat_suma.append(fila)
    return mat_suma

# Programa principal para probar las funciones previas

suma = suma_mat(a, b)
muestra_matriz(suma)

    2     3     4     5 
    7     8     9    10 
   12    13    14    15 


¿Qué sucede, en el código previo, si los argumentos que se pasan no son matrices, o no tiene las mismas dimensiones? ¿Cómo se podría modificar el código de las funciones previas de forma que se implemente el concepto **EAFP** utilizando excepciones?