# Cuaderno 3: Listas (list)

Lista de elementos separados por comas entre corchetes. Los elementos no necesariamente tienen que ser del mismo tipo.

### Aspectos básicos

In [1]:
L = ['Hola mundo', 3.12, 408]
print(L)
print(type(L))

['Hola mundo', 3.12, 408]
<class 'list'>


Los elementos de una lista pueden ser de cualquier tipo, incluso otras listas.

In [2]:
L2 = ['abc', 3, 4.214, ["x", 1], (0,1)]
print(L2)

['abc', 3, 4.214, ['x', 1], (0, 1)]


Para acceder a los caracteres individuales de una lista se utilizan índices entre corchetes.

In [3]:
print(L[0])
print(L[2])
print(L)
L[1]= 31.4
print(L)

Hola mundo
408
['Hola mundo', 3.12, 408]
['Hola mundo', 31.4, 408]


Una lista es un tipo *mutable*.

In [4]:
L[0] = 'h'
print(L)

['h', 31.4, 408]


### Operaciones básicas
Pueden emplearse los operadores **+** y __*__ con el mismo significado que para las cadenas de caracteres (strings), con la única diferencia de que el resultado es una nueva lista, no una cadena.

In [5]:
print (L)
print(L * 3)

['h', 31.4, 408]
['h', 31.4, 408, 'h', 31.4, 408, 'h', 31.4, 408]


In [6]:
print(L + [3, 'papas'])
print(L)

['h', 31.4, 408, 3, 'papas']
['h', 31.4, 408]


Los operadores **+=** y __*=__ combinan los operadores anteriores con la asignación.

In [7]:
L = ['Hola mundo', 3.14, 408]
print(L)
L*= 2 # L = L * 2
print(L)
L+= [3, 'papas'] # L = L + [3, 'papas']
print(L)

['Hola mundo', 3.14, 408]
['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408]
['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']


La función `len` devuelve la longitud de una lista.

In [8]:
print(L)
print(len(L))

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
8


El operador `in` consulta si un elemento pertenece a una lista, y devuelve según el caso el valor de `True` o `False`. 

In [9]:
print(L)
print('papas' in L)
print(409 in L)

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
True
False


Al igual que una cadena de caracteres, una lista es un iterable. El operador `in` puede utilizarse dentro de instrucciones de iteración `for` para recorrer los elementos de la lista.

In [13]:
print(L)
for x in L:
    print(x)

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
Hola mundo
3.14
408
Hola mundo
3.14
408
3
papas


De manera similar, una lista puede iterarse con la instrucción `while` en combinación con una variable de posición y con la función `len`:

In [14]:
print(L)
i=0
while(i<len(L)):
    print(L[i])
    i+= 1

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
Hola mundo
3.14
408
Hola mundo
3.14
408
3
papas


### Extrayendo sublistas (slicing)

Al igual que para cadenas de caracteres, puede utilizarse *slicing* para obtener sublistas. Recordar que se especifica el rango empleando la notación $[a:b]$, donde $b$ es el índice del elemento *posterior* al final del rango.

In [10]:
print(L)
print(L[0:2])
print(L[1:3])

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
['Hola mundo', 3.14]
[3.14, 408]


Se puede omitir el índice del inicio o del final del rango. En ese caso, se entiende que se se trata del primer o del último elemento, respectivamente.

In [11]:
print(L[1:])
print(L[:2])

[3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
['Hola mundo', 3.14]


El índice de -1 se refiere al último elemento, -2 al penúltimo elemento y así sucesivamente. 

In [12]:
print(L)
print(L[-1])
print(L[-1:])
print(L[-2])
print(L[0:-1])
print(L[-2:-1])

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
papas
['papas']
3
['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3]
[3]


Es importante observar la diferencia entre `L[i]`, que retorna el $i$-ésimo elemento de la lista `L` y `L[i:i+1]`, que retorna una sublista de longitud 1.

In [13]:
print(L)
# una sublista con el primer elemento de L
print(L[0:1])
print(type(L[0:1]))
# el primer elemento de L
print(L[0])
print(type(L[0]))

['Hola mundo', 3.14, 408, 'Hola mundo', 3.14, 408, 3, 'papas']
['Hola mundo']
<class 'list'>
Hola mundo
<class 'str'>


### IndexError:
Los índices fuera de rango producen un error (excepción) del tipo *IndexError*.

In [14]:
print(L[20])

IndexError: list index out of range

### Otras funciones y métodos útiles.

Las listas son estructuras de datos *mutables*, lo que significa que pueden ser alteradas, agregando o eliminando elementos, o modificando elementos existentes. 

La función **del L$[a:b]$** elimina todos los elementos en el rango $[a,b]$.

In [16]:
print(L)
del L[2]
print(L)
del L[3:5]
print(L)

['Hola mundo', 3.14, 'Hola mundo', 3, 'papas']
['Hola mundo', 3.14, 3, 'papas']
['Hola mundo', 3.14, 3]


El método **L.append()** agrega un elemento (de cualquier tipo) al final de la lista *L*. 

In [17]:
L.append('hola')
print(L)

['Hola mundo', 3.14, 3, 'hola']


El método **L.pop(i)** devuelve el elemento con índice *i* de la lista *L* y lo elimina de la lista. Si el parámetro *i* se omite, devuelve y elimina el último elemento.

In [18]:
#print(L.pop()) elimina el último elemento de la lista L*
print(L)
print(L.pop(2))
print(L)
print(L.pop())
print(L)

['Hola mundo', 3.14, 3, 'hola']
3
['Hola mundo', 3.14, 'hola']
hola
['Hola mundo', 3.14]


El método __L.insert(i)__ inserta un elemento en la lista *L*, en la posición establecida de acuerdo al índice *i*.

In [19]:
print(L)
L.insert(1, 'papas')
print(L)

['Hola mundo', 3.14]
['Hola mundo', 'papas', 3.14]


El método **L.remove()** toma un elemento como argumento y lo elimina de la lista *L*.


In [20]:
L.remove('papas')
print(L)

['Hola mundo', 3.14]


A diferencia del método **L.pop()**, este método no devuelve ningún valor.

In [21]:
print(L)
print(L.remove('Hola mundo'))
print(L)

['Hola mundo', 3.14]
None
[3.14]


El método **L.extend(L2)** extiende la lista *L* colocando al final de la misma los elementos de *L2*. Es equivalente a realizar la operación *L=L+L2*.

In [22]:
L  = [3.12, 6]
L2 = [-1, 20, 5]
L.extend(L2)
print (L)
L  = [3.12, 6]
L2 = [-1, 20, 5]
L  += L2 # igual que L = L + L2
print (L)

[3.12, 6, -1, 20, 5]
[3.12, 6, -1, 20, 5]


El método **L.sort()** ordena los elementos de la lista *L* de forma ascendente. Cuando hay tipos mezclados, Python da un error `TypeError`.

In [23]:
print(L)
L.sort()
print(L)
L2 = ['casa', 'perro', 'gato', 'libro', 'monitor']
print(L2)
L2.sort()
print(L2)
L2 = L2 + [3, 5, -1, 2.5, 'sapo']
L2.sort()
print(L2)

[3.12, 6, -1, 20, 5]
[-1, 3.12, 5, 6, 20]
['casa', 'perro', 'gato', 'libro', 'monitor']
['casa', 'gato', 'libro', 'monitor', 'perro']


TypeError: '<' not supported between instances of 'int' and 'str'

Para que el método **L.sort()** ordene de forma descendente la lista *L*, se añade un argumento opcional *reverse*. 

In [24]:
L.sort(reverse=True)
print(L)

[20, 6, 5, 3.12, -1]


El método **L.reverse()** invierte el orden actual de los elementos de la lista *L*.

In [25]:
L = ['carro', 7, 8.3321]
L.reverse()
print(L)

[8.3321, 7, 'carro']


### Conversión entre listas y cadenas de caracteres
La función `list` transforma una cadena de caracteres en una lista. 

In [26]:
S="Hola mundo"
L = list(S)
print(L)
L[0]='h'
print(L)

['H', 'o', 'l', 'a', ' ', 'm', 'u', 'n', 'd', 'o']
['h', 'o', 'l', 'a', ' ', 'm', 'u', 'n', 'd', 'o']


El método `S.join` junta el contenido de una lista para producir una cadena de caracteres. El contenido de `S` se usa como separador de la cadena.

In [27]:
print(L)
print(''.join(L)) # sin separador (solamente juntar)
print(' '.join(L)) # separados por espacios
print(','.join(L))  # separados por comas
print('*bla*'.join(L))  # el separador puede ser una cadena

['h', 'o', 'l', 'a', ' ', 'm', 'u', 'n', 'd', 'o']
hola mundo
h o l a   m u n d o
h,o,l,a, ,m,u,n,d,o
h*bla*o*bla*l*bla*a*bla* *bla*m*bla*u*bla*n*bla*d*bla*o


El método `S.split(c)` transforma la cadena `S` en una lista de subcadenas, separándolas de acuerdo al delimitador especificado. Si no se proporciona un delimitador, se emplea el espacio en blanco por defecto.

In [28]:
linea = 'Pablo,3.1213,0023'
print(linea.split(','))
print(S)
print(S.split()) # por defecto el delimitador es el espacio en blanco

['Pablo', '3.1213', '0023']
Hola mundo
['Hola', 'mundo']


### Listas multidimensionales y matrices

Una matriz *M* puede verse como una lista de listas. El primer elemento de la lista coresponde a la primera fila de la matriz, y así sucesivamente.

In [29]:
M = [[1, 2, 3, 2], [4, 5, 6, 3], [7, 8, 9, -1]]
print(M)
print(len(M))
print(len(M[1]))

[[1, 2, 3, 2], [4, 5, 6, 3], [7, 8, 9, -1]]
3
4


Para acceder a la matriz *M* se utilizan indices entre corchetes.

In [30]:
print(M[0])
print(M[1][2])

[1, 2, 3, 2]
6


Las listas internas no necesariamente deben tener la misma dimensión.

In [31]:
G = [[2, 3, 4], [3, 4], [1, 2]]
print(G[0])
print(G[2][1])

[2, 3, 4]
2


### Generación de listas (list comprehensions)
Las `list comprehensions` en Python nos proporcionan una forma breve y concisa de construir  listas utilizando el concepto de *expresiones generadoras*. 


In [32]:
print(M)
print(M[0])
col2 = [x[1] for x in M]
print(col2)
print([fila*2 for fila in M])
print([i*i for i in [1,2,5]])

[[1, 2, 3, 2], [4, 5, 6, 3], [7, 8, 9, -1]]
[1, 2, 3, 2]
[2, 5, 8]
[[1, 2, 3, 2, 1, 2, 3, 2], [4, 5, 6, 3, 4, 5, 6, 3], [7, 8, 9, -1, 7, 8, 9, -1]]
[1, 4, 25]


In [33]:
diag = [M[i][i] for i in [0, 1, 2]]
print(diag)

[1, 5, 9]


In [34]:
M2 = [[i, 2*i, 3*i] for i in [3, 5, 7, 10]]
print(M2)

[[3, 6, 9], [5, 10, 15], [7, 14, 21], [10, 20, 30]]


In [36]:
S = "Una cadena cualquiera de caracteres"
doble_hola = [c*10 for c in S]
print(doble_hola)
print(''.join(doble_hola))

['UUUUUUUUUU', 'nnnnnnnnnn', 'aaaaaaaaaa', '          ', 'cccccccccc', 'aaaaaaaaaa', 'dddddddddd', 'eeeeeeeeee', 'nnnnnnnnnn', 'aaaaaaaaaa', '          ', 'cccccccccc', 'uuuuuuuuuu', 'aaaaaaaaaa', 'llllllllll', 'qqqqqqqqqq', 'uuuuuuuuuu', 'iiiiiiiiii', 'eeeeeeeeee', 'rrrrrrrrrr', 'aaaaaaaaaa', '          ', 'dddddddddd', 'eeeeeeeeee', '          ', 'cccccccccc', 'aaaaaaaaaa', 'rrrrrrrrrr', 'aaaaaaaaaa', 'cccccccccc', 'tttttttttt', 'eeeeeeeeee', 'rrrrrrrrrr', 'eeeeeeeeee', 'ssssssssss']
UUUUUUUUUUnnnnnnnnnnaaaaaaaaaa          ccccccccccaaaaaaaaaaddddddddddeeeeeeeeeennnnnnnnnnaaaaaaaaaa          ccccccccccuuuuuuuuuuaaaaaaaaaallllllllllqqqqqqqqqquuuuuuuuuuiiiiiiiiiieeeeeeeeeerrrrrrrrrraaaaaaaaaa          ddddddddddeeeeeeeeee          ccccccccccaaaaaaaaaarrrrrrrrrraaaaaaaaaacccccccccctttttttttteeeeeeeeeerrrrrrrrrreeeeeeeeeessssssssss


In [37]:
print(M)
sumas = [sum(fila) for fila in M]
print(sumas)

[[1, 2, 3, 2], [4, 5, 6, 3], [7, 8, 9, -1]]
[8, 18, 23]


In [40]:
print(M)
filtrar_filas = [fila for fila in M if fila[2] < fila[0]+fila[1]]
print(filtrar_filas)
L = [i*i for i in [1,3,6, 7, 4, 5] if i%2!=0]
print(L)

[[1, 2, 3, 2], [4, 5, 6, 3], [7, 8, 9, -1]]
[[4, 5, 6, 3], [7, 8, 9, -1]]
[1, 9, 49, 25]


La función **range(n)** retorna una lista con los elementos *0, 1, ..., n-1*.

In [46]:
print(range(1, 10, 2))
print([i for i in range(1, 10, 2)])
print([i*i for i in range(3, 100)])

range(1, 10, 2)
[1, 3, 5, 7, 9]
[9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500, 2601, 2704, 2809, 2916, 3025, 3136, 3249, 3364, 3481, 3600, 3721, 3844, 3969, 4096, 4225, 4356, 4489, 4624, 4761, 4900, 5041, 5184, 5329, 5476, 5625, 5776, 5929, 6084, 6241, 6400, 6561, 6724, 6889, 7056, 7225, 7396, 7569, 7744, 7921, 8100, 8281, 8464, 8649, 8836, 9025, 9216, 9409, 9604, 9801]


Opcionalmente, puede usarse en la forma **range(a, b, k)** para retornar una lista con los elementos *a, a+k, a+2k,...*. La lista termina con el mayor elemento de la forma *a + nk* que sea estrictamente menor a *b*.

In [47]:
print([i for i in range(0, 1000, 100)])

[0, 100, 200, 300, 400, 500, 600, 700, 800, 900]


In [48]:
M3 = [[i, 3*i, i**2] for i in range(-10, 10, 2)]
print(M3)

[[-10, -30, 100], [-8, -24, 64], [-6, -18, 36], [-4, -12, 16], [-2, -6, 4], [0, 0, 0], [2, 6, 4], [4, 12, 16], [6, 18, 36], [8, 24, 64]]


In [50]:
c2 = [fila[1] for fila in M3]
print(c2)
c1 = [i//3 for i in c2]
print(c1)

[-30, -24, -18, -12, -6, 0, 6, 12, 18, 24]
[-10, -8, -6, -4, -2, 0, 2, 4, 6, 8]


Las expresiones generadoras pueden depender de más de una variable:

In [51]:
print([(i, j, i+j) for i in range(10) for j in range(2,5)])
print()
print([(i, j, i+j) for i in range(10) for j in range(2,5) if i < j])


[(0, 2, 2), (0, 3, 3), (0, 4, 4), (1, 2, 3), (1, 3, 4), (1, 4, 5), (2, 2, 4), (2, 3, 5), (2, 4, 6), (3, 2, 5), (3, 3, 6), (3, 4, 7), (4, 2, 6), (4, 3, 7), (4, 4, 8), (5, 2, 7), (5, 3, 8), (5, 4, 9), (6, 2, 8), (6, 3, 9), (6, 4, 10), (7, 2, 9), (7, 3, 10), (7, 4, 11), (8, 2, 10), (8, 3, 11), (8, 4, 12), (9, 2, 11), (9, 3, 12), (9, 4, 13)]

[(0, 2, 2), (0, 3, 3), (0, 4, 4), (1, 2, 3), (1, 3, 4), (1, 4, 5), (2, 3, 5), (2, 4, 6), (3, 4, 7)]


Las expresiones generadoras pueden contener también una componente `else`, en cuyo caso el orden de sus componentes es `<valor1> if <condicion> else <valor2> for ...`. Los elementos de la lista generada toman el `valor1` cada vez que `condicion` es verdadera y caso contrario el `valor2`: 

In [52]:
L = [i//2 if i%2==0 else i*2 for i in range(10)]
print(L)

[0, 2, 1, 6, 2, 10, 3, 14, 4, 18]


La sintaxis anterior puede utilizarse también en expresiones con varias variables:

In [53]:
# Evaluar |i+j| para i,j en {-5,..,5} 
print([(i,j,i+j) if i+j>=0 else (i,j,-(i+j)) for i in range(-5,6) for j in range(-4,5)])

[(-5, -4, 9), (-5, -3, 8), (-5, -2, 7), (-5, -1, 6), (-5, 0, 5), (-5, 1, 4), (-5, 2, 3), (-5, 3, 2), (-5, 4, 1), (-4, -4, 8), (-4, -3, 7), (-4, -2, 6), (-4, -1, 5), (-4, 0, 4), (-4, 1, 3), (-4, 2, 2), (-4, 3, 1), (-4, 4, 0), (-3, -4, 7), (-3, -3, 6), (-3, -2, 5), (-3, -1, 4), (-3, 0, 3), (-3, 1, 2), (-3, 2, 1), (-3, 3, 0), (-3, 4, 1), (-2, -4, 6), (-2, -3, 5), (-2, -2, 4), (-2, -1, 3), (-2, 0, 2), (-2, 1, 1), (-2, 2, 0), (-2, 3, 1), (-2, 4, 2), (-1, -4, 5), (-1, -3, 4), (-1, -2, 3), (-1, -1, 2), (-1, 0, 1), (-1, 1, 0), (-1, 2, 1), (-1, 3, 2), (-1, 4, 3), (0, -4, 4), (0, -3, 3), (0, -2, 2), (0, -1, 1), (0, 0, 0), (0, 1, 1), (0, 2, 2), (0, 3, 3), (0, 4, 4), (1, -4, 3), (1, -3, 2), (1, -2, 1), (1, -1, 0), (1, 0, 1), (1, 1, 2), (1, 2, 3), (1, 3, 4), (1, 4, 5), (2, -4, 2), (2, -3, 1), (2, -2, 0), (2, -1, 1), (2, 0, 2), (2, 1, 3), (2, 2, 4), (2, 3, 5), (2, 4, 6), (3, -4, 1), (3, -3, 0), (3, -2, 1), (3, -1, 2), (3, 0, 3), (3, 1, 4), (3, 2, 5), (3, 3, 6), (3, 4, 7), (4, -4, 0), (4, -3, 1), (4,

In [54]:
dir(list)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [55]:
help(list.index)

Help on method_descriptor:

index(self, value, start=0, stop=9223372036854775807, /)
    Return first index of value.
    
    Raises ValueError if the value is not present.



In [56]:
print(L)

[0, 2, 1, 6, 2, 10, 3, 14, 4, 18]


In [59]:
print(L.index(20))

ValueError: 20 is not in list

In [58]:
print(L[3])

6
