# Unidad 10 - Listas

## Necesidad de las estructuras de datos

Supongamos que queremos calcular la estatura media de varias personas. Una posibilidad es almacenar la estatura de cada persona en una variable de nombre `estatura_i`:

In [None]:
num_personas = 6

estatura_1 = 1.83
estatura_2 = 1.76
estatura_3 = 1.68
estatura_4 = 1.61
estatura_5 = 1.89
estatura_6 = 1.57

Para calcular la altura media necesitamos calcular la suma de todas las estaturas:

In [None]:
suma_estaturas = estatura_1 + estatura_2 + estatura_3 + estatura_4 + estatura_5 + estatura_6
media_estaturas = suma_estaturas / num_personas
media_estaturas

Claramente este enfoque no es adecuado. Cada vez que añadimos una persona, tenemos que:
- modificar el valor de `num_personas`
- crear una variable nueva `persona_i`
- añadir un sumando al cálculo de `suma_estaturas`

Si lo que queremos es elimiar una persona, tendríamos que hacer modificaciones similares.

La forma correcta de resolver este problema consiste en utilizar una **estructura de datos**. Una estructura de datos es un tipo de datos que contiene dentro otros datos; es decir, es una **colección** de datos. Por ejemplo, para este problema podriamos tener una variable `estaturas` que almacenara la colección de estaturas de las que queremos calcular la media aritmética:

In [None]:
estaturas = [ 1.83, 1.76, 1.68, 1.61, 1.89, 1.57 ]

Es decir, tenemos sola una variable `estaturas` que contiene todas las estaturas de las personas que estamos considerando.
Con esta solución, si queremos añadir una persona, basta añadir su estatura a la colección. Si queremos eliminar una persona, basta eliminar su estatura de la colección.

Observa que hay cierta analogía con los bucles:
- los bucles permiten que el código repetido aparezca una sola vez (en el cuerpo del bucle)
- las colecciones o estructuras de datos permiten que las variables  _"repetidas"_ (`estatura_i`) aparezcan una sola vez (en la variable de tipo colección)

## El tipo lista

El tipo lista es una colección o estructura de datos Python que permite almacenar varios valores y acceder a los mismos a través de su posición o índice.

Un literal de lista tiene la siguiente sintaxis:

```python
      [exp_0, exp_1, exp_2, ..., exp_n]
```

Es decir, aparecen los valores que contiene la lista separados por comas y encerrados entre corchetes:

In [None]:
[ 1.83, 1.76, 1.68, 1.61, 1.89, 1.57 ]

Los elementos de la lista pueden ser de cualquier tipo y, obviamente, las listas se pueden almacenar en una variable:

In [None]:
estaturas = [ 1.83, 1.76, 1.68, 1.61, 1.89, 1.57 ]
lenguajes = ["python", "java", "javascript", "c"]
edades = [31, 18, 26, 41, 11, 54]

print(estaturas)
print(lenguajes)
print(edades)

Una lista puede tener cualquier número de elementos, incluso cero:

In [None]:
lista_vacia = []
lista_unitaria = [5]
print(lista_vacia)
print(lista_unitaria)

Las listas tienen su propio tipo, `list`. Observa que ni el tipo de los elementos ni su número influyen en el tipo:

In [None]:
print(type(estaturas))
print(type(lenguajes))
print(type([1,2,3]))
print(type([]))

Las listas pueden incluso mezclar valores de diferentes tipos, aunque no siempre sea lo más recomendable:

In [None]:
lista_mixta = [5 * 2, 3.1416, "python", 5 > 4]
print(type(lista_mixta))
print(lista_mixta)

## Operadores básicos de listas

Las listas, al igual que las cadenas (`str`) y los rangos (`range`) son **secuencias**; es decir, son colecciones de datos compuestas por una secuencia (posiblemente vacía) de valores. Cada valor ocupa una posición dentro de la colección (primero, segundo, último, ...). Las posiciones que ocupan los valores se numeran desde cero: el primer valor está en la posición 0, el segundo en la posición 1, etc. A la posición que ocupa un valor se le llama **índice**.

Todas las secuencias Python (listas, cadenas y rangos) soportan los siguientes operadores:

| Operador     | Significado   |
|--------------|---------------|
|    `s[i]`    | indexación    |
|  `s[i:j:k]`  | _slicing_     |
|  `s1 + s2`   | concatenación |
|   `n * s`    | replicación   |
|  `x in s`    | pertenencia   |
| `x not in s` | no pertenencia|

**Nota:** Los rangos no soportan ni la contatenación (`+`) ni la replicación (`*`) para evitar valores repetidos.

### Indexación

In [None]:
lenguajes[3]

### Indexación negativa

In [None]:
lenguajes[-1]

### Concatenación y replicación

In [None]:
lenguajes + edades

In [None]:
2 * lenguajes

### Pertenencia a lista

In [None]:
"python" in lenguajes  # elemento in lista

In [None]:
"th" in "python"  # subcadena in cadena

### _Slicing_ básico

In [None]:
lenguajes[1:3]

In [None]:
lenguajes[1:]

In [None]:
lenguajes[:3]

In [None]:
lenguajes[0:4:3]

In [None]:
lenguajes[:]    # toda la lista

In [None]:
lenguajes[::-1] # toda la lista, invertida

In [None]:
lenguajes[::-2]

### Operadores relacionales sobre listas

Las listas (al igual que el resto de secuencias) se pueden comparar con los operadores relacionales (`==`, `!=`, `<`, `>`, `<=`, `>=`). Las comparaciones se realizan elemento a elemento, desde el primero al último. La comparación  se resuelve cuando se encuentra la primera discrepancia o cuando alguna de las secuencias se queda sin elementos.

**Nota 1:** Los rangos solo soportan `==`y `!=`.

**Nota 2:** Para que dos secuencias sean comparables, es necesario que sus valores sean comparables.


In [None]:
[1,2,5] > [1,2,3,4]

In [None]:
[3.14, 12, "hola"]  < ["python"]

## Funciones sobre listas

Las listas, como el resto de secuencias, soportan las siguientes funciones:

| Función  | Significado |
|----------|-------------|
| `len(s)` | longitud    |
| `min(s)` | mínimo      |
| `max(s)` | máximo      |

Además, las listas soportan las siguientes funciones:

| Función     | Significado                    |
|-------------|--------------------------------|
| `sum(s)`    | suma                           |
| `any(s)`    | algún elemento es`True`        |
| `all(s)`    | todos los elementos son `True` |
| `sorted(s)` | devuelve la lista ordenada     |



In [None]:
lista = [6, 7, 1, 12, -56, 34, 1, 12, 7, 0]
len(lista)

In [None]:
min(lista)

In [None]:
max(lista)

In [None]:
sum(lista)

In [None]:
any([ 1 < 2 , "hola" == "ho", 3 * 5 == 15])

In [None]:
all([ 1 < 2 , "hola" == "ho", 3 * 5 == 15])

In [None]:
sorted(lista) # sorted no modifica la lista

In [None]:
lista # sorted no modifica la lista

## Conversión a tipo lista

Podemos convertir ciertos tipos a listas mediante la función de conversión `list`. Esto es especialmente útil con cadenas y rangos:

In [None]:
list("hola mundo")

In [None]:
list(range(1,11))

## Las listas son mutables

Al contario que las cadenas o los rangos, podemos modificar a voluntad elementos individuales de las listas. Para ello nos referimos al índice o posición del elemento que queremos modificar; es decir, es como la indexación pero aparece al lado izquierdo de una sentencia de asignación:

```python
   lista[i] = nuevo_valor
```

In [None]:
otra_lista = list(range(1,16))
otra_lista

In [None]:
otra_lista[-1] = 1001
otra_lista

### Las cadenas no son mutables

In [None]:
cadena = "hola"
cadena

In [None]:
cadena[0] = 'H'
cadena

### _Slicing_ y mutabilidad

La operación de _slicing_ devuelve una **nueva** lista. Las modificaciones que hagamos sobre la nueva lista no afectan a la original:

In [None]:
original = [1,2,3,4,5]
rebanada = original[::2]
print(original)
print(rebanada)

In [None]:
rebanada[1] = 5005
print(original)
print(rebanada)

In [None]:
toda = original  # alias (son la misma lista)
print(original)
print(toda)

In [None]:
toda[2] = 3333
print(original)
print(toda)

In [None]:
copia_de_todas = original[:]  # copia
print(original)
print(copia_de_todas)

In [None]:
copia_de_todas[2] = -4
print(original)
print(copia_de_todas)

## Métodos sobre listas

Las listas soportan varios métodos. Recuerda que un método es similar a una función, pero la sintaxis para usarlos es diferente:

|             | Sintaxis                |
|-------------|-------------------------|
| **Función** | nombre_de_funcion(dato) |
| **Método**  | dato.nombre_de_metodo() |

Por supuesto, es posible que tanto la función como el método tomen argumentos adicionales:

|             | Sintaxis                      |
|-------------|-------------------------------|
| **Función** | nombre_de_funcion(dato, args) |
| **Método**  | dato.nombre_de_metodo(args)   |

Una característica muy importante de los métodos sobre listas es que la aplicación de un método puede **modificar** la lista. Esto se debe a que las listas son **mutables**.

**Nota:** Técnicamente, también es posible que una función modifique la lista que le pasamos como parámetro, pero esto es menos habitual y no muy recomendable. En concreto, las funciones anteriores (`len()`, `max()`, `min()`, etc. no modifican la lista).

Las listas soportan los siguientes métodos:

| Método                 | Significado                                               |
|------------------------|-----------------------------------------------------------|
| `l.append(x)`          | añade `x`al final de `l`                                  |
| `l1.extend(l2)`        | añade todos los elementos de `l2` al final de `l1`        |
| `l.insert(i,x)`        | inserta `x`en la posición `i`de `l`                       |
| `l.pop()`              | elimina el último elemento de `l`                         |
| `l.pop(i)`             | elimina el elemento en la posición `i`de `l`              |
| `l.remove(x)`          | elimina la primera aparición de `x` de `l`                |
| `l.count(x)`           | devuelve cuántas veces aparece `x`en `l`                  |
| `l.index(x)`           | devuelve la posición de la primera aparición de `x`en `l` |
| `l.sort()`             | ordena `l`ascendentemente                                 |
| `l.sort(reverse=True)` | ordena `l`descendentemente                                |

In [None]:
numeros = list(range(0,17,2))
print(numeros)
numeros.append(900)
numeros

In [None]:
numeros.extend([-1,-2,-3])
numeros

In [None]:
numeros.append([100, 200, 300])  # probablemente debería ser append
numeros

In [None]:
numeros = list(range(0,17,2))
print(numeros)
numeros.insert(4,116)
numeros

In [None]:
numeros = list(range(0,17,2))
print(numeros)
numeros.pop(0)
n = numeros.pop(0)  # elimina y devuelve el eliminado
print(n)
numeros

In [None]:
numeros = list(range(0,17,2))
print(numeros)
numeros.remove(10)
if 5 in numeros:
    numeros.remove(5)  # si el valor a eliminar no está, falla
numeros

In [None]:
ls = [1,4,1,2,3,1,2,4,5,3]
ls.count(3)

In [None]:
ls = [1,4,1,2,3,1,2,4,5,3]
ls.index(2)

In [None]:
ls = [1,4,1,2,3,1,2,4,5,3]
ls.sort()
ls

In [None]:
ls = [1,4,1,2,3,1,2,4,5,3]
ls.sort(reverse=True)
ls

In [None]:
help(list.remove)

## Iteración sobre listas

Podemos utilizar bucles para visitar uno a uno los elementos de una lista.

Si vamos a visitar exhaustivamente los elementos de la lista, es preferible utilizar un bucle `for` usando la lista como fuente de datos:

```python
   for x in lista:
        procesa elemento x
```



In [None]:
numeros = [1, 7, 0, -5, 6, 3, -8, 2]

# ¿Cuántos elementos positivos hay en la lista?

num_positivos = 0
for n in numeros:  # n = 1, 7, 0, -5, 6, 3, -8, 2
    if n > 0:
        num_positivos += 1

num_positivos

Si vamos a visitar solo algunos elementos de la lista porque la iteración se puede detener prematuramente, es preferible utilizar un bucle `while` y acceder por indexación:

```python
    i = 0
    while  i < len(lista) and condición:
        procesa elemento lista[i]
        i += 1
```

In [None]:
# numeros = [1, 7, 0, -5, 6, 3, -8, 2]

numeros = [4,1,3,5,4]

# ¿tiene algún elemento negativo?

i = 0
hay_negativo = False
while i < len(numeros) and not hay_negativo:
    # print(numeros[i])
    hay_negativo = numeros[i] < 0
    i += 1
    
if hay_negativo:
    print("hay algún negativo")
else:
    print("no hay ningún negativo")

## Solución del primer ejercicio de paper coding (60)

In [None]:
prime_list = [2,3,5,7]
print("el primer elemento de la lista es", prime_list[0])

## Solución del segundo ejercicio de paper coding (61)

In [None]:
prime_list = [2,3,5,7]
print("lista de primos:", prime_list)
prime_list.append(11)
print("lista de primos tras añadir otro:", prime_list)

## Solución del tercer ejercicio de paper coding (62)

In [None]:
list1 = [3, 5, 7]
list2 = [2, 3, 4, 5, 6]

for elemento_lista1 in list1: #  elemento_lista1 = 3, 5, 7
    for elemento_lista2 in list2: # elemento_lista2 = 2, 3, 4, 5, 6
        print(elemento_lista1, "*", elemento_lista2, "=", elemento_lista1*elemento_lista2)

## Solución del primer ejercicio de pair programming (85)

In [None]:
s_list = ["abc", "bcd", "bcdefg", "abba", "cddc", "opq"]

if len(s_list) == 0:
    print("no está definido")
else:
    cadena_mas_corta = s_list[0] # hasta el momento
    for cadena in s_list:  # cadena = "abc", "bcd", "bcdefg", "abba", "cddc", "opq"
        if len(cadena) < len(cadena_mas_corta):
            cadena_mas_corta = cadena

    print("La primera cadena más corta de la lista es:", cadena_mas_corta) 

## Solución del segundo ejercicio de pair programming (86)

In [None]:
s_list = ["abc", "bcd", "bcdefg", "abba", "cddc", "opq"]

if len(s_list) == 0:
    print("No está definido.")
else:
    largest_string = s_list[0]

    for elemento in s_list:
        if len(elemento) > len(largest_string):
            largest_string = elemento

    print("The largest string is", largest_string)

## Solución del tercer ejercicio de pair programming (87)

In [None]:
# No utilices el método sort
# la solución debe ser la lista ["abc", "bcd", "opq"]

s_list = ['abc', 'bcd', 'bcdefg', 'abba', 'cddc', 'opq']

if len(s_list) == 0:
    print("no esta definido")
else: 
    shortest_length = len(s_list[0])
    for s in s_list:
        if len(s) < shortest_length:
            shortest_length = len(s)

    shortest_strings = []
    for s in s_list:
        if len(s) == shortest_length:
            shortest_strings.append(s)

print("Cadenas con la longitud más pequeña:", shortest_strings)

In [None]:
s_list = ["abc", "bcd", "bcdefg", "x", "abba", "cddc", "y", "opq"]

if len(s_list) == 0:
    print("no está definido") # []
else:
    long_cadena_corta = len(s_list[0])
    lista_cadenas_cortas =[]

    for cadena in s_list:
        print(lista_cadenas_cortas, long_cadena_corta, cadena)
        if len(cadena) == long_cadena_corta:
            lista_cadenas_cortas.append(cadena)
        elif len(cadena) < long_cadena_corta:
            long_cadena_corta = len(cadena)
            lista_cadenas_cortas = [cadena]

    print("La lista de cadenas más cortas es:", lista_cadenas_cortas) 

## Solución del mission problem (12)

In [None]:
#         [nombre, edad, género, altura, peso]
person1 = ['David Doe', 20, 1, 180.0, 100.0]
person2 = ['John Smith', 25, 1, 170.0, 70.0]
person3 = ['Jane Carter', 22, 0, 169.0, 60.0]
person4 = ['Peter Kelly', 40, 1, 150.0, 50.0]

database = [person1, person2, person3, person4]

# calcular el promedio de edad

database

## Apéndice: Tuplas

Las tuplas son semejantes a las listas, pero son **inmutables**. Una vez creada una tupla, no podemos modificar su contenido: no podemos ni modificar, ni añadir, ni eliminar elementos.

La sintaxis de un literal de tupla es:

```python
   (exp_0, epx_1, exp_2,..., exp_n)
```

Es decir, aparecen los valores que contiene la lista separados por comas y encerrados entre paréntesis:

In [None]:
colores_parchis = ("rojo", "azul", "amarillo", "verde")
ubicacion_tesoro = (23.671, 78.539)

print(colores_parchis)
print(ubicacion_tesoro)

Las tuplas tienen su propio tipo, `tuple`, que no se ve afectado por el número o tipo de sus elementos:

In [None]:
print(type(colores_parchis))
print(type(ubicacion_tesoro))

Las tuplas son **secuencias**, podemos aplicar cualquiera de los operadores o funciones sobre secuencias:


| Operador     | Significado   |
|--------------|---------------|
|    `s[i]`    | indexación    |
|  `s[i:j:k]`  | _slicing_     |
|  `s1 + s2`   | concatenación |
|   `n * s`    | replicación   |
|  `x in s`    | pertenencia   |
| `x not in s` | no pertenencia|

| Función  | Significado |
|----------|-------------|
| `len(s)` | longitud    |
| `min(s)` | mínimo      |
| `max(s)` | máximo      |

In [None]:
print(colores_parchis)
print(colores_parchis[0])
print(colores_parchis[1:3])
print(colores_parchis + ubicacion)
print(2 * colores_parchis)
print("azul" in colores_parchis)
print(len(colores_parchis))
print(max(colores_parchis))

Las tuplas se comparan elemento a elemento, del primero al último:

In [None]:
(1,2,5) > (1,2,3,4,5)

La función de conversión `tuple()`permite convertir una secuencia a una tupla:

In [None]:
print(tuple(["python", "java", "C#"]))
print(tuple(range(0,50,5)))

Para conocer los métodos sobre tuplas, usa autocompletado y la función `help()`:

In [None]:
tupla = (1,2,3)
tupla.

Podemos iterar sobre una lista usando un bucle `for` o `while`:

In [None]:
for color in colores_parchis:
    print(color)

In [None]:
i = 0
while i < len(colores_parchis):
    print(colores_parchis[i])
    i += 1

Las tuplas se usan cuando una función debe devolver varios resultados:

In [None]:
cociente = 73 // 5
resto = 73 % 5
print(cociente, resto)

In [None]:
cociente_resto = divmod(73, 5)  # nombramos la tupla
print(type(cociente_resto))
print(cociente_resto)

In [None]:
cociente, resto = divmod(73, 5)  # unpacking: nombramos cada elemento de la tupla
print(type(cociente))
print(type(resto))
print(cociente, resto)

El _unpacking_ permite desempaquetar una tupla en sus componentes individuales:

In [None]:
evento = (29, "junio", "16:30", "clase de Samsung")
print(evento[0], evento[1], evento[2], evento[3])

dia, mes, hora, que = evento # unpacking
print(dia, mes, hora, que)