# 5. CICLOS Y LISTAS

### RESUMEN:

Como ya hemos visto las listas nos permiten representar en memoria colecciones de datos. Aunque lo más usual es que los elementos de las listas sean todos del mismo tipo, Python no pone restricciones sobre esto por lo que podemos tener listas con elementos de diferentes tipos.

Los elementos de las listas pueden ser accedidos a través de su posición. De modo que si el valor de la variable `L` es una lista entonces `L[expresion]` siendo el valor de _expresion_ un entero entre `0` y la longitud de la lista - 1 de `L` (es decir _len(L)-1_) nos daría el elemnto en dicha posición. Es responsabilidad del programador garantizar que el código siempre se refiera a posiciones correctas.

Las listas son mutables, se puede modificar el valor de una componente de la lista, `L[i] = expresion` cambiará el valor de la componente en la posición `i `de la lista `L`

Las listas se trabajan por **referencia**, esto quiere decir que si una variable que sea una lista `L` se asigna como valor a otra variable lista `L1`

`L1 = L`

ambas variables `L` y `L1` referirán a la misma lista, cualquier modificación que se haga a una componente de `L` se reflejará en `L1` y viceversa

Si lo que se pretende es tener una lista que sea una copia de L se puede hacer

`una_copia = [x for x in L]` en este caso se ha creado como valor de `una_copia` una lista con los mismos valores de `L`, es decir que `L==una_copia` sería `True` porque Python hace la comparación componente a componente. Pero **NO son la misma lista**, una modoificación a través de una de las variables no se reflejará en las componentes de la otra

Las listas y los ciclos for están estrechamente relacionados los elementos de una lista pueden ser recorridos de manera simple de la forma

**for** x **in** L:

    _procesar x_

o posicionalmente

**for** k **in** **range**(len(L)):

   __procesar L[k]__

Esta naturaleza posicional ordenada de `0` a `len(L)-1` de las listas las hace muy aplicables en muchos problemas de procesamiento de datos

### 5.1 Creación de una lista con valores aleatorios

El siguiente código nos permite crear una lista de _n_ elementos con valores enteros generados aleatoriamente entre _inf_ y _sup_ Pruebe a ejecutar este código cambiando estos valores. Este ejemplo nos será útil para ilustrar varios casos de trabajo con listas. Python no pone restricciones en el valor _n_ (tamaño de las listas) que solo estará limitado por la capacidad de memoria en el momento en que se ejecute el código.

Si queremos ilustrar un ejemplo en el que la lista pueda tener valores repetidos basta con dar un intervalo _inf_ _sup_ de longitud menor que _n_ entonces para poder llenar la lista Python tendrá que repetir elementos

In [2]:
import random
n = 20
inf = -2
sup = 30
enteros = [random.randint(inf, sup) for _ in range(n)]
print(f'Una lista de {n} de enteros entre {inf} y {sup} \n {enteros}')
#cambiamos valor de inf y sup para que haya repetidos
#como (inf+sup//2) - inf < n habrá elementos repetidos
conrepetidos = [random.randint(inf, inf+n//2) for _ in range(n)]
print(f'Una lista de {n} de enteros entre {inf} y {inf+sup//2} \n {conrepetidos}')

Una lista de 20 de enteros entre -2 y 30 
 [27, -2, 8, 1, 14, 3, 4, 21, -2, 27, -1, 24, 25, 6, 15, 14, 22, 26, 3, 16]
Una lista de 20 de enteros entre -2 y 13 
 [7, 8, 2, 4, 4, 6, 7, 5, -1, 2, 7, 4, 3, 5, 7, -2, 5, 6, -2, 2]


### 5.2 Buscar un valor en una lista

Una operación frecuente con listas es **buscar** un valor en una lista. El siguiente código busca un valor en una lista y nos da la posición del primero que se encontró. Cuando no lo encuentra dará el valor -1 ya que no coincide con ninguna posición

#### 5.2.1 Buscar secuencialmente en una lista

In [None]:
import random
import time
# n = 20 #tamaño que le queremos dar a la lista
n = 1000_000
# n = 2_000_000
inf = -50 #menor valor de los valores que queremos generar
sup = 50 #mayor valor de los valores que queremos generar
# aBuscar = 30 #valor que queremos buscar
aBuscar = 5555 #Para probar con un valor que no esté en la lista
enteros = [random.randint(inf, sup) for _ in range(n)]
# print(enteros) #No imprima la lista cuando esté probando con tamaños grandes
inicio = time.time()
pos = -1 #si no está se dirá que está en la posición -1
for k in range(n):
    if enteros[k] == aBuscar:
        pos = k
        break
t = time.time() - inicio
if pos == -1:
    print(f' El valor {aBuscar} NO está en la lista')
else:
    print(f' El valor {aBuscar} está en la posición {pos} lista')
print(f'La búsqueda a demorado {t} segundos')
#cambie el valor a buscar para probar un caso en que no esté en la lista
#cambie el valor de n por 1_000_000 y pruebe el tiempo

Note que en el caso peor cuando el valor buscado no esté en la lista, el ciclo recorre todos los elementos de la lista. El tiempo que demorará es proporcional a `n` (longitud de la lista). El siguiente código nos muestra la medición de este tiempo. Cambie el valor de` `n y de un valor _a buscar_ que no esté en la lista hasta poder apreciar este tiempo. El tiempo será proporcional a `n`.

Por lo general el tiempo de procesamiento de una lista de _n_ elementos dependerá del valor de _n_ porque podemos tener que hacer _n_ iteraciones. Se dice que es **linealmente proporcional a n** . Esto se denota por _O(n)_

Pruebe cambiando el tamaño de la lista y el valor a buscar, duplique el tamaño de la lista. Pruebe con tamaño 1_000_000 y con 2_000_000 para que observe que demora el doble

### 5.2.2 Búsqueda binaria en una lista ordenada

Podemos mejorar el tiempo de búsqueda en la lista si los valores en la lista estuviesen ordenados.

Para ordenar los valores de una lista Python ofrece una función `sort`

Esta función sort deja los elementos ordenados sobre la propia lista. Note al ejecutar el código a continuación que después de aplicar `sort` a `lista1` entonces `lista2 `también queda ordenada porque ambas son la misma lista pero `copia` no se ha ordenado porque, aunque iguales, originalmente no era la misma lista que `lista1` y `lista2`

In [None]:
print("Lista1 Original")
lista1 = [30, -5, 40, 10, -10, 30, -5]
lista2 = lista1
print(lista1)
print("lista2 es la misma que lista1 Original")
print(lista2)
print("Haciendo copia ...")
copia = [x for x in lista1]
print("copia")
print(copia)
print("Ordenando lista1...")
lista1.sort()
print("lista1")
print(lista1)
print("lista2")
print(lista2)
print("La copia no se ha afectado")
print("copia")
print(copia)

La búsqueda en una lista se puede mejorar si aprovechamos que la lista estuviese ordenada. El siguiente código aplica la búsqueda secuencial en una lista y suponiendo que la lista está ordenada aplica un método de búsqueda que se conoce como **búsqueda binaria**.

La búsqueda binaria consiste buscar solo en tramos de la lista que estarán indicados por las posiciones `izquierdo` y `derecho`. Originalmente nos ubicamos en la posición intermedia de la lista, para ello usamos una variable `pos`. Si el valor a buscar es igual al valor que está en esta posición es que lo hemos encontrado, si es menor que el que está en la posición `pos` entonces en la proxima iteración solo hay que buscar en el tramo a la izquierda de `pos` es decir en el tramo (`izquierdo`, `pos-1`) y si es mayor entonces solo hay que buscar en el tramo a la derecha de `pos`, es decir en el tramo (`pos+1`, `derecho`)

In [None]:
import random
import time
# n = 1_000_000 #empezar con longitud 1000 y cambiar a 1000000
n = 2_000_000 #cambiar a 1 millón
# n = 20
print(f'Creando lista de {n} elementos ...')
lista = [random.randint(-1, 10) for _ in range(n)]

##PROBAR CON ESTOS VALORES A BUSCAR
aBuscar = 5 #Probar con este valor para que pueda estar
# aBuscar = 100 #Probar con este valor para asegurar que no esté

# BUSCAR SECUENCIAL EN LA LISTA
# print(lista) #No imprimir cuando la lista es grande
print(f'\nBusqueda SECUENCIAL de {aBuscar} en lista NO ORDENADA de {n} elementos ...')
inicio = time.time()
encontrado = False
for k in range(n):
    if lista[k] == aBuscar:
        encontrado = True
        break
t = time.time() - inicio
if encontrado:
    print(f'El valor {aBuscar} está en la posicion {k} es {lista[k]}')
else:
    print(f'El valor {aBuscar} NO ESTÁ EN LA LISTA!!')
print(f'Tiempo de búsqueda fue de {t:8f} segs')

#ORDENAR LA LISTA
print()
print("Ordenando lista...")
lista.sort()
# print(lista) #No imprimir cuando la lsita es grande
inicio = time.time()
print(f'\nBusqueda SECUENCIAL de {aBuscar} en lista ORDENADA de {n} elementos ...')
encontrado = False
for k in range(n):
    if lista[k] == aBuscar:
        pos = k
        encontrado = True
        break
t = time.time() - inicio
if encontrado:
    print(f'El valor {aBuscar} está en la posicion {k} es {lista[k]}')
else:
    print(f'El valor {aBuscar} NO ESTÁ EN LA LISTA!!')
print(f'Tiempo de búsqueda fue de {t:8f} segs')

print(f'\nBusqueda BINARIA de {aBuscar} en lista ORDENADA de {n} elementos...')
inicio = time.time()
izquierdo = 0
derecho = len(lista)-1
encontrado = False
while izquierdo <= derecho:
    medio = (izquierdo + derecho)//2
    if lista[medio] == aBuscar:
        break
    elif lista[medio] < aBuscar:
        izquierdo = medio + 1
    else:
        derecho = medio - 1
t = time.time() - inicio
if encontrado:
    print(f'El valor {aBuscar} está en la posicion {medio} es {lista[medio]}')
else:
    print(f'El valor {aBuscar} NO ESTÁ EN LA LISTA')
print(f'Tiempo de búsqueda binaria fue de {t:8f} segs')

#Aumentar el tamaño de la lista para apreciar la diferencia, OJO en tal caso no escribir las listas


**¿Por qué es menor el tiempo de búsqueda en el caso de búsqueda binaria?**

Porque si la lista es de tamaño _n_ en cada iteración se compara con el del medio y si no es igual al valor buscado se divide el tramo de búsqueda a la mitad. Entonces, en el caso peor de que el valor no esté la lista, ¿cuántas veces se puede ir dividiendo n a la mitad hasta que ya no se pueda dividir?

_n/2/2/2..../2 = 1_

es decir un valor _k_ tal _2**k_ sea igual a _1_

o sea _k_ es _logaritmo en base 2_ de _n_

que es un valor bastante menor que _n_ se dice entonces que en este  caso el tiempo de demora con respecto a la cantidad _n_ de datos es _logarítmico_ en lugar del tiempo _lineal_ de la búsqueda secuencial

Por ejemplo una búsqueda si la cantidad de datos es 1000 en lugar de demorar un tiempo proporcional a 1000 iteraciones demoraría un tiempo aproximadamente proporcional a 10 iteraciones ya que 2**10 es 1024

Más adelante veremos problemas donde el costo temporal de la solución puede ser mayor que lineal

**Buscar soluciones a los problemas que reduzcan el tiempo de respuesta según la cantidad n de datos es un aspecto importante de la Programación**

### 5.3 ORDENACIÓN

Como se ha visto en el caso anterior de búsqueda binaria tener ordenados los elementos de una lista puede ser conveniente.

Es frecuente que los datos estén ordenados porque eso ayuda a la visualización de los mismos (piense por ejemplo en mediciones numéricas o nombres de personas). Incluso puede ser que según la forma en que fueron obtenidos los datos estos ya hayan estuviesen ordenados cuando se recogieron.

Para poder ordenar los elementos de una lista es necesario que las operaciones de comparación <, <=, > ... etc puedan aplicarse a los mismos

Como mencionamos anteriormente Python tiene de modo predefinido dos funciones para ordenar listas

`lista.sort() `ordena los elementos sobre la propia `lista`

`sorted(lista)` que crea una nueva lista con los valores ordenados

ejecute el código a continuación para que aprecie la diferencia

In [None]:
lista1 = [10, 4, 12, 15, -2, 4]
lista2 = lista1 #lista1 y lista2 son la misma lista
lista3 = lista1.copy() #crea una copia
print(f' lista1 {lista1}')
print(f' lista2 {lista2}')
print(f' lista3 {lista3}')
if lista1 == lista2 == lista3:
    print(f'lista1, lista2 y lista3 son iguales')
else:
    print(f'lista1, lista2 y lista3 son diferentes')
print("\nOrdenando lista2")
lista2.sort()
print(f'lista1 {lista1}')
print(f'lista2 {lista2}')
print(f'lista3 {lista3}')
if lista1 == lista2:
    print(f'lista1 y lista2 han quedado iguales')
    print(f'la ordenación quedó sobre la misma lista1 {lista1}')
if lista2 == lista3:
    print(f'lista2 y lista3 han quedado iguales')
else:
    print(f'lista2 y lista3 pero no modificó la lista3')


#### 5.3.1 Ordenación por mínimos sucesivos

Para ordenar los elementos dejándolos en la misma lista. Tenemos un ciclo mas externo. En este ciclo externo la variable de control `i `va de `0` a la `len(lista)-`1 por cada iteración de ese ciclo externo se hace otro ciclo donde la variable de control `j` comienza en la posición `i+1` y recorre hasta el final de la lista para dejar en la variable `pos_min` la posicion de donde está el menor. Entonces antes de empezar una nueva iteración del ciclo mas externo intercambia ese menor que está en la posición `pos_mi`n con el valor que está en la posición `i`, luego comienza otra iteración del ciclo externo (la `i `se habrá incrementado en `1`) y empieza de nuevo el ciclo más interno para buscar el menor a partir del nuevo valor `i`. Cuando la `i` alcance su valor final (posición final de la lista) se habrá quedado en esa posición `i `el valor mayor de todos y la lista quedará ordenada.

In [None]:
lista = ["María", "Juan", "Mario", "Pedro", "María","Ada", "Adalberto"]
print("Lista original:")
print(lista)
n = len(lista)
for i in range(n):
    # Encontrar el índice del mínimo elemento del tramo entre i y n-1
    # que es la parte no ordenada
    pos_min = i
    for j in range(i + 1, n):
        if lista[j] < lista[pos_min]:
                pos_min = j
        # Intercambiar el mínimo encontrado con el primer elemento no ordenado
    #después de terminado este recorrido ha quedado en pos_min la posición donde está el menor de ese tramo, lo intercambiamos con el de la posición i
    lista[i], lista[pos_min] = lista[pos_min], lista[i]
print("Ordenados:")
print(lista)

#Pruebe poniendo en la lista valores string y enteros
#Pruebe poniendo en la lista valores enteros y float
#¿Qué usted cree que pasa si probamos ordenar esta lista [3, True, -1, 0.01, False]


#### 5.3.2 Comparación de costos menor que lineal, lineal y mayor que lineal

Cómo se puede apreciar en el código a continuación, buscar secuencialmente en una lista demora menos que ordenar la lista usando la función sort de Python que a su vez demora menos que ordenar como lo implementamos en el código de ordenación **por mínimos sucesivos**

In [None]:
import random
import time
# n = 10_000
n = 20_000 #Probar con el doble de tamaño del anterior
lista = [random.randint(0, 10000) for _ in range(n)]
copia = lista.copy()
aBuscar = 55555 #Un valor que puede no esté en la lista

#BUSCAR SECUENCIAL EN LA LISTA
print()
print("Buscando secuencial ...")
inicio = time.time()
encontrado = False
for k in range(n):
    if lista[k] == aBuscar:
        encontrado = True
        break
t = time.time() - inicio
print(f'Tiempo de búsqueda secuencial fue de {t:8f} segs')

#Ordenar con Python y hacer búsqueda binaria
print()
print("Ordenando con Python y haciendo búsqueda binaria...")
inicio = time.time()
lista.sort()
t = time.time() - inicio
print(f'Tiempo de ordenar (sort) de Python {t:8f} segs')

inicio = time.time()
izquierdo = 0
derecho = len(enteros)-1
encontrado = False
while izquierdo <= derecho:
    pos = (izquierdo + derecho) //2
    if enteros[pos] == aBuscar:
        encontrado = True
        break
    elif aBuscar < enteros[pos]:
        derecho = pos - 1
    else:
        izquierdo = pos + 1
t = time.time() - inicio
print(f'Tiempo de búsqueda binaria {t:8f} segs')

#Ordenar copia por mínimos sucesivos
print()
print("Ordenando por mínimos sucesivos y haciendo búsqueda binaria...")
inicio = time.time()
n = len(copia)
for i in range(n):
    # Encontrar el índice del mínimo elemento del tramo entre i y n-1
    # que es la parte no ordenada
    pos_min = i
    for j in range(i + 1, n):
        if copia[j] < copia[pos_min]:
            pos_min = j
    copia[i], copia[pos_min] = copia[pos_min], copia[i]
t = time.time() - inicio
print(f'Tiempo de ordenación por mínimos sucesivos {t:8f} segs')

inicio = time.time()
izquierdo = 0
derecho = len(enteros)-1
encontrado = False
while izquierdo <= derecho:
    pos = (izquierdo + derecho) //2
    if enteros[pos] == aBuscar:
        encontrado = True
        break
    elif aBuscar < enteros[pos]:
        derecho = pos - 1
    else:
        izquierdo = pos + 1
t = time.time() - inicio
print(f'Tiempo de búsqueda binaria {t:8f} segs')

print(f'lista y copia ordenados son iguales {lista == copia}')




## EJERCICIOS

1. Estudie y pruebe el código de ordenación por mínimos sucesivos (que será estudiado en más detalle en la Conf 6)
2. Sin usar las funciones `sort` ni `sorted` de Python ordene una lista de cadenas (string) pero por la longitud las mismas no por el ordel alfabético
3. Modifique el código de la búsqueda binaria para que diga cuántas iteraciones hicieron falta para encontrar un valor o para saber que el valor no está en la lista
4. La sucesión de Fibonacci es una sucesión de números enteros en la que los dos primeros elementos son 1 y 1 y luego el elemento en una posición `n` es la suma de los dos elementos de las posiciones anteriores. Es decir la sucesión es

     1, 1, 2, 3, 5, 8, 13, 21, ....
   Escriba un código que dado un valor entero `n` cree la lista con los `n` primeros elementos de la suceción de Fibonacci
5. Dadas dos listas `l1` y `l2` de valores de un mismo tipo verifique si los valores de `l1` están incluídos en `l2`
6. Dadas dos listas `l1` y `l2` construya una lista **interseccion** formada solo por los elementos comunes que están en ambas listas
7. Dadas dos listas `l1` y `l2` construya una lista **union** con todos los elementos que están en `l1` y `l2`
8. Diferencia, dadas dos listas `l1` y `l2` construya una lista **diferencia** con los elementos de `l1` que no están en `l2`
9. Dada una lista `l` y una lista `booleanos` formada solo por valores `True` o `False` construya una lista `resultado` solo con aquellos valores de `l` que corresponden con las posiciones que son `True` en la lista `booleanos` Por ejemplo si `l` es la lista `[20, 10, 5, 30]` y `booleanos` es la lista [`True, True, False, True]` la respuesta debe ser la lista `[20, 10, 30]`

