---
# Experto Big Data UNAV 2018 - Notebook 3 - Mas Listas y tuplas
---

# Listas

En el notebook anterior vimos que una lista es una coleccion de valores que se almacena en una variable. Los valores deberian estar relacionados entre si de alguna manera aunque no hay restricciones de lo que se puede almacenar en una lista. La lista se designa poniendo elementos entre corchetes y separados por coma.

In [1]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

Ahora vamos a ver que operaciones se pueden realizar con las listas.

# Operaciones comunes en listas

La listas son estructuras que llevan funciones y metodos asociados que nos permitiran realizar operaciones sobre ellas.

### Modificar elementos en una lista

Se puede cambiar el valor de cualquiera de los elementos en la lista si sabes la posicion del elemento.

In [3]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

nombres[0] = 'Pedro'
print(nombres)

['Pedro', 'Ana', 'Luis', 'Maria']


### Encontrar elementos en una lista

Si quieres encontrar la posicion de un elemento en una lista, puedes usar el metodo *index()*.

In [4]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

print(nombres.index('Luis'))

2


El metodo *index()* devuelve la posicion en la que se encuentra el elemento buscado. Si el elemento existe mas de una vez devuelve el primer elemento con el indice mas bajo. Si el elemento no existe, Python produce un error.

In [5]:
print(nombres.index('Manuel')) # esto produce un error porque no encuentra elemento

ValueError: 'Manuel' is not in list

### Chequear si un elemento esta en una lista

Se puede testear si un elemento esta en una lista usando el comando *in*. 

In [6]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

print('Juan' in nombres)
print('Manuel' in nombres)

True
False


### Anadiendo elementos a una lista

#### Anadiendo elementos al final de la lista
Se pueden anadir elementos a una lista usando el metodo *insert()*. Este metodo anade un nuevo elemento en la posicion que le indiquemos.

In [12]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']
nombres.append('Manuel')

for nombre in nombres:
    print(nombre + ' es mi amigo/a.')

#Los siguiente no es eficiente computacionalmente aunque se puede ejecutar
nombres += ['Pedrito']
print (nombres)

Juan es mi amigo/a.
Ana es mi amigo/a.
Luis es mi amigo/a.
Maria es mi amigo/a.
Manuel es mi amigo/a.
['Juan', 'Ana', 'Luis', 'Maria', 'Manuel', 'Pedrito']


#### Insertando elementos en una posicion concreta  

Se pueden insertar elementos a una lista en una posicion concreta usando el metodo *insert()*. Este metodo anade el nuevo elemento en el 


In [14]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']
nombres.insert(1, 'Manuel')
print(nombres.index('Luis'))
#Insert añade
for nombre in nombres:
    print(nombre + ' es mi amigo/a.')
    

print(nombres.index('Manuel'))
print(nombres.index('Luis'))


3
Juan es mi amigo/a.
Manuel es mi amigo/a.
Ana es mi amigo/a.
Luis es mi amigo/a.
Maria es mi amigo/a.
1
3


### La lista vacia

Ahora que sabemos cómo anadir elementos a una lista después de crearla, podemos usar las listas de forma más dinámica.  Un enfoque común con las listas es definir una lista vacía y luego dejar el programa agregue elementos a la lista según sea necesario. Este enfoque funciona, por ejemplo, cuando se comienza a construir un sitio web interactivo. La lista de usuarios podría comenzar vacía y luego, a medida que las personas se registran, hacerla crecer. Esta es una visión simplificada de cómo funcionan realmente los sitios web. Aquí hay un breve ejemplo de cómo comenzar con una lista vacía, comenzar a llenarla y trabajar con los elementos de la lista. Lo único nuevo aquí es la forma en que definimos una lista vacía, que es solo un conjunto vacío de corchetes.

In [10]:
# Creamos la lista vacia.
users = []

# Agregamos usuarios
users.append('juan')
users.append('ivan')
users.append('luisa')

# Saludamos a los usuarios
for user in users:
    print("Bienvenido/a, " + user.title() + '!')

Bienvenido/a, Juan!
Bienvenido/a, Ivan!
Bienvenido/a, Luisa!


Si no cambiamos el orden en nuestra lista, podemos usar la lista para descubrir quiénes son nuestros usuarios más antiguos y más nuevos.

In [15]:
# Creamos la lista vacia.
users = []

# Agregamos usuarios
users.append('juan')
users.append('ivan')
users.append('luisa')

# Saludamos a los usuarios
for user in users:
    print("Bienvenido/a, " + user.title() + '!')

# Reconoce el primer y ultimo usuario
print("\nFuiste el primer usuario, " + users[0].title() + '!')
print("Bienvenido eres el usuario mas reciente, " + users[-1].title() + '!')

Bienvenido/a, Juan!
Bienvenido/a, Ivan!
Bienvenido/a, Luisa!

Fuiste el primer usuario, Juan!
Bienvenido eres el usuario mas reciente, Luisa!


Ten en cuenta que el código que da la bienvenida a nuestro usuario más nuevo siempre funcionará, porque hemos utilizado el índice -1. Si hubiéramos utilizado el índice 2, siempre obtendríamos el tercer usuario, incluso si nuestra lista de usuarios creciera y creciera.

### Ordenando una lista  

Podemos ordenar una lista de forma alfabetica. El metodo *sort()* ordena la lista.

In [18]:
pacientes = ['pepa', 'maria', 'juana']

# ordena la lista alfabeticamente
pacientes.sort()

# Muestra pacientes 
print("Nuestros pacientes ordenados alfabeticamente.")
for paciente in pacientes:
    print(paciente.title())

# Ordenalos de forma alfabetiza empezando desde el final
pacientes.sort(reverse=True)

# Muestra pacientes
print("Ahora los pacientes se ordenaron de forma alfabetica invertida.")
for paciente in pacientes:
    print(paciente.title())

Nuestros pacientes ordenados alfabeticamente.
Juana
Maria
Pepa
Ahora los pacientes se ordenaron de forma alfabetica invertida.
Pepa
Maria
Juana


**sorted() vs sort()**

Siempre que quieras clasificar una lista, ten en cuenta que no puedes recuperar el orden original. Si deseas visualizar una lista en ordenada, pero conservar el orden original, puedes usar la función *sorted()*. La función *sorted()* también acepta el argumento opcional *reverse = True*

In [19]:
pacientes = ['maria', 'pepa', 'juana']

# Muestra pacientes ordenado alfabeticamente
print("Nuestros pacientes ordenados alfabeticamente.")
for paciente in sorted(pacientes):
    print(paciente.title())

# Muestra pacientes ordenado reverso alfabeticamente
print("Ahora los pacientes se ordenaron de forma alfabetica invertida.")
for paciente in sorted(pacientes, reverse=True):
    print(paciente.title())
    
# Muestra pacientes lista original
print("Ahora los pacientes en el orden original.")
for paciente in pacientes:
    print(paciente.title())

Nuestros pacientes ordenados alfabeticamente.
Juana
Maria
Pepa
Ahora los pacientes se ordenaron de forma alfabetica invertida.
Pepa
Maria
Juana
Ahora los pacientes en el orden original.
Maria
Pepa
Juana


### Invirtiendo una lista


Hemos visto tres posibles formas de ordenar una lista:
- El orden original en el que se creó la lista
- Orden alfabetico
- Invertir orden alfabético

Hay una función más que podemos usar, y eso es la inversion del orden original de la lista. La función *reverse()* nos da este orden.

In [21]:
pacientes = ['maria', 'pepa', 'juana']

print(pacientes.reverse()) #Modifica la variable, pero no imprime, da error.
print (pacientes)

None
['juana', 'pepa', 'maria']


**NOTA:** La inversion de una lista es permanente, aunque se puede realizar seguido otra llamado a *reverse()* para volver a obtener la lista original.

### Ordenando listas numericas

Por supuesto las funciones y metodos mencionados anteriormente tambien funcionan en listas numericas.

In [24]:
enteros = [1, 3, 4, 2]
print('original')
print(enteros)

# sort() ordena creciente.
enteros.sort()
print('sort()')
print(enteros)

# sort(reverse=True) ordena decreciente.
enteros.sort(reverse=True)
print('sort(reverse=True)')
print(enteros)

enteros = [1, 3, 4, 2]

# sorted() guarda orden original
print('sorted()')
print(sorted(enteros))
print('original')
print(enteros)

# reverse() tambien funciona en listas numericas
enteros.reverse()
print('reverse()')
print(enteros)



original
[1, 3, 4, 2]
sort()
[1, 2, 3, 4]
sort(reverse=True)
[4, 3, 2, 1]
sorted()
[1, 2, 3, 4]
original
[1, 3, 4, 2]
reverse()
[2, 4, 3, 1]
[-131.23, 33213, 4454, 566, -33, 465, -377.312, 5.6656]
[-377.312, -131.23, -33, 5.6656, 465, 566, 4454, 33213]


In [25]:
mixed = [-131.23, 33213, 4454, 566, -33, 465, -377.312, 5.6656]
print (mixed)
print (sorted(mixed, key = float))

[-131.23, 33213, 4454, 566, -33, 465, -377.312, 5.6656]
[-377.312, -131.23, -33, 5.6656, 465, 566, 4454, 33213]


### Longitud de una lista

La funcion *len()* nos permite calcular la longitud de una lista. Hay muchas situaciones en las que es posible que quieras saber cuántos elementos tiene una lista. Si tienes una lista que almacena a tus usuarios, puedes encontrar su longitud en cualquier momento y saber cuántos usuarios tenemos.

In [None]:
# Creamos la lista vacia.
users = []

# Agregamos usuarios
users.append('juan')

user_count = len(users)
print("Tenemos " + str(user_count) + " usuarios!")

users.append('ivan')
users.append('luisa')

user_count = len(users)
print("Tenemos " + str(user_count) + " usuarios!")

**NOTA:** La función *len()* devuelve un entero, al que hay que realizar el casting a *str* si queremos imprimirlo. 

### Eliminando elementos de una lista

A estas alturas ya te habras dado cuenta de que las listas son una estructura dinámica. Podemos definir una lista vacía y luego llenarla a medida que ingrese información en nuestro programa. Para ser realmente dinámico, necesitamos formas de eliminar elementos de una lista cuando ya no los necesitemos. Esta operación se puede realizar a través de su posición o a través de su valor.

#### Eliminando elementos por posición

Si sabes la posición de un elemento en una lista, puedes eliminar ese elemento con el comando *del *. Utiliza el comando *del * y el nombre de la lista, con el índice del elemento que deseas eliminar entre corchetes:

In [None]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']
# elimina el elemento en la posicion 2 (Luis)
del nombres[2]

print(nombres)

#### Eliminando elementos por valor

También puedes eliminar un elemento de una lista si conoces su valor. Para hacer esto, utilizamos el método *remove()*. Indica el nombre de la lista, seguido del elemento a eliminar. Python busca en la lista, encuentra el primer elemento con este valor y lo elimina. Si el elemento no existe Python genera un error.

In [None]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']
# elimina el elemento en la posicion 2 (Luis)
nombres.remove('Ana')

print(nombres)

**NOTA:** El borrado solo elimina una instancia del elemento en la lista quedando otros elementos en la lista con el mismo valor despues de eliminar.

In [None]:
letras = ['a', 'b', 'c', 'a', 'b', 'c']
# remueve a de la lista
letras.remove('a')

print(letras) # todavia quedan aes, solo borramos una

Hay un concepto en programación llamado "popping" de elementos de una lista. Cada lenguaje de programación tiene algún tipo de estructura de datos similar a las listas de Python. Estas estructuras se pueden usar como colas, y hay varias formas de procesar los elementos en una cola.
Un enfoque simple es comenzar con una lista vacía y luego agregar elementos a esa lista. Cuando quieras trabajar con los elementos de la lista, siempre toma el último elemento de la lista, haz algo con él y luego elimina ese elemento. El método *pop()* lo hace sencillo. Elimina el último elemento de la lista y nos lo facilita para que podamos trabajar con él.

In [None]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

ultimo_nombre = nombres.pop()

print(ultimo_nombre)
print(nombres)

En realidad, se puede extraer cualquier elemento que se desee de una lista, dando el índice del elemento que se desea extraer.

In [None]:
nombres = ['Juan', 'Ana', 'Luis', 'Maria']

primer_nombre = nombres.pop(0)

print(primer_nombre)
print(nombres)

# *Slicing* (corte) de una lista   

Ya hemos visto como una lista es una colección de elementos. Ahora vamos a ver como podemos obtener cualquier subconjunto de esos elementos. Por ejemplo, si queremos obtener solo los primeros tres elementos de la lista  los tres elementos en el medio de la lista, o los últimos tres elementos, o cualquier elemento x de cualquier parte de la lista. Estos subconjuntos de una lista se llaman cortes.  

Para obtener un subconjunto de una lista, indicamos la posición del primer elemento que queremos y la posición del primer elemento que no queremos incluir en el subconjunto. Por lo tanto, el cort *lista[0:3]* devolverá una lista que contiene los elementos 0, 1 y 2, pero no el elemento 3.

In [None]:
usuarios = ['Juan', 'Ana', 'Luis', 'Maria']

# Recoge los primeros 3 usuarios de la lista.
primeros_users = usuarios[0:3]

for user in primeros_users:
    print(user.title())

Si quieres obtener todo hasta una determinada posición en la lista, debes dejar el primer índice en blanco.

In [None]:
print(usuarios[:3]) # obtiene los tres primeros elementos de la lista

Cuando se secciona una lista, la lista original no se ve afectada.

In [None]:
usuarios = ['Juan', 'Ana', 'Luis', 'Maria', 'Pepe']

# Recoge los primeros 3 usuarios de la lista.
primeros_users = usuarios[0:3]

# la lista original no cambia
for user in usuarios:
    print(user.title())

Podemos obtener cualquier corte de una lista que deseemos, utilizando el método de *slicing*.

In [11]:
usuarios = ['Juan', 'Ana', 'Luis', 'Maria', 'Pepe']

# Recoge usuarios del indice 1 al 3
primeros_users = usuarios[1:3]

for user in primeros_users:
    print(user.title())

Ana
Luis


Para obtener todos los elementos de una posición en la lista hasta el final de la lista, podemos dejar fuera el segundo índice.

In [None]:
usuarios = ['Juan', 'Ana', 'Luis', 'Maria', 'Pepe']

# Recoge todos los usuarios desde el indice 2 en adelante
primeros_users = usuarios[2:]

for user in primeros_users:
    print(user.title())

De igual forma se puede utilizar el indexado con índice negativo para delimitar el corte y podemos indicar hasta que elemento queremos acceder.

In [None]:
usuarios = ['Juan', 'Ana', 'Luis', 'Maria', 'Pepe']

# Recoge todos los usuarios desde hasta el ultimo elemento
primeros_users = usuarios[:-1]

for user in primeros_users:
    print(user.title())

### Cortes extendidos
Python entiende una forma extendida de los cortes. Esta forma acepta tres valores separados por el caracter ((:)). El tercer valor equivale al tercer parametro de la funcion range: indica el incremento del indice en cada iteracion. Por ejemplo, si c contiene la cadena 'Ejemplo', el corte c[0:len(c):2] selecciona los caracteres de indice par, o sea, devuelve la cadena 'Eepo'. El tercer valor puede ser negativo. Ello permite invertir una cadena con una expresion muy sencilla: c[::-1]. Haz la prueba.

In [None]:
lista = [1, 2, 3, 4, 5, 6]
print(lista[0:5:2])
print(lista[::])
print(lista[::-1])

In [None]:
cadena = 'hola'
print(cadena[0:3:2])
print(cadena[::-1])

# Copiando una lista

El copiado de listas funciona de una manera peculiar aunque habitual en programación. Python realiza un copiado por referencia de las listas de forma que no copiamos los valores de la lista sino la dirección de memoria en la que empieza. A esto se le llama copiado suave (*soft*) de una variable. Esto es interesante porque si tenemos una lista muy grande asi evitamos duplicar la información y llenar la memoria del ordenador. La consecuencia de todo esto es que si modificamos una de las variables, estaremos modificando en realidad la lista original. Veamos un ejemplo.

In [None]:
lista1 = [7, 0, 2, 5]
lista2 = lista1 # aqui realmente copiamos la direccion de memoria de lista1
print('Lista1',lista1)
lista2[0] = 99 # si modificamos lista2 tambien se ve modificada lista1
print('Lista1',lista1)
print('Lista2',lista2)

Existe sin embargo una forma de realizar un copiado profundo (*deep*) de una lista en otra y es utilizando el operador de indexación de la siguenten forma: *[:]*

In [None]:
lista1 = [7, 0, 2, 5]
lista2 = lista1[:] # aqui realmente copiamos los valores
print('Lista1',lista1)
lista2[0] = 99 # si modificamos lista2 la lista1 sigue intacta
print('Lista1',lista1)
print('Lista2',lista2)

del lista2[-1] # eliminamos el ultimo elemento de lista2
print('Lista1',lista1) # lista1 sigue intacta
print('Lista2',lista2) # lista2 se actualice

#### En realidad cualquier operación de indexación produce como resultado una *deep* copy de los valores de la lista.

# Listas numericas

Ya hemos visto las listas pueden contener cualquier tipo entre ellos números. Hay algunas funciones que se pueden usar para hacer que trabajar con listas numéricas sea más eficiente. Hagamos una lista de los primeros diez números y comencemos a trabajar con ella para ver cómo podemos usar los números en una lista.

In [None]:
# primeros 10 numeros
l_num = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

for num in l_num:
    print(num)

La funccion *range()*
---

Esto funciona, aunque no es muy eficiente si queremos trabajar con un gran conjunto de números. La función *range()* nos ayuda a generar largas listas de números. Aquí hay un ejemplo de como hacer generar la lista de los primeros 10 números, usando la función *range()*.

In [None]:
# lista 10 primeros numeros
print(range(1,10))

Por defecto *range* generar números consecutivos en orden creciente aunque también se le puede indicar un paso en la generación. Por defecto el paso es 1.

In [23]:
print range(0,100,5) # el paso es 5.

Se puede crear una lista en orden decreciente poniendo un paso negativo-5.

In [None]:
print range(100,5,-5) # el paso es 5

Se suele utilizar en bucles for-in para recorrer secuencias.

In [None]:
for num in range(0,5):
    print(num)

Esto es increíblemente poderoso. Ahora podemos crear una lista de varios millones de números tan fácil como creamos una lista de los primeros diez números. En realidad no tiene sentido imprimir el millón de números aquí, pero podemos mostrar que la lista realmente tiene un millón de elementos, y podemos imprimir los últimos elementos para mostrar que la lista es correcta.

In [None]:
# guarda el primer millon de numeros
numeros = list(range(1,1000001))

# muestra la longitud de la lista
print("La lista de numeros tiene: " + str(len(numeros)) + " numeros en ella.")

# muestra los ultimos numeros
print("Los ultimos numeros son:")
for numero in numeros[-5:]:
    print(numero)

Aquí hay un par de cosas que merece recordar. La expresión

    str (len (números))
    
toma la longitud de la lista de números y la convierte en una cadena para que se pueda imprimir.
La expresión 

    números [-5:]

nos da una parte de la lista. El índice -1 es el último elemento en la lista, y el índice -5 es el elemento cinco lugares desde el final de la lista. Entonces, el corte [-5:] nos da todo, desde ese elemento hasta el final de la lista.

Las funciones *min()*, *max()*, y *sum()*
---
Hay tres funciones que se usan habitualmente con listas numéricas. La función *min()* devuelve el número más pequeño de la lista, la función *max()* devuelve el número más grande de la lista y la función *sum()* devuelve la suma de todos los números la lista.

In [None]:
edades = [23, 16, 14, 28, 19, 11, 38]

joven = min(edades)
viejo = max(edades)
suma_edades = sum(edades)

print("El más joven tiene: " + str(joven) +  " años.")
print("El más mayor tiene: " + str(viejo) + " años.")
print("La suma de edades de todos es: " + str(suma_edades) + " años.")

# Comprensión de listas (list comprehension)

Si eres nuevo en programación, las comprensiones de la lista pueden parecer confusas al principio. Son una forma abreviada de crear y trabajar con listas. Es bueno estar al tanto de las listas de comprensión, porque las verás en el código de otros programadores, y son realmente útiles cuando entiende cómo usarlas. Por ahora, es suficiente saber que existen y reconocerlas cuando las veas.  

Vemos como podemos crear una lista que contenga los cuadrados de los primeros 10 números de la forma que ya sabemos.

In [None]:
# almacena el cuadrado de los primeros 10 numeros en una lista
cuadrados = []

for numero in range(1,11):
    nuevo_cuadrado = numero**2
    cuadrados.append(nuevo_cuadrado)
    
# mostrar que la lista es correct
print(cuadrados)

A estas alturas, esto debería tener sentido. Si no es así, repasa el código con estos pensamientos en mente:
- Creamos una lista vacía llamada *cuadrados* que contendrá los valores que nos interesan.
- Usando la función *range()*, comenzamos un _loop_ que recorrerá los números 1-10.
- Cada vez que pasamos por el _loop_, calculamos el cuadrado del número actual elevándolo a la segunda potencia.
- Agregamos este nuevo valor a nuestra lista *cuadrados*.
- Revisamos nuestra lista y la imprimimos.

Ahora hagamos este código más eficiente. Realmente no necesitamos almacenar el nuevo cuadrado en su propia variable *nuevo_cuadrado*; podemos simplemente agregarlo directamente a la lista de cuadrados. La línea

    nuevo_cuadrado = número ** 2

se saca, y la siguiente línea se ocupa de la operación.

In [None]:
# almacena el cuadrado de los primeros 10 numeros en una lista
cuadrados = []

for numero in range(1,11):
    cuadrados.append(numero**2)
    
# mostrar que la lista es correct
print(cuadrados)

Las comprensiones de listas nos permiten colapsar las primeras tres líneas de código en una línea de la siguiente forma.

In [None]:
cuadrados = [numero**2 for numero in range(1,11)]

# mostrar que la lista es correct
print(cuadrados)

Debería quedar bastante claro que este código es más eficiente que nuestro enfoque anterior, pero puede no estar claro lo que está sucediendo. Echemos un vistazo a todo lo que está sucediendo en esa primera línea:

Definimos una lista llamada *cuadrados*.

Mira la segunda parte de lo que está entre corchetes:

    for numero in range(1,11)

Esto crea un _loop_ que pasa por los números del 1 al 10, almacenando cada valor en la variable *numero*. Ahora podemos ver qué ocurre con cada *numero* en el _loop_:

    numero**2

Cada número se eleva a la segunda potencia, y este es el valor que se almacena en la lista que definimos. Podríamos leer esta línea de la siguiente manera:

cuadrados = [eleva *numero* a la segunda potencia, for nuemro in range(1-10)]

### Más ejemplos

Una Comprensión de listas para calcular los primeros pares. Como puedes ver, en número de líneas se reduce y el código se simplifica.

In [None]:
pares = [numero*2 for numero in range(1,11)]

print(pares)

## Listas no númericas

También podemos usar comprensiones con listas no numéricas. En este caso, crearemos una lista inicial, y luego usaremos una comprensión para hacer una segunda lista de la primera. Aquí hay un ejemplo simple, sin usar comprensiones.

In [None]:
estudiantes = ['juan', 'ana', 'fran']

# transformelos en buenos estudiantes
buenos_estudiantes = []
for estudiante in estudiantes:
    buenos_estudiantes.append(estudiante.title() + " eres buen estudiante!")

# Saludemos a los estudiantes
for buen_estudiante in buenos_estudiantes:
    print("Hola, " + buen_estudiante)

Para usar una comprensión de listas en este código, debemos escribir algo como esto:  
    
    buenos_estudiantes = [agrega 'eres buen estudiante!' a cada estudiante, para cada estudiante en la lista de estudiantes]

In [None]:
estudiantes = ['juan', 'ana', 'fran']

# lista de comprension para transformarlos en buenos estudiantes
buenos_estudiantes = [estudiante.title() + " eres buen estudiante!" for estudiante in estudiantes]

# Saludemos a los estudiantes
for buen_estudiante in buenos_estudiantes:
    print("Hola, " + buen_estudiante)

*Slicing* cadenas
===

Ahora que nos hemos familiarizado bastante con las listas, podemos echar un vistazo a las cadenas. Recordad que una cadena es realmente una lista de caracteres, por lo que muchos de los conceptos que se trabajan con listas se pueden utilizar de la misma manera con cadenas.

In [None]:
mensaje = "Hola!"

for letra in mensaje:
    print(letra)

Podemos acceder a cualquier carácter en una cadena por su posición, del mismo modo que accedemos a los elementos individuales en una lista.

In [None]:
mensaje = "Hola!"

primer_char = mensaje[0]
ultimo_char = mensaje[-1]

print(primer_char, ultimo_char)

Podemos extender esto para realizar cortes en la cadena.

In [None]:
mensaje = "Hola Mundo!"

primeros_tres = mensaje[:3]
ultimos_tres = mensaje[-3:]

print(primeros_tres, ultimos_tres)

Encontrando subcadenas
---
Ahora que hemos visto qué significan los índices para las cadenas, podemos buscar *subcadenas*. Una subcadena es una serie de caracteres que aparecen en una cadena.

Usando la palabra clave *in* para averiguar si una subcadena particular aparece en una cadena.

In [None]:
mensaje = "Me gusta Pamplona."
pamplona_esta = 'Pamplona' in mensaje
print(pamplona_esta)


Si deseas saber dónde aparece una subcadena en una cadena, puedes usar el método *find()*. El método *find()* te dice el índice en el que comienza la subcadena.

In [None]:
mensaje = "Me gusta Pamplona."
indice_pamplona = mensaje.find('Pamplona')
print('Pamplona empieza en el caracter numero: ' + str(indice_pamplona))

Sin embargo, ten en cuenta que esta función solo devuelve el índice de la primera aparición de la subcadena que está buscando. Si la subcadena aparece más de una vez, perderá las otras subcadenas.

In [None]:
mensaje = "Me gusta Pamplona. En Pamplona se celebran los San Fermines"
indice_pamplona = mensaje.find('Pamplona')
print('Pamplona empieza en el caracter numero: ' + str(indice_pamplona))

Si deseas buscar la última aparición de una subcadena, puedes usar la función *rfind()*.

In [None]:
mensaje = "Me gusta Pamplona. En Pamplona se celebran los San Fermines"
indice_pamplona = mensaje.rfind('Pamplona')
print('Pamplona empieza en el caracter numero: ' + str(indice_pamplona))

Reemplazando subcadenas
---

Puedes usar la función *replace()* para reemplazar cualquier subcadena con otra subcadena. Para usar la función *replace()*, proporciona la subcadena que deseas reemplazar y luego la subcadena con la que deseas reemplazarla. También necesitaras almacenar la nueva cadena, ya sea en la misma variable de cadena o en una nueva variable.

In [None]:
mensaje = "Me gusta Pamplona. En Pamplona hay verano."
mensaje = mensaje.replace('Pamplona', 'Madrid')
print(mensaje)

Contar subcadenas 
---
Si quieres saber cuántas veces aparece una subcadena dentro de una cadena, puedes usar el método *count()*.

In [None]:
mensaje = "Me gusta Pamplona. En Pamplona se celebran los San Fermines"
n_pamplonas = mensaje.count('Pamplona')
print('Pamplona aparece: ' + str(n_pamplonas) + ' veces en la cadena.')

De cadenas a listas y viceversa
---
### Split
En muchas ocasiones nos encontraremos convirtiendo cadenas en listas y viceversa. Python nos ofrece una serie de utilidades que conviene conocer si queremos ahorrarnos muchas horas de programacion. Una accion frecuente consiste en obtener una lista con todas las palabras de una cadena. Para ello utilizamos el metodo _split_.

In [None]:
cadena = 'uno dos tres'
lista_cadena = cadena.split()
print(lista_cadena)

De esta forma es muy sencillo contar el numero de palabras de una frase.

In [None]:
cadena = 'Esto es una frase con varias palabras'
lista_cadena = cadena.split()
print(len(lista_cadena))

Por defecto Python crea una lista de la cadena separando por el caracter espacio en blanco. Si queremos que tome como separador otro caracter necesitamos indicarlo como parametro en la funcion _split_.

In [None]:
hora = '19:25:33'
print(hora.split(':')) # utilizamos el caracter : como separador

Que ocurre con las cadenas maliciosas que estan separadas por diferentes caracteres?. Para obtener un resultado correcto es necesario los separadores sean siempre los mismos

In [None]:
cadena = 'uno dos:tres cuatro'
lista_cadena = cadena.split()
print(lista_cadena)

### Join
El metodo que hace lo contrario a _split_ es _join_. Nos permite una lista de palabras en una frase. Se utiliza poniendo delante el caracter a utilizar para unir las palabras seguido de _.join_ . A continuacion un ejemplo con diferentes caracteres de union.

In [None]:
print(' '.join(['uno','dos','tres']))

In [None]:
print(':'.join(['19','15','23']))

In [None]:
print('----'.join(['uno', 'dos', 'tres']))

Otros métodos para manipular cadenas
---
Hay una serie de [otros métodos de cadena](http://docs.python.org/3.3/library/stdtypes.html#string-methods) que no vamos a estudiar aquí, pero es posible echarles un vistazo a ellos si quieres. La mayoría de estos métodos deberían tener sentido en este punto. Es posible que no tengas uso para ninguno de ellos ahora mismo, pero es bueno saber qué se puede hacer con las cadenas. De esta manera tendrás una idea de cómo resolver ciertos problemas, incluso si esto significa volver a consultar la lista de métodos para recordar cómo escribir la sintaxis correcta cuando lo necesites.

# Tuplas

Las tuplas son básicamente listas que no se pueden cambiar. Las listas son bastante dinámicas; pueden crecer a medida que se inserta elementos, y pueden reducirse a medida que eliminan. Puedes modificar cualquier elemento que desees en una lista. A veces nos gusta este comportamiento, pero otras veces queremos asegurarnos de que ningún usuario o parte de un programa pueda cambiar una lista. Para eso son las tuplas.  

Técnicamente, las listas son objetos mutables y las tuplas son objetos inmutables. Los objetos mutables pueden cambiar (pensar en mutaciones) y los objetos inmutables no pueden cambiar.

Definiendo tuplas y accediendo a sus elementos
---

Una tupla se define tal y como se define una lista, excepto que se usa paréntesis en lugar de corchetes. Una vez que tengamos una tupla, podemos acceder a los elementos individuales como hacemos con una lista, y podemos recorrer la tupla con un bucle *for*:

In [None]:
colores = ('rojo', 'verde', 'azul')
print("El primer color es: " + colores[0])

print("\nLa variable colores contiene:")
for color in colores:
    print("- " + color)

Si intentas modificar el contenido de una tupla, Python dara error.

In [None]:
colores = ('rojo', 'verde', 'azul')
colores.append('amarillo') # esto produce error

Lo mismo ocurre cuando intentas eliminar algo de una tupla, o modificar uno de sus elementos. Una vez que define una tupla, puedes estar seguro de que sus valores no cambiarán.

In [None]:
colores = ('rojo', 'verde', 'azul')
colores[0] = 'amarillo' # esto produce un error

Usando tuplas para construir cadenas
---
Hemos visto que es muy útil poder mezclar cadenas en castellano sin procesar con valores que están almacenados en variables, como en el siguiente ejemplo:

In [None]:
animal = 'perro'
print("Tengo un " + animal + ".")

Esto es especialmente útil si tenemos que hacer lo siguiente.

In [None]:
animales = ['perro', 'gato', 'oso']
for animal in animales:
    print("Tengo un " + animal + ".")

Este enfoque de usar el signo + para construir cadenas es bastante intuitivo. Podemos ver que estamos agregando varias cadenas más pequeñas para formar una cadena más larga. Esto es intuitivo, pero requiere mucha escritura. Hay una manera más corta de hacerlo, usando marcadores de sustitución. Ya vimos anteriormente este concepto. Es hora de repasarlo y expandirlo un poco más.

Python ignora la mayoría de los caracteres que ponemos dentro de las cadenas. Hay unos pocos caracteres a los que Python presta atención, como vimos con cadenas como "\t" y "\n". Python también presta atención a "%s" y "%d". Estos son marcadores de sustitución. Cuando Python ve el marcador de sustitución "%s", mira hacia adelante y extrae el primer argumento después del signo %:

In [None]:
animal = 'perro'
print("Tengo un %s." % animal)

Esta es una forma mucho más limpia de generar cadenas que incluyen valores. Redactamos nuestra oración en una lista, y luego le decimos a Python qué valores debe insertar en la cadena, en los lugares apropiados.

Esto se denomina _formato de cadena_, y tiene el mismo aspecto cuando utiliza una lista.


In [None]:
animales = ['perro', 'gato', 'oso']
for animal in animales:
    print("Tengo un %s." % animal)

Si tenemos más de un valor para poner en la cadena que se está componiendo, debemos empacar los valores en una tupla.

In [None]:
animales = ['perro', 'gato', 'oso']
print("Tengo un %s, un %s y un %s." % (animales[0], animales[1], animales[2]))

### Formateo de cadenas con números

Si recuerdas, imprimir un número con una cadena puede causar un error.

In [None]:
entero = 23
# esto produce un error
print("Mi número favorito es el: " + entero + ".") 

Python piensa que podrías estar hablando del valor 23 o de los caracteres '23'. Entonces presenta un error, obligándonos a aclarar que queremos que Python trate el número como una cadena. Hacemos esto al convertir el número en una cadena usando la función que realiza el casting a _str()_:

In [None]:
entero = 23
print("Mi número favorito es el: " + str(entero) + ".") 

La cadena de formato "%d" se ocupa de esto por nosotros. Mira cómo está limpio este código.

In [None]:
enteros = [7, 23, 42]
print("Mi número favorito es el: %d, %d, y %d." % (enteros[0], enteros[1], enteros[2]))

Puedes combinar tipos de distintas clases en el _print_.

In [None]:
print("Entero: %d, Flotante: %f, y Cadena: %s." % (8, 5.5, 'hola'))

Hay formas más sofisticadas de hacer cadenas de formato en Python 3, pero guardaremos eso para más adelante porque es un poco menos intuitivo que este enfoque. Por ahora, puedes usar el enfoque que te proporcione de manera consistente el resultado que deseas ver.

# Terminando bucles antes de tiempo

## Break

La sentencia break, termina el bucle for-in .

In [None]:
for n in range(2, 10):
    if n == 5:
        break
    print(n)

Si hay más de un bucle se termina el más anidado antes de tiempo.

In [None]:
# este programa calcula primos hasta el numero 10
for n in range(2, 10):
    for x in range(2, n):
        if n % x == 0:
            print n, 'es igual a', x, '*', n/x
            break
    else:
         # sigue el bucle sin encontrar un factor
        print n, 'es un numero primo'

## Continue

La sentencia _continue_ es usada dentro de un bucle _while_ o _loop_ para retomar el control de la parte superior del loop sin ejecutar el resto de de las instrucciones que hay dentro del bucle.

In [None]:
# Gracias a continue no imprimimos los valores 3 y 6
for x in range(6):  
    if (x == 3 or x==6):  
        continue  
    print(x)  

# Ejercicios

1 - La lista de trabajo
- Haz una lista que incluya cuatro profesiones, como 'programador' y 'conductor de camión'.
- Usa la función _list.index()_ para encontrar el índice de una carrera en su lista.
- Usa la función _in_ para mostrar que una carrera está en su lista.
- Usa la función _append()_ para agregar una nueva carrera a tu lista.
- Usa la función de _insert()_ para agregar una nueva carrera al comienzo de la lista.
- Usa un loop for-in para mostrar todas las carreras en su lista.

2 - Comenzando desde la lista vacía
- Crea la lista de profesiones, pero esta vez inicia una lista vacía y llénala usando la función _append()_.
- Imprime un mensaje que imprima cual es la primera carrera en la que pensaste. 
- Imprime un mensaje que imprima cual es la última carrera en la que pensaste. 

3 - Lista de trabajo ordenada
- Comienza con la lista que creaste en el ejercicio 1.
- Imprime la lista en diferentes órdenes.
- Cada vez que imprimas la lista, usa un bucle _for-in_ en lugar de imprimir la lista entera.
    - Imprime un mensaje cada vez que diga en qué orden deberíamos ver la lista.
    - Imprime la lista en su orden original.
    - Imprime la lista en orden alfabético.
    - Imprime la lista en su orden original.
    - Imprime la lista en orden alfabético inverso.
    - Imprime la lista en su orden original.
    - Imprime la lista en el orden inverso al que comenzó.
    - Imprime la lista en su orden original
    - Ordena de forma permanente la lista en orden alfabético y luego imprímela.
    - Ordena de forma permanente la lista en orden alfabético inverso y luego imprímela.

4 - Números ordenados
- Haz una lista de 5 números, en orden aleatorio.
- Vas a imprimir la lista en varios órdenes diferentes.
- Cada vez que imprima la lista, usa un bucle _for-in_ en lugar de imprimir la lista entera.
    - Imprime un mensaje cada vez que nos diga en qué orden deberíamos ver la lista.
    - Imprime los números en el orden original.
    - Imprime los números en orden creciente.
    - Imprime los números en el orden original.
    - Imprime los números en orden decreciente.
    - Imprime los números en su orden original.
    - Imprime los números en el orden inverso desde cómo comenzaron.
    - Imprime los números en el orden original.
    - Ordena de forma permanente los números en orden creciente y luego imprímelos.
    - Ordena los números de forma permanente en orden decreciente y luego imprímelos.

5 - Longitudes de lista
- Copia dos o tres de las listas que hiciste en los ejercicios anteriores, o crea dos o tres listas nuevas.
- Imprime una serie de mensajes que nos digan la longitude de cada lista.

6 - Lista de gente Famosa
- Crea una lista que incluya los nombres de cuatro personas famosas.
- Elimina a cada persona de la lista, una cada vez, usando cada uno de los cuatro métodos que acabamos de ver:
    - _Popea_ el último elemento de la lista y _popea_ cualquier elemento excepto el último.
    - Elimina un elemento por su posición y un elemento por su valor.
- Imprime un mensaje de no quedan personas famosas en su lista, e imprime la lista para mostrar que está vacía.

7 - Cortes del alfabeto
- Almacena las primeras diez letras del alfabeto en una lista.
- Usa un _slice_ para imprimir las primeras tres letras del alfabeto.
- Usa un _slice_ para imprimir tres letras del medio de la lista.
- Usa un _slice_ para imprimir las letras desde cualquier punto en el medio de la lista, hasta el final.

8 - Lista protegida
- El objetivo en este ejercicio es demostrar que la copia de una lista protege la lista original.
- Haz una lista con los nombres de tres personas.
- Usa un _slice_ para hacer una copia de la lista completa. Recuerda como se realizaba la compia completa.
- Agrega al menos dos nombres nuevos a la nueva copia de la lista.
- Haz un _loop_ que imprima todos los nombres en la lista original, junto con un mensaje de que esta es la lista original.
- Haga un _loop_ que imprima todos los nombres en la lista copiada, junto con un mensaje de que esta es la lista copiada.

9 - Utiliza la función _range()_ para almacenar los primeros veinte números (1-20) en una lista e imprimirlos.

10 - Coge el codigo del ejercicio anterior y cambia el número final a un número mucho más grande. ¿Cuánto tiempo le toma al ordenador imprimir el primer millón de números? (La mayoría de la gente nunca verá un millón de números desplazarse ante sus ojos. Cuidado que esto puede ralentizar mucho tu ordenador).

11 - Imagina cinco carteras con diferentes cantidades de efectivo en ellas. Almacena estos cinco valores en una lista e imprime los siguientes mensajes:
- "La cartera más gorda tiene euros _valor_ en ella".
- "La cartera más delgada tiene euros _valor_ en ella".
- "Todas juntas, estas carteras tienen euros _valor_ en ellas".

12 - Creando listas de comprensión
- Haz una lista de los primeros diez múltiplos de diez (10, 20, 30 ... 90, 100) usando una lista de comprensión. Imprime tu lista.

- Vimos cómo hacer una lista de los primeros diez cuadrados. Haz una lista de los primeros diez cubos (1, 8, 27 ... 1000) usando una lista de comprensión, e imprímelos.

- Almacena cinco nombres en una lista. Haz una segunda lista que agregue la frase "¡es increíble!" a cada nombre, usando una lista de comprensión. Imprime la increíble versión de los nombres.

- Trabajando al revés. Escribe el siguiente código sin usar una lista de comprensión:

    mas_13 = [numero + 13 for numero in range(1,11)]

13 - Trabajo con cadenas y listas.

- Almacenar una frase en una variable. Usa un bucle for para imprimir cada carácter de la frase en una línea separada.
- Almacena una frase en una variable. Crea una lista de tu frase. Imprime la lista.
- Almacena una frase en una variable. Utilizando _slicing_ imprime los primeros cinco caracteres, cinco caracteres consecutivos del medio y los últimos cinco caracteres de la oración.

14 - Buscando Python
- Almacena una frase en una variable, asegurándote de usar la palabra *Python* al menos dos veces en la frase.
- Usa la palabra clave *in* para probar que la palabra *Python* está realmente en la frase.
- Usa la función *find()* para mostrar dónde aparece la palabra *Python* en la frase.
- Utilice la función *rfind()* para mostrar el último lugar donde aparece * Python * en la frase.
- Usa la función *count()* para mostrar cuántas veces aparece la palabra *Python*.
- Usa la función *split()* para dividir la frase en una lista de palabras. Imprime la lista sin formato y utiliza un _loop_ para imprimir cada palabra en su propia línea.
- Usa la función *replace()* para cambiar *Python* a *Ruby* en la frase.

15 - Puntuaciones de gimnastas
- Un gimnasta puede obtener una puntuación  entre 1 y 10 de cada juez; nada más bajo, nada más elevado. Todos las puntuatciones son valores enteros; no hay puntuaciones decimales de ningún juez.
- Almacena las puntuaciones que un posible gimnasta puede obtener de un juez en una tupla.
- Imprime la frase 'La puntuación mas baja posible es ... y la puntuación más alta posible es .... Utiliza los valores de la tupla creada anteriormente.
- Imprime una serie de mensajes, "Un juez puede darle a un gimnasta ... puntos" con todas las posibilidades de puntos que se pueden dar.

16 - Imprimiendo con formato
- Elige un programa que ya hayas escrito que utilice concatenación de cadenas.
- Reescribe tus secciones de cadena usando *%s* y *%d* en lugar de concatenación.
- Repita esto con otros dos programas que ya ha escrito.

17 - Escribe un programa que calcule la descomposición en factores primos de un número.

18 - Escribe un programa que calcule el factorial de un número.

19 - Escribe un programa que dado un número, escriba la lista de todos los números primos hasta él.

20 - Escriba un programa que dada la siguiente lista cree dos listas diferentes con el nombre y los apellidos

In [3]:
lista = ['Maria','Lopez','Juan','Garcia','Ivan','Martinez']

21 - Escribe un programa que elimine los duplicados de una lista

In [None]:
lista = [1, 1, 2, 2, 3, 1, 2, 5, 6, 7, 8]

22 - Escribe un programa que invierta una lista

In [4]:
lista = ['Di', 'buen', 'dia', 'a', 'papa']

23 - Vamos con algo de biotecnología
#### Contando Nucleótidos de ADN
- [El proyecto Rosalind](http://rosalind.info/problems/locations/) es un [conjunto de problemas](http://rosalind.info/problems/list-view/) basado en conceptos de biotecnología. Está destinado a mostrar cómo las habilidades de programación pueden ayudar a resolver problemas en genética y biología.
- Si has entendido la sección sobre cadenas, tienes suficiente información para resolver el primer problema en el Proyecto Rosalind, [Contando ADN Nucleótidos](http://rosalind.info/problems/dna/). Prueba el problema.
- Si resuelves el problema, logueate y prueba la versión completa del problema.

#### Transcribir ADN en ARN
- También tienes suficiente información para probar el segundo problema, [Transcribir ADN en ARN](http://rosalind.info/problems/rna/). Prueba el problema.
- Si resuelves el problema, logueate y prueba la versión completa del problema.

#### Complemento de un filamento de ADN
- Lo adivinaste!, ahora puedes probar el tercer problema también: [Complemento de un filamento de ADN](http://rosalind.info/problems/revc/). Prueba el problema y luego prueba la versión completa si has tenido éxito.

24 - Crea las siguientes listas de comprension que formulen las expresiones siguientes:
    
 S = x<sup>2</sup> : x in {0...9}  
 V = (1, 2, 4, 8, ... 2<sup>12</sup>)  
 M = {x | x in S and x even}

25 - Genera una lista de comprension con los numeros primos hasta 50. HINT: Puede ser mas sencillo generar una lista con los numeros no primos primero y generar  la de primos a partir de esa.

26 - Genera en una comprension de listas los elementos de la siguiente lista en minusculas, mayusculas y la longitude de cada uno. HINT: El resultado sera una lista de listas.