<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="./figures/cover-small.jpg">

*Este libro es una versión al español de [Python for Everybody](https://www.py4e.com/) escrito por el [Dr. Charles R. Severance](http://www.dr-chuck.com/); este contenido esta disponible en [GitHub](https://github.com/csev/py4e).*

Detalles de Copyright

*Copyright ~ 2009- Charles Severance.
Este trabajo está registrado bajo una Licencia Creative Commons AttributionNonCommercial-ShareAlike 3.0 [CC BY-NC-SA](https://creativecommons.org/licenses/by-nc-sa/3.0/).*

<!--NAVIGATION-->
| [Indice](indice.ipynb) | 

< [Capítulo 9 - Diccionarios](cap09.ipynb) | [Capítulo 11 - Expresiones regulares](cap11.ipynb) >

# Capítulo 10 - Tuplas

## Las tuplas son inmutables

Una tupla es una secuencia de valores muy parecida a una lista. Los valores almacenados en una tupla pueden ser de cualquier tipo y están indexados por enteros. La diferencia importante es que las tuplas son inmutables. Las tuplas también son comparables y manejables, por lo que podemos ordenar listas de ellas y usar tuplas como valores clave en los diccionarios de Python.

Sintácticamente, una tupla es una lista de valores separados por comas:

In [1]:
t = 'a', 'b', 'c', 'd', 'e'

Aunque no es necesario, es común incluir tuplas entre paréntesis para ayudarnos a identificar rápidamente las tuplas cuando observamos el código de Python:

In [2]:
t = ('a', 'b', 'c', 'd', 'e')

Para crear una tupla con un solo elemento, debe incluir la coma final:

In [3]:
t1 = ('a',)
type(t1)

tuple

Sin la coma que Python trata ('a') como una expresión con una cadena entre paréntesis que evalúa como una cadena: 

In [4]:
t2 = ('a')
type(t2)

str

Otra forma de construir una tupla es la función incorporada tuple. Sin argumentos, crea una tupla vacía:

In [5]:
t = tuple()
print(t)

()


Si el argumento es una secuencia (cadena, lista o tupla), el resultado de la llamada a `tuple` es una tupla con los elementos de la secuencia:

In [6]:
t = tuple('lupins')
print(t)

('l', 'u', 'p', 'i', 'n', 's')


Debido a que `tuple` es el nombre de un constructor, debe evitar usarlo como un nombre de variable.
La mayoría de los operadores de listas también trabajan con tuplas. El operador de corchete indexa un elemento:

In [7]:
 t = ('a', 'b', 'c', 'd', 'e')
print(t[0])

a


Y el operador de sector selecciona un rango de elementos.

In [8]:
>>> print(t[1:3])

('b', 'c')


Pero si intentas modificar uno de los elementos de la tupla, obtienes un error:

In [9]:
t[0] = 'A'

TypeError: 'tuple' object does not support item assignment

No puede modificar los elementos de una tupla, pero puede reemplazar una tupla por otra:

In [10]:
t = ('A',) + t[1:]
print(t)

('A', 'b', 'c', 'd', 'e')


## Comparando tuplas

Los operadores de comparación trabajan con tuplas y otras secuencias. Python comienza comparando el primer elemento de cada secuencia. Si son iguales, pasa al siguiente elemento, y así sucesivamente, hasta que encuentra elementos que difieren. Los elementos posteriores no se consideran (incluso si son realmente grandes).

In [11]:
(0, 1, 2) < (0, 3, 4)

True

In [12]:
(0, 1, 2000000) < (0, 3, 4)

True

La función `sort` funciona de la misma manera. Se ordena principalmente por el primer elemento, pero en el caso de un empate, ordena por segundo elemento, y así sucesivamente.

Esta característica se presta a un patrón llamado *DSU* para **Decorar** una secuencia construyendo una lista de tuplas con una o más claves de ordenación que preceden a los elementos de la secuencia, **Ordenar** la lista de tuplas que usan el Python incorporado `sort`, y **Undecorate** extrayendo
los elementos ordenados de la secuencia.

Por ejemplo, supongamos que tiene una lista de palabras y desea ordenarlas de la más larga a la más corta:

In [13]:
txt = 'but soft what light in yonder window breaks'
palabras = txt.split()
t = list()

for palabra in palabras:
    t.append((len(palabra), palabra))

t.sort(reverse=True)

res = list()
for longitud, palabra in t:
    res.append(palabra)

print(res)

['yonder', 'window', 'breaks', 'light', 'what', 'soft', 'but', 'in']


El primer ciclo crea una lista de tuplas, donde cada tupla es una palabra precedida por su longitud.

`sort` compara el primer elemento, longitud, primero, y solo considera el segundo elemento para romper vínculos. El argumento de la palabra clave `reverse=True` le dice a `sort` que realice un orden decreciente.

El segundo bucle atraviesa la lista de tuplas y crea una lista de palabras en orden descendente de longitud. Las palabras de cuatro caracteres se ordenan en orden alfabético inverso, por lo que "what" aparece antes de "soft".

Por supuesto, la línea pierde gran parte de su impacto poético cuando se convierte en una lista de Python y se ordena en orden de longitud de palabra descendente.

## Asignacion a tuplas

Una de las características sintácticas únicas del lenguaje Python es la capacidad de tener una tupla en el lado izquierdo de una declaración de asignación. Esto le permite asignar más de una variable a la vez cuando el lado izquierdo es una secuencia.

En este ejemplo, tenemos una lista de dos elementos (que es una secuencia) y asignamos los elementos primero y segundo de la secuencia a las variables `x` y `y` en una sola declaración.

In [14]:
m = [ 'have', 'fun' ]
x, y = m
print(x)
print(y)

have
fun


No es magia, Python traduce aproximadamente la sintaxis de asignación de tuplas para que sea la siguiente:

In [15]:
m = [ 'have', 'fun' ]
x = m[0]
y = m[1]
print(x)
print(y)

have
fun


Estilísticamente, cuando usamos una tupla en el lado izquierdo de la declaración de asignación, omitimos los paréntesis, pero la siguiente es una sintaxis igualmente válida:

In [16]:
m = [ 'have', 'fun' ]
(x, y) = m
print(x)
print(y)

have
fun


Una aplicación particularmente inteligente de la asignación de tuplas nos permite intercambiar los valores de dos variables en una sola declaración:

In [17]:
print(x)
print(y)
x, y = y, x
print(x)
print(y)

have
fun
fun
have


Ambos lados de esta declaración son tuplas, pero el lado izquierdo es una tupla de variables; el lado derecho es una tupla de expresiones. Cada valor en el lado derecho se asigna a su variable respectiva en el lado izquierdo. Todas las expresiones en el lado derecho se evalúan antes de cualquiera de las asignaciones.

El número de variables a la izquierda y el número de valores a la derecha debe ser el mismo:

In [18]:
a, b = 1, 2, 3

ValueError: too many values to unpack (expected 2)

De manera más general, el lado derecho puede ser cualquier tipo de secuencia (cadena, lista o tupla). Por ejemplo, para dividir una dirección de correo electrónico en un nombre de usuario y un dominio, puede escribir:

In [19]:
addr = 'monty@python.org'
uname, domain = addr.split('@')
print(uname)
print(domain)

monty
python.org


El valor de retorno de `split` es una lista con dos elementos; el primer elemento está asignado a `uname`, el segundo a `domain`.

## Diccionarios y tuplas

Los diccionarios tienen un método llamado `items` que devuelve una lista de tuplas, donde cada tupla es un par `clave-valor`:

In [20]:
d = {'a':10, 'b':1, 'c':22}

Como debería esperar de un diccionario, los artículos no están en un orden particular.

Sin embargo, dado que la lista de tuplas es una lista, y las tuplas son comparables, ahora podemos ordenar la lista de tuplas. La conversión de un diccionario a una lista de tuplas es una forma de que generemos los contenidos de un diccionario ordenado por clave:

In [21]:
d = {'a':10, 'b':1, 'c':22}
t = list(d.items())
print(t)
t.sort()
print(t)

[('a', 10), ('b', 1), ('c', 22)]
[('a', 10), ('b', 1), ('c', 22)]


La nueva lista está ordenada en orden alfabético ascendente por el valor clave.

## Asignacion multiple con diccionarios

Combinar `items`, asignación de tuplas y `for`, puede ver un bonito patrón de código para recorrer las claves y los valores de un diccionario en un solo bucle:

In [22]:
for clave, valor in list(d.items()):
    print(valor, clave)

10 a
1 b
22 c


Este ciclo tiene dos variables de iteración porque `items` devuelve una lista de tuplas, una asignación de tupla que itera sucesivamente a través de cada uno de los pares clave-valor en el diccionario.

Para cada iteración a través del bucle, tanto `clave` y `valor` se hacen avanzar al siguiente par clave-valor en el diccionario (todavía en orden hash).

Si combinamos estas dos técnicas, podemos imprimir el contenido de un diccionario ordenado por el valor
almacenado en cada par clave-valor.

Para hacer esto, primero hacemos una lista de tuplas donde cada tupla es del tipo (valor, clave). El método `items` nos daría una lista de tuplas del tipo (clave, valor), pero esta vez queremos ordenar por valor, no por clave. Una vez que hemos construido la lista con las tuplas de la clave de valor, es una cuestión simple de ordenar la lista en orden inverso e imprimir la nueva lista ordenada.

In [23]:
d = {'a':10, 'b':1, 'c':22}
l = list()
for clave, valor in d.items() :
    l.append( (valor, clave) )
print(l)
l.sort(reverse=True)

[(10, 'a'), (1, 'b'), (22, 'c')]


Al construir cuidadosamente la lista de tuplas para tener el valor como el primer elemento de cada tupla, podemos ordenar la lista de tuplas y obtener los contenidos de nuestro diccionario ordenados por valor.

## Las palabras mas comunes

Volviendo a nuestro ejemplo del texto de Romeo y Julieta Act 2, Escena 2, podemos aumentar nuestro programa para usar esta técnica para imprimir las diez palabras más comunes en el texto de la siguiente manera:

In [24]:
import string
fhand = open('./codes/romeo-full.txt')
counts = dict()
for linea in fhand:
    linea = linea.translate(str.maketrans('', '', string.punctuation))
    linea = linea.lower()
    palabras = linea.split()
    for palabra in palabras:
        if palabra not in counts:
            counts[palabra] = 1
        else:
            counts[palabra] += 1

# Ordena el diccionario por valor
lst = list()
for clave, valor in list(counts.items()):
    lst.append((valor, clave))

lst.sort(reverse=True)

for clave, valor in lst[:10]:
    print(clave, valor)

61 i
42 and
40 romeo
34 to
34 the
32 thou
32 juliet
30 that
29 my
24 thee


La primera parte del programa que lee el archivo y calcula el diccionario que correlaciona cada palabra con el recuento de palabras del documento no cambia. Pero en lugar de simplemente imprimir counts y finalizar el programa, construimos una lista de tuplas (valor, clave) y luego ordenamos la lista en orden inverso.

Como el valor es primero, se usará para las comparaciones. Si hay más de una tupla con el mismo valor, verá el segundo elemento (la clave), de modo que las tuplas donde el valor sea el mismo se ordenarán más por orden alfabético de la clave.

Al final, escribimos un bucle `for` agradable que realiza una iteración de asignación múltiple e imprime las diez palabras más comunes iterando a través de un segmento de la lista `lst[:10]`.

Entonces ahora la salida finalmente se ve como lo que queremos para nuestro análisis de frecuencia de palabras.

In [25]:
lst[:10]

[(61, 'i'),
 (42, 'and'),
 (40, 'romeo'),
 (34, 'to'),
 (34, 'the'),
 (32, 'thou'),
 (32, 'juliet'),
 (30, 'that'),
 (29, 'my'),
 (24, 'thee')]

El hecho de que este complejo análisis y análisis de datos se pueda realizar con un programa Python de 19 líneas fácil de entender es una de las razones por las cuales Python es una buena opción como lenguaje para explorar información.

## Usar tuplas como claves en los diccionarios

Debido a que las tuplas son hashable y las listas no, si queremos crear una clave compuesta para usar en un diccionario, debemos usar una tupla como clave.

Encontraríamos una clave compuesta si quisiéramos crear un directorio telefónico que haga corresponder los apellidos, los primeros nombres con los números de teléfono. Suponiendo que hemos definido las variables `apellido`, `nombre` y `numero`, podríamos escribir una instrucción de asignación diccionario de la siguiente manera:

    diccionario[apellido,nombre] = numero

La expresión entre paréntesis es una tupla. Podríamos usar la asignación de tuplas en un bucle `for` para recorrer este diccionario.

In [26]:
diccionario = dict()
diccionario['Lopez','Juan'] = 123456789
for apellido, nombre in diccionario:
    print(nombre, apellido, diccionario[apellido,nombre])

Juan Lopez 123456789


Este bucle atraviesa las claves en `diccionario`, que son tuplas. Asigna los elementos de cada tupla, `apellido` y `nombre` luego imprime el nombre y el número de teléfono correspondiente.

## Secuencias: cadenas, listas y tuplas - ¡Oh, Dios mío!

Me he centrado en listas de tuplas, pero casi todos los ejemplos de este capítulo también funcionan con listas de listas, tuplas de tuplas y tuplas de listas. Para evitar enumerar las posibles combinaciones, a veces es más fácil hablar de secuencias de secuencias.

En muchos contextos, los diferentes tipos de secuencias (cadenas, listas y tuplas) se pueden usar indistintamente. Entonces, ¿cómo y por qué eliges uno sobre los demás?

Para comenzar con lo obvio, las cadenas son más limitadas que otras secuencias porque los elementos tienen que ser caracteres. Ellos también son inmutables. Si necesita la capacidad de cambiar los caracteres en una cadena (en lugar de crear una nueva cadena), es posible que desee utilizar una lista de caracteres en su lugar.

Las listas son más comunes que las tuplas, principalmente porque son mutables. Pero hay algunos casos en los que podrías preferir tuplas:
1. En algunos contextos, como una declaración `return`, es sintácticamente más simple crear una tupla que una lista. En otros contextos, es posible que se prefiera una lista.
2. Si desea usar una secuencia como un clave de diccionario, debe usar un tipo inmutable como una tupla o cadena.
3. Si está pasando una secuencia como argumento a una función, el uso de tuplas reduce el potencial de comportamiento inesperado debido al aliasing.

Debido a que las tuplas son inmutables, no proporcionan métodos como `sort` y `reverse`, que modifican las listas existentes. Sin embargo, Python proporciona las funciones integradas `sorted` y `reversed`, que toman cualquier secuencia como parámetro y devuelven una nueva secuencia con los mismos elementos en un orden diferente.

## Depuración

Las listas, diccionarios y tuplas se conocen genéricamente como estructuras de datos; en este capítulo estamos comenzando a ver estructuras de datos compuestos, como listas de tuplas y diccionarios que contienen tuplas como claves y listas como valores. Las estructuras de datos compuestas son útiles, pero son propensas a lo que llamo errores de forma; es decir, los errores causados cuando una estructura de datos tiene un tipo, tamaño o composición incorrectos, o tal vez usted escribe algún código y olvida la forma de sus datos y produce un error.

Por ejemplo, si está esperando una lista con un número entero y le doy un número entero simple antiguo (no en una lista), no funcionará.

Cuando está depurando un programa, y especialmente si está trabajando en un error, hay cuatro cosas que debe intentar:

**leer:** Examine su código, léalo de nuevo y verifique que diga lo que quería decir.

**ejecutar:** Experimenta haciendo cambios y ejecutando diferentes versiones. A menudo, si muestra lo correcto en el lugar correcto del programa, el problema se vuelve obvio, pero a veces debe dedicar algún tiempo a construir andamios.

**reflexionar:** ¡Tómate un tiempo para pensar! ¿Qué tipo de error es: sintaxis, tiempo de ejecución, semántica? ¿Qué información puede obtener de los mensajes de error o de la salida del programa? ¿Qué tipo de error podría causar el problema que estás viendo? ¿Qué cambiaste por última vez antes de que apareciera el problema?

**retirarse:** En algún momento, lo mejor que puede hacer es retroceder, deshacer los cambios recientes, hasta que regrese a un programa que funciona y que usted comprende. Entonces puedes comenzar a reconstruir.

Los programadores principiantes a veces se atascan en una de estas actividades y se olvidan de los demás. Cada actividad viene con su propio modo de falla.

Por ejemplo, leer su código podría ayudar si el problema es un error tipográfico, pero no si el problema es un malentendido conceptual. Si no comprende lo que hace su programa, puede leerlo 100 veces y nunca ver el error, porque el error está en su cabeza.

Ejecutar experimentos puede ser útil, especialmente si realiza pruebas pequeñas y simples. Pero si ejecuta experimentos sin pensar o leer su código, puede caer en un patrón que llamo "programación aleatoria", que es el proceso de hacer cambios aleatorios hasta que el programa haga lo correcto. Vale decir que la programación aleatoria puede llevar mucho tiempo.

Tienes que tomar tiempo para pensar. La depuración es como una ciencia experimental. Debería tener al menos una hipótesis sobre cuál es el problema. Si hay dos o más posibilidades, trate de pensar en una prueba que eliminaría una de ellas.

Tomar un descanso ayuda con el pensamiento. También lo hace hablar. Si le explica el problema a alguien más (o incluso a usted), a veces encontrará la respuesta antes de que termine de formular la pregunta.

Pero incluso las mejores técnicas de depuración fallarán si hay demasiados errores o si el código que intentas corregir es demasiado grande y complicado. A veces, la mejor opción es retirarse,  simplificando el programa hasta que llegue a algo que funcione y que usted entienda.

Los programadores principiantes a menudo son reacios a retirarse porque no pueden soportar eliminar una línea de código (incluso si está mal). Si te hace sentir mejor, copia tu programa en otro archivo antes de comenzar a desmantelarlo. Luego puedes pegar las piezas un poquito a la vez.

Encontrar un error difícil requiere leer, ejecutar, reflexionar y, a veces, retirarse. Si te quedas atascado en una de estas actividades, prueba con los demás.

## Glosario

* **comparable:** Un tipo en el que se puede verificar un valor para ver si es mayor, menor o igual a otro valor del mismo tipo. Los tipos que son comparables se pueden poner en una lista y ordenar. 

* **estructura de datos:** Una colección de valores relacionados, a menudo organizados en listas, diccionarios, tuplas, etc.

* **DSU:** Abreviatura de "decorate-sort-undecorate", un patrón que implica construir una lista de tuplas, ordenar y extraer parte del resultado.

* **reunir:** La operación de ensamblar una tupla de argumento de longitud variable.

* **hashable:** Un tipo que tiene una función hash. Los tipos inmutables como enteros, flotantes y cadenas son hashable; tipos mutables como listas y diccionarios no lo son.

* **dispersión:** La operación de tratar una secuencia como una lista de argumentos.

* **forma (de una estructura de datos):** Un resumen del tipo, tamaño y composición de una estructura de datos.

* **singleton:** Una lista (u otra secuencia) con un solo elemento.

* **tupla:** Una secuencia inmutable de elementos.

* **asignación de tupla:** Una asignación con una secuencia en el lado derecho y una tupla de variables en el lado izquierdo. El lado derecho se evalúa y luego sus elementos se asignan a las variables de la izquierda.

## Ejercicios

**Ejercicio 1:** revise un programa anterior de la siguiente manera: lea y analice las líneas "From" y extraiga las direcciones de la línea. Cuente la cantidad de mensajes de cada persona que usa un diccionario.

Una vez que se hayan leído todos los datos, imprima la persona con la mayor cantidad de confirmaciones creando una lista de tuplas (de recuento, correo electrónico) del diccionario. Luego, clasifique la lista en orden inverso e imprima la persona que tiene la mayor cantidad de confirmaciones.

Linea de ejemplo:

    From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008
    
    Ingresa el nombre de archivo: mbox-short.txt
    cwen@iupui.edu 5
    
    Ingresa el nombre de archivo: mbox.txt
    zqian@umich.edu 195

**Ejercicio 2:** este programa cuenta la distribución de la hora del día para cada uno de los mensajes. Puede sacar la hora de la línea "From" buscando la cadena de tiempo y luego dividir esa cadena en partes usando el carácter de dos puntos. Una vez que haya acumulado los conteos por cada hora, imprima los conteos, uno por línea, ordenados por hora como se muestra a continuación.

    python timeofday.py
    Ingresa el nombre de archivo: mbox-short.txt
    04 3
    06 1
    07 1
    09 2
    10 3
    11 6
    14 1
    15 2
    16 4
    17 2
    18 1
    19 1

**Ejercicio 3:** escriba un programa que lea un archivo e imprima las letras en orden decreciente de frecuencia. Su programa debe convertir todas las entradas en minúsculas y solo contar las letras a-z. Su programa no debe contar espacios, dígitos, signos de puntuación ni nada que no sean las letras de la `a` a la `z`. Encuentre ejemplos de texto de diferentes idiomas y vea cómo varía la frecuencia de las letras entre los idiomas. Compare sus resultados con las tablas en wikipedia.org/wiki/Letter_frequencies.

<!--NAVIGATION-->
| [Indice](indice.ipynb) |

< [Capítulo 9 - Diccionarios](cap09.ipynb) | [Capítulo 11 - Expresiones regulares](cap11.ipynb) >