# Lista de tuplas

## Programación para Analítica de Datos
## Mtra. Gisel Hernández Chávez

### Contenido principal
+ Ventaja de la lista de tuplas sobre la lista de lista
+ Uso de la función zip()
+ Función zip() y lista por comprensión
+ Ejercicios

### Contenido complementario
+ Tachado en markdown, secciones embebidas y lograr que aparezcan ciertos caracteres como el asterisco.
+ Cómo dividir en varias líneas una misma sentencia de código larga en Jupyter.
+ Cómo asignar de forma múltiple en la misma sentencia: desempaquetado.

## Tachado en markdown, secciones embebidas y lograr que aparezcan ciertos caracteres como el asterisco.

~~This text is struckthrough.~~ This one isn’t.
>This is an **embedded section**.
>The section continues here

>This is another **embedded section**.
This section also continues in the second like

This line isn’t embedded any more.
- Point 1
- Point 2
- Point 3

This is an \*example with an asterisk\*.

## Cómo dividir en varias líneas una misma sentencia de código larga en Jupyter

In [1]:
# Usando paréntesis
x = (
  'Select * '
  'FROM OURDBNAME.dbo.vw_DimFoo '
  'WHERE <foo> '
)

print(x)

Select * FROM OURDBNAME.dbo.vw_DimFoo WHERE <foo> 


## Cómo asignar de forma múltiple en la misma sentencia

In [2]:
# Creación de tuplas
# Cada tupla o registro es una entrada a una listade grandes obras literarias, autor y puntaje según
# https://www.abc.es/cultura/cultural/abci-100-mejores-libros-literatura-universal-201806030125_noticia.html?ref=https:%2F%2Fwww.google.com%2F
t1, t2, t3, t4 = (
    ('Miguel de Cervantes','El ingenioso hidalgo DonQuijote de la Mancha',267)
    ,('Homero','La Odisea', 148),('Homero', 'La Ilíada',93)
    ,('Dante Alighieri', 'La divina comedia',86)
)
t3


('Homero', 'La Ilíada', 93)

In [3]:
t4

('Dante Alighieri', 'La divina comedia', 86)

## ¿Por qué es más eficiente en uso de memoria una lista de tuplas que una lista de listas?

https://stackoverflow.com/questions/46664007/why-do-tuples-take-less-space-in-memory-than-lists

+ El método mágico __sizeof__() no devuelve el tamaño correcto, sino el tamaño de almacenamiento de valores.
+ sys.get_sizeof() devuelve el tamaño correcto

In [4]:
a = (1,2,3)
a.__sizeof__()

48

La tupla a ocupa 48 bytes:
+ 24 bytes de 3 punteros a los 3 entereos de 8 bytes cada uno
+ 24 bytes de los 3 enteros. Cada entero es del tipo int64, ocupando cada uno 8 bytes

In [5]:
b = [1,2,3]
b.__sizeof__()

72

La lista b ocupa 72 bytes. Ademas de los 48 bytes de los 3 punteros y los enteros, sobreasigama memoria para admitir adiciones de elementos sin relocalizar la lista.

In [6]:
#b.__sizeof__?

## Explicación
+ Las tuplas de Python son inmutables. Los objetos mutables tienen una sobrecarga adicional para lidiar con los cambios en el tiempo de ejecución.
+ Independientemente de la implementación, las listas son de tamaño variable, mientras que las tuplas son de tamaño fijo.
+ Entonces, las tuplas pueden almacenar los elementos directamente dentro de la estructura. Las listas, por otro lado, necesitan una capa de indirección (almacena un puntero a los elementos). Esta capa de indirección es un puntero, en sistemas de 64 bits que son 64 bits, por lo tanto, 8 bytes.
+ Pero hay otra cosa que hacen las listas: sobreasignan (over-allocate). De lo contrario, list.append sería una operación __O(n)__ siempre: para que se amortice __O(1)__ (¡mucho más rápido!), se sobreasigna. Pero ahora tiene que realizar un seguimiento del tamaño asignado y el tamaño de relleno (las tuplas solo necesitan almacenar un tamaño, porque el tamaño asignado y relleno son siempre idénticos). Eso significa que cada lista tiene que almacenar otro "tamaño" que en los sistemas de 64 bits es un número entero de 64 bits, de nuevo 8 bytes.
+ Entonces, las listas necesitan al menos 16 bytes más de memoria que las tuplas. ¿Por qué dije "al menos"? Debido a la sobreasignación. La sobreasignación significa que asigna más espacio del necesario. Sin embargo, la cantidad de sobreasignación depende de "cómo" crea la lista y el historial de anexos / eliminaciones

In [10]:
# Lo que ocurre al adicionar un elemento
L = [1,2,3]
L.__sizeof__()

72

In [11]:
L.append(4)  # No crece al agregar otro elemento, no re-allocation (no over-allocation)
L.__sizeof__()

72

In [12]:
# triggers re-allocation (with over-allocation), because the original list is full
L.append(5.5)  
L.__sizeof__()

104

In [13]:
L

[1, 2, 3, 4, 5.5]

In [14]:
L2 = []
L2.__sizeof__() # aunque no tenga elementos le asigna un espacio en memoria

40

In [15]:
L2.append(1)  # re-allocation with over-allocation
L2.__sizeof__()

72

In [16]:
L2.append(2)  # no re-alloc
L2.__sizeof__()

72

In [17]:
L2.append(3)  # no re-alloc
L2.__sizeof__()

72

In [18]:
L2.append(4)  # still has room, so no over-allocation needed (yet)
L2.__sizeof__()

72

In [19]:
L2.append(5)  # no room, so over-allocation needed
L2.__sizeof__()

104

### La lista es un arreglo dinámico en Python

## Nota importante
Tenga en cuenta que __sizeof__ realmente no devuelve el tamaño "correcto". Solo devuelve el tamaño de los valores almacenados. Sin embargo, cuando usa __sys.getsizeof__, el resultado es diferente.

In [21]:
import sys
L = [1,2,3]
t = (1, 2, 3)
sys.getsizeof(L), L.__sizeof__()

(88, 72)

In [22]:
sys.getsizeof(t)

64

+ Hay 24 bytes "extra". Estos son reales, esa es la __sobrecarga del recolector de basura__ (GC: garbage collector) que no se tiene en cuenta en el método __sizeof__. 
+ Esto se debe a que generalmente no se supone que debe usar métodos mágicos directamente; use las funciones que saben cómo manejarlos, en este caso: sys.getsizeof (que en realidad agrega la sobrecarga de GC al valor devuelto por __sizeof__)

## Creación de una lista de tuplas 

In [23]:
# Creación de una tupla de tuplas
rank_obras = t1,t2,t3,t4
rank_obras

(('Miguel de Cervantes', 'El ingenioso hidalgo DonQuijote de la Mancha', 267),
 ('Homero', 'La Odisea', 148),
 ('Homero', 'La Ilíada', 93),
 ('Dante Alighieri', 'La divina comedia', 86))

In [24]:
type(rank_obras)

tuple

In [25]:
sys.getsizeof(rank_obras)

72

In [26]:
# Creación de una lista de tuplas
rank_obras2 = [t1,t2,t3,t4]
rank_obras2

[('Miguel de Cervantes', 'El ingenioso hidalgo DonQuijote de la Mancha', 267),
 ('Homero', 'La Odisea', 148),
 ('Homero', 'La Ilíada', 93),
 ('Dante Alighieri', 'La divina comedia', 86)]

In [27]:
type(rank_obras2)

list

In [28]:
sys.getsizeof(rank_obras2)

88

## Creación de una lista de tuplas a partir de varias listas

In [29]:
L5, L6 = (
    ['Shakespeare','Hamlet',63]
    ,['SA','La Biblia',61]
)

In [30]:
L5

['Shakespeare', 'Hamlet', 63]

In [31]:
type(L5)

list

In [32]:
id(L5)

2863872456576

## Uso de la función zip
+ La función zip() de Python se puede usar para mapear las listas en conjunto para crear una lista de tuplas.
+ La función zip () devuelve un iterable de tuplas en función de los valores que se le pasan. 
+ La función list () crearía una lista de esas tuplas como resultado de la función zip ().

In [33]:
cadena ='esta es una cadena de caracteres'
type(cadena)

str

In [34]:
sys.getsizeof(cadena)

81

In [35]:
iter(cadena)

<str_iterator at 0x29acbdcd0c0>

In [36]:
it = iter(cadena)
it.__next__()


'e'

In [37]:
lista_cad = list(cadena)
lista_cad 

['e',
 's',
 't',
 'a',
 ' ',
 'e',
 's',
 ' ',
 'u',
 'n',
 'a',
 ' ',
 'c',
 'a',
 'd',
 'e',
 'n',
 'a',
 ' ',
 'd',
 'e',
 ' ',
 'c',
 'a',
 'r',
 'a',
 'c',
 't',
 'e',
 'r',
 'e',
 's']

In [38]:
Lista_obras = list(zip(L5,L6))
Lista_obras

[('Shakespeare', 'SA'), ('Hamlet', 'La Biblia'), (63, 61)]

### Observaciones
+ Note cómo el mapeo con zip() conjuntó en tuplas los datos correspondientes de las mismas posiciones en las secuencias.
+ Si se tuviera una lista con todos los nombres de autores, otra con los nombres de obras y otra con los rankings, podría formar tuplas con un registro por obra

In [39]:
L7, L8, L9 = (
    ['Marcel Proust','Virgilio']
    ,['En busca del tiempo perdido', 'La Eneida']
    ,[59,58]
)

In [40]:
Lista_obras2 = list(zip(L7,L8,L9))
Lista_obras2

[('Marcel Proust', 'En busca del tiempo perdido', 59),
 ('Virgilio', 'La Eneida', 58)]

## Preguntas de intelección y discusión
1. ¿Qué tiene más sentido, crear las tuplas en el código o crear un archivo en memoria externa con los datos que conozco?
2. Si no conociera los datos y tendría que capturarlos en línea, ¿tendría sentido hacer la lista de tuplas y finalmente guardarlos en un archivo?

## Agrupación personalizada de elementos mientras se forma una lista de tuplas

Mientras formamos una lista de tuplas, es posible que proporcionemos agrupaciones personalizadas de elementos en función del número de elementos de la lista / tupla.

<font color ='green' > __[elemento for elemento in zip (* [iter (lista)] * número)]__</font>

+ La _comprensión de listas_ junto con la función zip () se utiliza para convertir las tuplas en listas y crear una lista de tuplas. 
+ La función Python iter () se usa para iterar un elemento de un objeto a la vez. 
+ El "número" especificaría el número de elementos que se agruparán en una sola tupla para formar una lista.


In [41]:
Lst = [50,"Python","JournalDev",100]
Lst_tuple = [x for x in zip(*[iter(Lst)])]
print(Lst_tuple)

[(50,), ('Python',), ('JournalDev',), (100,)]


In [42]:
# Dos elementos contenidos dentro de la tupla para formar la lista de tuplas
lst = [50,"Python","JournalDev",100]
lst_tuple = [x for x in zip(*[iter(lst)]*2)]
print(lst_tuple)

[(50, 'Python'), ('JournalDev', 100)]


In [43]:
# Tres elementos contenidos dentro de la tupla para formar la lista de tuplas
lst = [50,"Python","JournalDev",100]
lst_tuple = [x for x in zip(*[iter(lst)]*3)]
print(lst_tuple)

[(50, 'Python', 'JournalDev')]


## Lista de tuplas usando la función map()

+ La función map() de Python se puede utilizar para crear una lista de tuplas. 
+ La función map () mapea y aplica una función a un iterable pasado a la función.

map(function, iterable)


In [44]:
lst = [[50],["Python"],["JournalDev"],[100]]
lst_tuple =list(map(tuple, lst))
print(lst_tuple)

[(50,), ('Python',), ('JournalDev',), (100,)]


## Lista de tuplas usando la comprensión de listas y el método tuple ()

+ El método Python tuple () junto con List Comprehension se puede usar para formar una lista de tuplas.

+ La función tuple () ayuda a crear tuplas a partir del conjunto de elementos que se le pasan.

In [45]:
lst = [[50],["Python"],["JournalDev"],[100]]
lst_tuple =[tuple(ele) for ele in lst]
print(lst_tuple)

[(50,), ('Python',), ('JournalDev',), (100,)]


## Ejercicio de tarea (no hay que entregarlo)

Cree en Excel un archivo con tres columnas (campos) en formato csv que contenga 7 de las obras de literatura vistas en los ejemplos con sus correspondientes autores y ranking según la fuente citada de abc.

Use el módulo y funciones de preferencia para leer un archivo csv, de manera que los datos los coloque en una lista de tuplas.

Ordene la lista según el ranking y muestre en pantalla el mismo de mayor a menor.

Cree un nuevo archivo csv con las obras ordenadas por ranking