# Objetos `zip`

Un objeto `zip` puede combinar varios objetos iterables en un objeto iterable.

In [1]:
# Ejemplo:
title = 'TMNT'
villians = ['Shredder', 'Krang', 'Bebop', 'Rocksteady']
turtles = {
    'Raphael': 'Sai', 'Michelangelo': 'Nunchaku',
    'Leonardo': 'Twin katana', 'Donatello': 'bo'
}

result = zip(title, villians, turtles)
result

<zip at 0x1059fce80>

In [2]:
for item in result:
    print(item)

('T', 'Shredder', 'Raphael')
('M', 'Krang', 'Michelangelo')
('N', 'Bebop', 'Leonardo')
('T', 'Rocksteady', 'Donatello')


Se puede pasar las tuplas a una lista usando el constructor `list` al objeto `zip`

In [4]:
result = zip(title, villians, turtles)
tuples = list(result)
tuples

[('T', 'Shredder', 'Raphael'),
 ('M', 'Krang', 'Michelangelo'),
 ('N', 'Bebop', 'Leonardo'),
 ('T', 'Rocksteady', 'Donatello')]

Un objeto `zip` funciona como un iterador, eso quiere decir que podemos aplicar la función `next()` en él.

In [5]:
result = zip(title, villians, turtles)
next(result)

('T', 'Shredder', 'Raphael')

In [6]:
next(result)

('M', 'Krang', 'Michelangelo')

> Nota: Solo se puede iterar 1 sola vez en el `zip` object. Es decir, solo se puede hacer 1 `for loop` en el `zip`. Lo mismo aplica cuando construyes una lista.

In [7]:
for item in result:
    print(item)

('N', 'Bebop', 'Leonardo')
('T', 'Rocksteady', 'Donatello')


In [8]:
for item in result:
    print(item)

¿Qué pasa cuando pasas iterables de diferentes tamaños a un `zip`?

In [9]:
title = 'Teenage Mutant Ninja Turtles'
villians = ['Shredder', 'Krang', 'Bebop', 'Rocksteady']
turtles = {
    'Raphael': 'Sai', 'Michelangelo': 'Nunchaku',
    'Leonardo': 'Twin katana', 'Donatello': 'bo'
}

result = zip(title, villians, turtles)

for item in result:
    print(item)

('T', 'Shredder', 'Raphael')
('e', 'Krang', 'Michelangelo')
('e', 'Bebop', 'Leonardo')
('n', 'Rocksteady', 'Donatello')


Podemos ver que el `zip` corresponde a la longitud del `item` **más corto**

Los `zip` se pueden operar en **reversa**.

In [11]:
# Digamos que este está en 'rows'
turtle_masks = [
    ('Raphael', 'red'), ('Michelangelo', 'orange'),
    ('Leonardo', 'blue'), ('Donatello', 'purple')
]

result = zip(*turtle_masks)

# El resultado representa 2 tuplas: una con nombres y otra con colores
print(list(result))

[('Raphael', 'Michelangelo', 'Leonardo', 'Donatello'), ('red', 'orange', 'blue', 'purple')]


De igual manera, operando los `zip` en reversa, si una tupla es de mayor longitud, el objeto `zip` toma en cuenta solo la longitud de la tupla más corta.

In [12]:
# Las últimas 2 tuplas tienen 3 elementos
turtle_masks = [
    ('Raphael', 'red'), ('Michelangelo', 'orange'),
    ('Leonardo', 'blue', 'cyan'), ('Donatello', 'purple', 'magenta')
]

result = zip(*turtle_masks)

# El resultado muestra solo 2 tuplas
print(list(result))

[('Raphael', 'Michelangelo', 'Leonardo', 'Donatello'), ('red', 'orange', 'blue', 'purple')]


Un objeto `zip` puede ser usado para crear un `dict`, supongamos que tenemos las siguientes listas:

In [13]:
keys = ['movie', 'year', 'director']

values = [
    ['Forest Gump', 'Goodfellas', 'Se7en'],
    [1994, 1990, 1995],
    ['R. Zemeckis', 'M. Scorsese', 'D. Fincher']
]

movies = dict(zip(keys, values))

print(movies)

{'movie': ['Forest Gump', 'Goodfellas', 'Se7en'], 'year': [1994, 1990, 1995], 'director': ['R. Zemeckis', 'M. Scorsese', 'D. Fincher']}


Finalmente, podemos crear un `dataframe` a partir de ese diccionario.

In [14]:
import pandas as pd

df_movies = pd.DataFrame(movies)

print(df_movies)

         movie  year     director
0  Forest Gump  1994  R. Zemeckis
1   Goodfellas  1990  M. Scorsese
2        Se7en  1995   D. Fincher


Los `zip` object nos pueden ayudar a pasar datos de una `list()` -> `zip()` -> `dict()` -> `DataFrame()`

**Ejercicio:** Crear un `DataFrame` con las palabras en `wlist` y sus longitudes.

In [15]:
wlist = [['Python', 'creativity', 'universe'], 
         ['interview', 'study', 'job', 'university', 'lecture'], 
         ['task', 'objective', 'aim', 'subject', 'programming', 'test', 'research']]

# Create a list of tuples with words and their lengths
word_lengths = [
    (item, len(item)) for items in wlist for item in items
]

# Unwrap the word_lengths
words, lengths = zip(*word_lengths)

# Create a zip object
col_names = ['word', 'length']
result = zip(col_names, [words, lengths])

# Convert the result to a dictionary and build a DataFrame
data_frame = pd.DataFrame(dict(result))
print(data_frame)

           word  length
0        Python       6
1    creativity      10
2      universe       8
3     interview       9
4         study       5
5           job       3
6    university      10
7       lecture       7
8          task       4
9     objective       9
10          aim       3
11      subject       7
12  programming      11
13         test       4
14     research       8
