# Sequence types

<a id='seq_sequence_types'></a>

En Python, los tipos de secuencia son tipos de datos que representan una secuencia o un conjunto ordenado de elementos. Los tres tipos de secuencia integrados principales en Python son las tuplas, las cadenas y las listas.

Todas las secuencias son de base cero.

## Tuples
Una tupla es una secuencia heterogénea ordenada e inmutable. Se inicializan con valores separados por comas.

In [1]:
my_tuple = 1, 'Hello', 3.14, True
my_tuple

(1, 'Hello', 3.14, True)

El uso de paréntesis puede mejorar la legibilidad.

In [2]:
other_tuple = (False, 4, "things")
other_tuple

(False, 4, 'things')

Los paréntesis son obligatorios para tuplas vacías de tuplas de un solo elemento.

In [3]:
empty_tuple = ()
empty_tuple

()

Una vez creadas, las tuplas no se pueden modificar (inmutabilidad)

In [6]:
one_element = (2, )
print(one_element, type(one_element))

(2,) <class 'tuple'>


In [7]:
not_tuple = (2)
print(not_tuple, type(not_tuple))

2 <class 'int'>


En todas las secuencias, se accede a los elementos individuales mediante corchetes.

In [8]:
my_tuple = 1, 'Hello', 3.14, True
print(my_tuple[1])

Hello


Las tuplas son inmutables

In [9]:
my_tuple[2] = 12

TypeError: 'tuple' object does not support item assignment

## Strings
Las cadenas son secuencias inmutables de caracteres.
- Las cadenas se definen entre comillas simples (') o dobles (") alrededor del texto.
- Se puede acceder a los caracteres mediante números de índice.
- Hay disponibles diversas operaciones y métodos con cadenas.

In [10]:
my_string = "Hello, World!"
my_string

'Hello, World!'

Las cadenas también son inmutables, por lo que una vez creadas no es posible modificarlas.

In [11]:
my_string[2] = 'a'

TypeError: 'str' object does not support item assignment

## Lists

Las listas son secuencias mutables de valores heterogéneos.
- Los elementos se pueden modificar después de su creación.
- Las listas se definen mediante corchetes [] y pueden contener elementos de diferentes tipos de datos.
- Los elementos de una lista están ordenados y se puede acceder a ellos mediante un índice.
- Las listas admiten diversas operaciones, como añadir, eliminar o modificar elementos.

In [12]:
my_list = [1, 'Hello', 3.14, True]
my_list

[1, 'Hello', 3.14, True]

Las listas son mutables

In [13]:
my_list[2] = "Buddy"
my_list

[1, 'Hello', 'Buddy', True]

#### Common operations on sequences

Acceso a elementos mediante corchetes ([]) con indexación basada en 0

In [14]:
t = (15, 'Hello', 3.14, True)
s = "Hello worlds!"
l = [1, False, 'Ouch']

print(t[0])
print(s[2])
print(l[1])

15
l
False


Consultar la longitud de la secuencia usando _len_

In [18]:
print(len(t))
print(len(s))
print(len(l))

4
13
3


Puedes mezclar secuencias en cualquier número de niveles.

In [19]:
mix = [2, (True, 4, 'cat', 3.245), 'Hello']
print(type(mix))
print(len(mix))

<class 'list'>
3


In [20]:
print(mix[1])
print(type(mix[1]))
print(len(mix[1]))

(True, 4, 'cat', 3.245)
<class 'tuple'>
4


In [21]:
print(mix[1][2])
print(type(mix[1][2]))

cat
<class 'str'>


Los índices negativos se utilizan para acceder a los elementos de la secuencia en orden inverso, comenzando desde el final:
- El índice -1 corresponde al último elemento, -2 al penúltimo, y así sucesivamente.
- Los índices negativos son especialmente útiles cuando se desea acceder a los elementos del final de una secuencia sin conocer su longitud.

In [22]:
l = [1, 2, 3, 4, 5, 6, 7, 8]

print(l[-1])

print(l[-2])

print(l[-3])

8
7
6


La segmentación de secuencias en Python permite extraer una parte o una subsecuencia de una secuencia, como una lista, una tupla o una cadena. La segmentación se realiza mediante la notación de corchetes con un índice inicial, un índice final y un valor de paso opcional.

Sintaxis básica:
- La sintaxis para la segmentación es secuencia[inicio:fin:paso].
- El índice inicial es inclusivo (incluido en la segmentación) y el índice final es exclusivo (no incluido en la segmentación).
- El valor de paso especifica el incremento entre índices. Es opcional y, si no se proporciona, su valor predeterminado es 1.

In [37]:
animals = ["lion", "elephant", "tiger", "giraffe", "zebra", "monkey", "panda", "koala"]
print(animals[2:4])

['tiger', 'giraffe']


Si falta el índice de inicio, se toma el segmento desde el principio

In [35]:
print(animals[:5])

['lion', 'elephant', 'tiger', 'giraffe', 'zebra']


Si falta el índice de parada, se rebana hasta el último elemento

In [36]:
print(animals[3:])

['giraffe', 'zebra', 'monkey', 'panda', 'koala']


Si los índices de inicio y fin están vacíos, se crea una copia de la lista

In [38]:
animal_copy = animals[:]
animal_copy

['lion', 'elephant', 'tiger', 'giraffe', 'zebra', 'monkey', 'panda', 'koala']

[:] crea un nuevo objeto con todos los elementos incluidos

In [40]:
print(animals == animal_copy)

print(animals is animal_copy)

True
False


Se pueden utilizar índices negativos en sectores.

In [26]:
animals

['lion', 'elephant', 'tiger', 'giraffe', 'zebra', 'monkey', 'panda', 'koala']

In [41]:
animals[2:-2]

['tiger', 'giraffe', 'zebra', 'monkey']

El valor del paso especifica el incremento entre índices.

In [42]:
animals

['lion', 'elephant', 'tiger', 'giraffe', 'zebra', 'monkey', 'panda', 'koala']

In [47]:
animals[::3]

['elephant', 'zebra', 'koala']

In [46]:
animals[1::2]

['elephant', 'giraffe', 'monkey', 'koala']

Si el paso es negativo, los elementos se invierten.

In [31]:
animals

['lion', 'elephant', 'tiger', 'giraffe', 'zebra', 'monkey', 'panda', 'koala']

In [32]:
animals[::-1]

['koala', 'panda', 'monkey', 'zebra', 'giraffe', 'tiger', 'elephant', 'lion']

In [33]:
animals[-2::-2]

['panda', 'zebra', 'tiger', 'lion']

Operador **in** consulta si un elemento pertenece a una secuencia

In [48]:
2 in (1, 2, 3, 4)

True

In [49]:
3.14 in [1, 2, 3, 4]

False

En el caso de cadenas, se buscan subcadenas.

In [51]:
"wor" in "Hello world!"

True

In [54]:
"hello" in "Hello world!"

False

Se pueden utilizar casos más complejos

In [55]:
(4, 5) in [2, 3, (4, 5), (6, (7, 8))]

True

In [61]:
7 in [2, 3, (4, 5), (6, (7, 8))]

False

In [64]:
len(list_exa[3][1])

2

El operador **+** se utiliza para concatenar o combinar secuencias. Sirve para concatenar dos o más secuencias, creando una nueva secuencia que contiene los elementos de ambos operandos en el orden en que aparecen.

In [65]:
[1, 2, 3] + [4, 5, 6]

[1, 2, 3, 4, 5, 6]

In [66]:
('a', 'b') + ('c', 'd')

('a', 'b', 'c', 'd')

In [67]:
"Hello "+"world!"

'Hello world!'

Sólo se pueden concatenar secuencias del mismo tipo

In [69]:
[1,2]+(3,4)

TypeError: can only concatenate list (not "tuple") to list

El método _index_ devuelve la posición de un elemento

In [71]:
(3, 5, 6, 4).index(5)

1

In [72]:
(3, 4, 5, 6).index(8)

ValueError: tuple.index(x): x not in tuple

En Python, las excepciones se utilizan como recursos regulares en el código, no solo para informar condiciones anómalas.

In [75]:
# C++ like code
my_tuple = (3, 4, 5, 6)
if 8 in my_tuple:
    print(my_tuple.index(6))
else:
    print("not here!")

not here!


In [79]:
# pythonic code
try:
    print(my_tuple.index(8))
except ValueError:
    print('not there!')

not there!


Las listas tienen operadores adicionales

In [80]:
l = ['a', 'b', 'c']
l.append('d')
l

['a', 'b', 'c', 'd']

In [82]:
l.insert(1, 'qq')
l

['a', 'qq', 'b', 'c', 'd']

In [83]:
l.extend([3, 4, 5])
l

['a', 'qq', 'b', 'c', 'd', 3, 4, 5]

In [57]:
# Be carefull!
l = ['a', 'b', 'c']
l.append([3, 4, 5])
l

['a', 'b', 'c', [3, 4, 5]]

In [84]:
l = [1, 2, 3, 4, 4, 2, 1, 3, 1, 2]
l.count(2)

3

In [85]:
l.remove(4)
l

[1, 2, 3, 4, 2, 1, 3, 1, 2]

In [86]:
l = [1, 2, 3, 4, 5, 6]
l.reverse()
l

[6, 5, 4, 3, 2, 1]

In [61]:
l = [3, 6, 9, 2, 4, 5]
l.sort()
l

[2, 3, 4, 5, 6, 9]

## Diferencias entre tuplas y listas:
- Mutabilidad: Las tuplas son inmutables. Las listas, en cambio, sí lo son.
- Uso:
    - Las tuplas se suelen usar para agrupar datos relacionados cuando el orden de los elementos es importante. Por ejemplo, coordenadas (x, y) o información de una persona (nombre, edad, sexo).
    - Las listas se usan comúnmente cuando se necesita una colección de elementos que se puedan modificar o ampliar. Son adecuadas para escenarios donde se pueden agregar o eliminar elementos dinámicamente.
- Rendimiento:
    - Las tuplas generalmente consumen menos memoria y son más rápidas de crear que las listas. Dado que las tuplas son inmutables, Python puede optimizar su almacenamiento y operaciones.
    - Las listas, al ser mutables, requieren más memoria y pueden implicar una sobrecarga adicional al agregar, eliminar o modificar elementos.
- Casos de uso:
    - Las tuplas se suelen usar en situaciones donde la integridad de los datos es importante y se desea garantizar que los valores permanezcan inalterados. Son adecuadas para representar colecciones fijas de elementos relacionados. Las listas se usan comúnmente cuando se necesita almacenar y manipular una colección de datos que pueden cambiar con el tiempo. Ofrecen flexibilidad para agregar, eliminar o modificar elementos.

### Destructuring in Python

La desestructuración, también conocida como desempaquetado, es una función de Python que permite extraer elementos individuales de secuencias y asignarlos a variables en una sola instrucción. Proporciona una forma cómoda de acceder y trabajar con los elementos de una colección.

In [90]:
my_tuple = (2, 3)  
x, y = my_tuple
print(x)
print(y)

2
3


Si no hay suficientes elementos para desestructurar, se lanzará una excepción.

In [93]:
x,y,z = [3, 4]

ValueError: not enough values to unpack (expected 3, got 2)

Los valores se pueden ignorar utilizando guiones bajos: _

In [95]:
x, _, z = 3, 5, 6
print(x, z)

3 6


Para capturar colecciones de valores, puede utilizar el operador *

In [96]:
head, *tail = [1, 2, 3, 4, 5]
print(head)
print(tail)

1
[2, 3, 4, 5]


In [66]:
*head, tail = [1, 2, 3, 4, 5]
print(head)
print(tail)

[1, 2, 3, 4]
5


In [97]:
head, *middle, tail = [1, 2, 3, 4, 5]
print(head)
print(middle)
print(tail)

1
[2, 3, 4]
5


In [98]:
# Cualquier combinación es posible, pero no puede aparecer más de un *
x, _, *z, h = [1, 2, 3, 4, 5, 6]
print(x)
print(z)
print(h)

1
[3, 4, 5]
6


In [102]:
# La variable con * se puede asignar a la lista vacía
x, *y, z = [3, 5]
print(x)
print(y)
print(z)

3
[]
5


## Solved Exercises

**Exercise**. Create a list of tuples, where each tuple contains the data of a person: name, age, gender. Initialize the list with data of 3 people.

In [71]:
persons = [("Peter", 12, "M"), 
           ("Jane", 23, "F"), 
           ("Joseph", 16, "M")]
persons


[('Peter', 12, 'M'), ('Jane', 23, 'F'), ('Joseph', 16, 'M')]

a) Print the data of the last person

In [72]:
persons[-1]

('Joseph', 16, 'M')

b) Print the name of the second person

In [73]:
print(persons[1][0])

Jane


c) Print the data of a person given their name (input from the keyboard)

In [74]:
name = input("Name: ")
for idx in range(len(persons)):
    if persons[idx][0] == name:
        print(persons[idx])


Name:  Alejandro


**Exercise**. From the following list:

In [75]:
l = [3, 5, 6, 2, 4, 6, 7, 9, 12, 2, 3, 5]

a) Print the odd numbers:

In [76]:
l = [3, 5, 6, 2, 4, 6, 7, 9, 12, 2, 3, 5]
for v in l:
    if v % 2 == 0:
        print(v)

6
2
4
6
12
2


b) Count odd numbers

In [77]:
c = 0
for v in l:
    if v%2 == 1:
        c += 1
print(c)

6


c) Add all the numbers

In [78]:
s = 0
for v in l:
    s += v
print(s)

64


**Exercise**. From the following list:

In [79]:
m = [2, 3, -5, 3, 4, -2, -7, 4, 7]

a) Determine if the sum (of absolute values) of positive numbers is greater than negative numbers. Use two variables to store the sums.

In [80]:
sum_pos, sum_neg = 0, 0
for v in m:
    if v > 0:
        sum_pos += v
    else:
        sum_neg += abs(v)
print(sum_pos > sum_neg)


True


b) Create a new list with positive numbers

In [81]:
l_pos = []
for v in m:
    if v > 0:
        l_pos.append(v)
print(l_pos)

[2, 3, 3, 4, 4, 7]


**Exercise**. Given the following list

In [82]:
n = [3, 5, -9, 7, 5, 7, 8, -10, -1, 9, -6, -5, 0, 1, -6, -7, -8, -6, 9, -4]

a) Extract a list with the first 5 values

In [83]:
print(n[:5])

[3, 5, -9, 7, 5]


b) Extract a list with the last 5 values

In [84]:
print(n[-5:])

[-7, -8, -6, 9, -4]


c) Extract a list with 5 intermediate values

In [85]:
print(n[len(n)//2-2:len(n)//2+3])

[-1, 9, -6, -5, 0]


d) Extract a list with the values at even positions

In [86]:
print(n[::2])

[3, -9, 5, 8, -1, -6, 0, -6, -8, 9]


e) Calculate the difference between the first half and second half of the values

In [87]:
print(sum(n[:len(n)//2]) - sum(n[len(n)//2:]))

56


**Exercise**. Given the following list with integer values

In [88]:
l = [19, 5, 6, 16, 1, 2, 6, 7, 2, 4]

a) Create a new list with dupplicated values

In [89]:
l2 = []
for idx in range(len(l)):
    v = l[idx]
    if v in l2:
        print(v)
    else:
        l2.append(v)    

6
2


b) Create a new list with the values between 0 and 20 that does not appear in the list.

In [90]:
l2 = []
for idx in range(21):
    if idx not in l:
        l2.append(idx)
print(l2)

[0, 3, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 20]


**Exercise**. Given the following string

In [91]:
cad = "Once upon a midnight dreary, while I pondered, weak and weary"

a) Extract the first word

In [92]:
cad[:cad.index(' ')]

'Once'

b) Extract the last word (harder)

In [93]:
last_pos = len(cad) - cad[::-1].index(' ')
cad[last_pos:]

'weary'

c) Extract a list with the words

In [94]:
result = []
c = "Once upon a midnight dreary, while I pondered, weak and weary"
while len(c) > 0:
    if ' ' in c:
        idx = c.index(' ')
        if idx == 0:
            c = c[1:]
        else:
            word = c[:idx]
            result.append(word)
            c = c[idx:]
    else:
        if c != '':
            result.append(c)
            c = ""
print(result)

['Once', 'upon', 'a', 'midnight', 'dreary,', 'while', 'I', 'pondered,', 'weak', 'and', 'weary']


There is a simpler version if we know the proper method

In [95]:
c = "Once upon a midnight dreary, while I pondered, weak and weary"
print(c.split(" "))

['Once', 'upon', 'a', 'midnight', 'dreary,', 'while', 'I', 'pondered,', 'weak', 'and', 'weary']
