# TIPOS DE DATOS INTEGRADOS
Todo lo que se hace con un ordenador implica gestionar datos, los cuales se presentan en diversas formas. Estos datos incluyen la música que escuchas, las películas que ves en streaming y los PDF que abres. Incluso este texto es un archivo de datos.

Los datos pueden ser simples, como el número de hijos que una persona tiene, o complejos, como el número de transacciones que realiza un banco por día. Pueden referirse a un solo objeto o a una colección de objetos. Además, los datos pueden incluir metadatos, que son datos sobre otros datos, describiendo su estructura o contexto. En Python, los datos se representan mediante objetos, y el lenguaje ofrece una gran variedad de estructuras de datos que puedes usar o combinar para crear tus propias estructuras personalizadas.

En esta sesión, se van a cubrir los siguientes temas: 
- [Objetos en Python]()
- [¿Mutable o inmutable?]()
- [Tipos de datos]()
- [El módulo de colecciones]()
- [Enumeraciones]()

# Objetos en Python
***"Todo es un objeto en Python"***

Un objeto en Python es una colección única de datos (atributos) y comportamientos (métodos). Para entenderlo mejor, realizamos el siguiente ejemplo:
Creamos una variable y le asignamos un valor

In [2]:
number_children = 3

Lo que realiza el entorno de Python es crear un objeto. Obtiene un id, establece el tipo de dato a int (número entero) y le asigna el valor de 3. El nombre, number_children, se coloca en el espacio global de nombres que apunta al objeto creado. Por lo tanto, siempre que estemos en el espacio global de nombres, después de la ejecución de esa línea, podemos recuperar ese objeto simplemente accediendo a él a través de su nombre: number_children.

# ¿Mutable o inmutable?
La primera distinción fundamental que hace Python sobre los datos es si el valor de un objeto puede cambiar o no. Si el valor puede cambiar, el objeto se denomina mutable, mientras que si el valor no puede cambiar, el objeto se denomina inmutable.

Es muy importante entender la distinción entre mutable e inmutable porque afecta al código que se escibre; para ello, realizamos el siguiente ejemplo:

In [2]:
age = 25
print(age)
age = 26    #A
print(age)

25
26


En el código anterior, en la línea #A, pensariamos que se ha cambiado el valor de la edad, pero eso no es correcto ya que el tipo de dato *int* (que corresponde a un número entero) es inmutable. Así que, lo que esta pasando en realidad es que, en la primera linea, la variable age es un nombre que apunta a un objeto int, cuyo valor es 25. Cuando escribimos **age = 26**, lo que esta ocurriendo es la creación de otro objeto de tipo *int*, con un valor de 26 (el id de la variable también es diferente) y el nombre de la variable **age** se establece para apuntar a ese valor. Es decir, no se esta cambiando el valor de 25 por el de 26, sino que se apunta a un lugar diferente, que es el nuevo objeto *int* cuyo valor es 43. Veamos el mismo código imprimiendo también los IDs:

In [5]:
age = 25
print(id(age))
age = 26
print(id(age))

140719990381752
140719990381784


Al imprimir los IDs llamando a la función incorporada *id()* y la función *print()*, se puede observar que son diferentes. Ten en cuenta que *age* apunta a un objeto a la vez: 25 primero, luego 26 - nunca juntos.

Ahora, realizaremos el mismo ejemplo utilizando un objeto mutable. Para ello, vamos a utilizar un objeto Persona, que tiene una propiedad edad (no te preocupes por la declaración de la clase por ahora - está ahí sólo para completar):

In [4]:
class Persona:
    def __init__(self, name, age, relationship):
        self.name = name
        self.age = age
        self.relationship = relationship

my_family = Persona(name="Piero", age=27, relationship="brother")
print(my_family.age)
print(id(my_family))
print(id(my_family.age))
my_family.age = 28
print(id(my_family))
print(id(my_family.age))

27
2336941140656
140719990381816
2336941140656
140719990381848


En este caso, creamos un objeto *my_family* cuyo tipo es Persona (una clase personalizada). Al crearlo, el objeto recibe la edad de 27 años. Luego se imprime en la consola, junto con el ID del objeto, y también el ID de la edad. Se observa que incluso después de cambiar la edad a 28, el ID de *my_family* sigue siendo el mismo (mientras que el ID de edad ha cambiado). Los objetos personalizados en Python son mutables (a menos que los codifiques para que no lo sean).

# Tipos de Datos
En este apartado veremos los diferentes tipos de datos estándar que posee Python. Entre los principales se encuentran: numéricos, secuencias, mapas, clases, instancias y excepciones.


## Numéricos (or numbers)
Hay tres tipos numéricos distintos: integers, floating point numbers y complex numbers. Además, los booleanos son un subtipo de los enteros. Los enteros tiene precisión ilimitada. Los números en coma flotante se implementan normalmente usando el tipo double de C. Los números complejos tienen una parte real y otra imaginaria, ambas representadas con números en coma flotante. Adicional a ellos, la librería estándar incluye otros tipos numéricos: fractions.Fraction para números racionales y decimal.Decimal para números en coma flotante con precisión definida por el usuario.

Los tipos de datos númericos or numbers son objetos inmutables.


### Enteros (or integers)
Los números enteros en Python tienen un rango ilimitado, sujeto únicamente a la memoria virtual disponible. Es decir, no importa realmente lo grande que sea el número que quieras almacenar, siempre que quepa en la memoria de tu ordenador, Python se encargará de ello.

Los números enteros pueden ser positivos, negativos o 0 (cero). Soportan todas las operaciones matemáticas básicas.

In [1]:
a = 45
b = 18
print(f"Subtraction: {a - b}")
print(f"Addition: {a + b}")
print(f"Multiplication: {a * b}")
print(f"True division: {a / b}")
print(f"Integer division: {a // b}")
print(f"Modulo operation: {a % b}")
print(f"Power operation: {a ** b}")

Subtraction: 27
Addition: 63
Multiplication: 810
True division: 2.5
Integer division: 2
Modulo operation: 9
Power operation: 572565594852444156646728515625


Veamos cómo la división se comporta de forma diferente cuando introducimos números negativos:

In [5]:
print(f"True division: {7 / 4}")
print(f"Integer division: {7 // 4} (truncation returns 1)")
print(f"True division again: {-7 / 4} (result is opposite of previous)")
print(f"Integer division again: {-7 // 4} (result not the opposite of previous)")

True division: 1.75
Integer division: 1 (truncation returns 1)
True division again: -1.75 (result is opposite of previous)
Integer division again: -2 (result not the opposite of previous)


Este es un ejemplo interesante que sucede en Python. La división de enteros en Python siempre se redondea hacia menos infinito; por ello, en la última linea el resultado es *-2* y no *-1* como se esperaba.

Vale la pena señalar que el operador de potencia, **, también tiene una función incorporada homóloga, pow(), que se muestra en el siguiente ejemplo:

In [8]:
print(f"El resultado de 10 elevado al cubo usando la funcion pow() es: {pow(10, 3)}")
print(f"El resultado de 10 elevado al cubo usando ** es: {10 ** 3}")

El resultado de 10 elevado al cubo usando la funcion pow() es: 1000
El resultado de 10 elevado al cubo usando ** es: 1000


La función pow() permite un tercer argumento para realizar la exponenciación modular.

In [22]:
print(f"{pow(123, 4) = }")
print(f"{pow(base=123, exp=4, mod=100) = } => 228886641 % 100 == 41")
print(f"{pow(37, -1, 43) = } => # modular inverse of 37 mod 43")
print(f"{7 * 37 % 43 = } => proof the above is correct")

pow(123, 4) = 228886641
pow(base=123, exp=4, mod=100) = 41 => 228886641 % 100 == 41
pow(37, -1, 43) = 7 => # modular inverse of 37 mod 43
7 * 37 % 43 = 1 => proof the above is correct


Una buena característica introducida en Python 3.6 es la posibilidad de añadir guiones bajos en los literales numéricos (entre dígitos o especificadores de base, pero no al principio ni al final). El propósito es ayudar a que algunos números sean más legibles, como 1_000_000_000:

In [25]:
n = 1_024
print(n)
hex_n = 0x_4_0_0 # 0x400 == 1024
print(hex_n)

1024
1024


### Booleans
En Python, *True* y *False* son dos palabras clave que se utilizan para representar valores de verdad. Los booleanos son una subclase de los enteros, por lo que *True* y *False* se comportan respectivamente como 1 y 0. El equivalente de la clase *int* para los booleanos es la clase *bool*, que devuelve Verdadero o Falso. Cada objeto incorporado en Python tiene un valor en el contexto booleano, lo que significa que básicamente se evalúan como *True* o *Falso* cuando se introducen en la función bool.

In [4]:
print(f"int(True): {int(True)} => True behaves like 1")
print(f"int(False): {int(False)} => False behaves like 0")
print(f"bool(1): {bool(1)} => 1 evaluates to True in a Boolean context and so does every non-zero number")
print(f"bool(0): {bool(0)} => evaluates to False")

int(True): 1 => True behaves like 1
int(False): 0 => False behaves like 0
bool(1): True => 1 evaluates to True in a Boolean context and so does every non-zero number
bool(0): False => evaluates to False


Algunos operadores que se pueden usar son: *and*, *or*, *not*

In [3]:
print(f"not False: {not False}")
print(f"not True: {not True}")
print(f"True and True: {True and True}")
print(f"False or True: {False or True}")

not True: False
not False: True
x = True and y = True: True
x = False or y = True: True


### Números reales (or Real Numbers)
Los números reales, o números de coma flotante, se representan en Python según el formato binario de coma flotante de doble precisión IEEE 754, que se almacena en 64 bits de información divididos en tres secciones: signo, exponente y mantisa. A diferencia de otros lenguajes de programación que cuentan con dos tipos de formato coma flotante (precisión simple con 32 bits y doble con 64 bits), Python solo admite el del formato doble. 

In [1]:
pi = 3.1415926536
radius = 4.5
area = pi * (radius ** 2)
print(f"El area de un circulo con radio igual a {radius} es: {area}")

El area de un circulo con radio igual a 4.5 es: 63.617251235400005


### Números Complejos (or Complex Numbers)
Python ofrece soporte para los números complejos, los cuales son números que pueden expresarse de la forma *a + bi*, donde *a* y *b* son números reales y el valor *i* corresponde a la unidad imaginaria (es decir, la raiz cuadrada de -1).

In [26]:
print(f"{3.14 + 2.73j = } y {complex(real=3.14, imag=2.73) = } son iguales.")
print(f"La parte real es: {complex(real=3.14, imag=2.73).real}")
print(f"La parte imaginaria es: {complex(3.14, 2.73).imag}")
print(f"El conjugado de 3.14+2.73j es: {complex(3.14, 2.73).conjugate()}")
print(f"El doble de 3.14+2.73j es: {complex(3.14, 2.73) * 2}")
print(f"El cuadrado de 3.14+2.73j es: {complex(3.14, 2.73) ** 2}")
print(f"La resta de 3.14+2.73j y 1+1j es: {complex(3.14, 2.73) - complex(1,1)}")

3.14 + 2.73j = (3.14+2.73j) y complex(real=3.14, imag=2.73) = (3.14+2.73j) son iguales.
La parte real es: 3.14
La parte imaginaria es: 2.73
El conjugado de 3.14+2.73j es: (3.14-2.73j)
El doble de 3.14+2.73j es: (6.28+5.46j)
El cuadrado de 3.14+2.73j es: (2.4067000000000007+17.1444j)
La resta de 3.14+2.73j y 1+1j es: (2.14+1.73j)


### Fracciones y Decimales (or Fractions and decimals)
Las fracciones tienen un numerador y un denominador racionales en sus formas más bajas.

In [14]:
from fractions import Fraction
print(f"El siguiente codigo Fraction(10,6) da como resultado: {Fraction(10,6)}")
print(f"La siguiente operacion Fraction(1, 3) + Fraction(2, 3) da como resultado: {Fraction(1, 3) + Fraction(2, 3)}")


El siguiente codigo Fraction(10,6) me da como resultado: 5/3
La siguiente operacion Fraction(1, 3) + Fraction(2, 3) da como resultado: 1


Aunque los objetos *Fraction* pueden ser muy útiles en ocasiones, no es tan común verlos en la práctica. En cambio, es mucho más habitual ver números decimales que se utilizan en todos aquellos contextos en los que la precisión lo es todo; por ejemplo, en cálculos científicos y financieros.

In [27]:
from decimal import Decimal as D
print(f"pi, from float, so approximation issues: {D(3.14)}")
print(f"pi, from a string, so no approximation issues: {D('3.14')}")
print(f"from float, we still have the i de D(0.1) * D(3) - D(0.3) es: {D(0.1) * D(3) - D(0.3)}")
print(f"from string, all perfect de D('0.1') * D(3) - D('0.3') es: {D('0.1') * D(3) - D('0.3')}")
print(f"{D('1.4').as_integer_ratio() = }")

pi, from float, so approximation issues: 3.140000000000000124344978758017532527446746826171875
pi, from a string, so no approximation issues: 3.14
from float, we still have the i de D(0.1) * D(3) - D(0.3) es: 2.775557561565156540423631668E-17
from string, all perfect de D('0.1') * D(3) - D('0.3') es: 0.0
D('1.4').as_integer_ratio() = (7, 5)


## Secuencias inmuables (or immutable sequences)
Empecemos por las secuencias inmutables: strings, tuples y bytes.

### Strings and bytes
Los datos textuales en Python se manejan con objetos *str*, más comúnmente conocidos como strings (cadenas). Son secuencias inmutables de puntos de código Unicode. Python, a diferencia de otros lenguajes, no tiene un tipo *char*, por lo que un único carácter se representa simplemente mediante un *string* de longitud 1.

Unicode es una forma excelente de manejar datos. Sin embargo, cuando se trata de almacenar datos textuales, o enviarlos por la red, es probable que desee codificarlos, utilizando una codificación apropiada para el medio que está utilizando. El resultado de una codificación produce un objeto *bytes*, cuya sintaxis y comportamiento es similar al de los *strings*. Los literales de *strings* se escriben en Python utilizando comillas simples, dobles o triples. Si se construye con comillas triples, una cadena puede abarcar varias líneas.

In [2]:
# 4 ways to make a string
print(f"{'This is a string. We built it with single quotes.'}")
print(f"{"This is also a string, but built with double quotes."}")
print(f"{'''This is built using triple quotes,
so it can span multiple lines.'''}")
print(f"{"""This too
is a multiline one
built with triple double-quotes."""}")
print(f"El numero de caracteres que tiene la palabra semaforo es: {len("semaforo")}")

This is a string. We built it with single quotes.
This is also a string, but built with double quotes.
This is built using triple quotes,
so it can span multiple lines.
This too
is a multiline one
built with triple double-quotes.
El numero de caracteres que tiene la palabra semaforo es: 8


Python cuenta con dos nuevos métodos que remueven el sufijo (*removesuffix*) y prefijo (*removeprefix*) de un *string*.

In [5]:
my_name = "Nicolas"
print(f"El resultado de remover el prefijo {repr("N")} de {repr(my_name)} es: {my_name.removeprefix("N")}")
print(f"El resultado de remover el sufijo {repr("as")} de {repr(my_name)} es: {my_name.removesuffix("as")}")
print(f"El resultado de remover el prefijo {repr("X")} de {repr(my_name)} es: {my_name.removeprefix("X")}")

El resultado de remover el prefijo 'N' de 'Nicolas' es: icolas
El resultado de remover el sufijo 'as' de 'Nicolas' es: Nicol
El resultado de remover el prefijo 'X' de 'Nicolas' es: Nicolas


### Encoding and decoding strings
Utilizando los métodos encode/decode, podemos codificar *Unicode strings* y decodificar objetos *bytes*. UTF-8 es una codificación de caracteres de longitud variable, capaz de codificar todos los puntos de código Unicode posibles. Es la codificación más utilizada para la web. Observa también que al añadir el literal *b* delante de una declaración de *string*, estamos creando un objeto *bytes*.

In [28]:
unicode_string = "This is üŋíc0de" # unicode string: code points
print(type(unicode_string))
encoded_unicode_string = unicode_string.encode(encoding="utf-8")
print(f"El resultado es un objeto {repr("bytes")}: {encoded_unicode_string}")
print(f"Con la funcion {repr("decode")} el string regresa a su estado inicial: {encoded_unicode_string.decode("utf-8")}")
print(f"Para crear un objeto {repr("bytes")} se utiliza el prefijo {repr("s")} al inicio: {b"Nicolas"}, {type(b"Nicolas")}")

<class 'str'>
El resultado es un objeto 'bytes': b'This is \xc3\xbc\xc5\x8b\xc3\xadc0de'
Con la funcion 'decode' el string regresa a su estado inicial: This is üŋíc0de
Para crear un objeto 'bytes' se utiliza el prefijo 's' al inicio: b'Nicolas', <class 'bytes'>


### Indexing and slicing strings
Al manipular secuencias (or sequences), es muy común acceder a ellas en una posición precisa (indexing), o sacar de ellas una subsecuencia (slicing). Cuando se trata de secuencias inmutables, ambas operaciones son de sólo lectura.
La indexación comienza desde el 0, en cambio, con el slicing puedes especificar las posiciones de inicio y fin, junto con el paso. Se separan con dos puntos (:), así: *mi_secuencia[inicio:parada:paso]*. Todos los argumentos son opcionales; inicio es inclusivo y parada es excluyente.

In [66]:
title_book = "Las intermitencias de la muerte"
author_book = "Jose Saramago"
print(f"El autor del libro {title_book} es {author_book}.")
print(f"La posición 0 del título del libro es: {title_book[0] = } que corresponde al primer caracter.")
print(f"La posición 5 del título del libro es: {title_book[5] = } que corresponde al sexto caracter.")
print(f"La posición -2 del título del libro es: {title_book[-2] = } que corresponde al penúltimo caracter.")
print(f"La posición -1 del título del libro es: {title_book[-1] = } que corresponde al último caracter.")
print(f"Se especifica la posición inicial en 4: {title_book[4:] = }")
print(f"Se especifica la posición final en 10: {title_book[:10] = }")
print(f"Se especifica la posición inicial en 3 y la final en 8: {title_book[3:8] = }")
print(f"Se especifica la posición inicial en 3, la final en 12 y se detiene cada 2 caracteres: {title_book[3:12:2] = }")
print(f"Para copiar todo la secuencia: {title_book[:] = }")


El autor del libro Las intermitencias de la muerte es Jose Saramago.
La posición 0 del título del libro es: title_book[0] = 'L' que corresponde al primer caracter.
La posición 5 del título del libro es: title_book[5] = 'n' que corresponde al sexto caracter.
La posición -2 del título del libro es: title_book[-2] = 't' que corresponde al penúltimo caracter.
La posición -1 del título del libro es: title_book[-1] = 'e' que corresponde al último caracter.
Se especifica la posición inicial en 4: title_book[4:] = 'intermitencias de la muerte'
Se especifica la posición final en 10: title_book[:10] = 'Las interm'
Se especifica la posición inicial en 3 y la final en 8: title_book[3:8] = ' inte'
Se especifica la posición inicial en 3, la final en 12 y se detiene cada 2 caracteres: title_book[3:12:2] = ' nemt'
Para copiar todo la secuencia: title_book[:] = 'Las intermitencias de la muerte'


### String formatting
Una de las características de los *strings* es que pueden utilizarse como plantilla. Hay varias formas diferentes de dar formato a un *string*, como son las siguientes:

In [10]:
greet_old = 'Hello %s!'
print(f"{greet_old % 'Nicolas' = }")
greet_positional = "Hello {}!"
print(f"{greet_positional.format("Nicolas") = }")
greet_positional = 'Hello {} {}!'
print(f"{greet_positional.format('Nicolas', 'Marroquin') = }")
greet_positional_idx = 'This is {0}! {1} loves {0}!'
print(f"{greet_positional_idx.format('Python', 'Nicolas') = }")
keyword = 'Hello, my name is {name} {last_name}'
print(f"{keyword.format(name='Nicolas', last_name='Marroquin') = }")
name = "Nicolas"
age = 26
print(f"Hello! My name is {name} and I'm {age}")
user = "Nicolas"
password = "super-secret"
print(f"Log in with: {user} and {password}")
print(f"Log in with: {user = } and {password = }")

greet_old % 'Nicolas' = 'Hello Nicolas!'
greet_positional.format("Nicolas") = 'Hello Nicolas!'
greet_positional.format('Nicolas', 'Marroquin') = 'Hello Nicolas Marroquin!'
greet_positional_idx.format('Python', 'Nicolas') = 'This is Python! Nicolas loves Python!'
keyword.format(name='Nicolas', last_name='Marroquin') = 'Hello, my name is Nicolas Marroquin'
Hello! My name is Nicolas and I'm 26
Log in with: Nicolas and super-secret
Log in with: user = 'Nicolas' and password = 'super-secret'


### Tuples
El último tipo de secuencia inmutable que vamos a ver aquí son las *tuples*. Corresponde a una secuencia de objetos arbitrarios de Python. En una declaración de tupla, los elementos están separados por comas. Como son inmutables, las *tuples* pueden utilizarse como claves para diccionarios. 

Las *tuples* son los datos incorporados en Python que más se aproximan a un vector matemático. Sin embargo, esto no significa que fue la razón por la que se crearon. Por lo general, las *tuples* suelen contener una secuencia heterogénea de elementos mientras que, por el contrario, las listas son, la mayoría de las veces, homogéneas. Además, normalmente se accede a las *tuples* mediante desempaquetado o indexación, mientras que normalmente se itera sobre las listas.

In [3]:
tuple_empty = ()
print(f"{tuple_empty}")
print(f"{type(tuple_empty)}")
one_element_tuple = (42,)
three_element_tuple = (54, 65, 80)
type(one_element_tuple)
a, b, c = 5, 10, 15
print(f"{a, b, c}")
print(f"{3 in three_element_tuple = }")
d, e = 54,  80
e, d = d, e
d, e

()
<class 'tuple'>
(5, 10, 15)
3 in three_element_tuple = False


(80, 54)

## Secuencias mutables (or mutable sequences)
Las secuencias mutables difieren de sus homólogas inmutables en que pueden modificarse después de su creación. Existen dos tipos de secuencias mutables en Python: lists y los byte arrays.

### Lists
*Python lists* son muy similares a las *tuples*, pero no tienen las restricciones de la inmutabilidad. Las *lists* se utilizan habitualmente para almacenar colecciones de objetos homogéneos, pero nada impide almacenar también colecciones heterogéneas. Estas se pueden crear de muchas formas diferentes.

In [10]:
print(f"Una list se puede crear así {[] = } o cambiar un tipo de dato con {list() = }")
print(f"Las lists pueden cambiar, como en el siguiente ejemplo: {[x + 5 for x in [2, 3, 4]] = }")
print(f"La list descompone los caracteres de un string de la siguiente forma: {list("Nicolas") = }")
first_list = [5, 6, 7]
first_list.append(8) # Se agrega un termino a la lista
first_list.count(5) # Cuenta el numero de 5s que hay en la lista
first_list.extend((5, 7)) # Extiende la lista usando otra lista o tupla
first_list.index(7) # Te devuelve la primera posición del elemento colocado
first_list.insert(0, 15) # Inserta un elemento en la lista en la posición asignada
first_list.pop() # Elimina y retorna el ultimo elemento de la lista
first_list.pop(2) # Elimina y retorna el elemento de posicion 2 de la lista
first_list.remove(5) # Remueve el primer elemento cuyo valor es 5
first_list.reverse() # Invierte el orden de la lista
first_list.sort() # Ordena la lista
first_list.clear() # Limpia todos los valores de la lista
second_list = [5, 8, 10, -5, 20]
min(second_list) # Devulve el valor mínimo de los elementos de la lista
max(second_list) # Devuelve el valor máximo de los elementos de la lista
sum(second_list) # Devuelve la suma de los elementos de la lista
from math import prod
from typing import Iterable
prod(second_list) # Devuelve el producto de los elementos de la lista
len(second_list) # Devulve el numero de elementos que tiene la lista
three_list = [5, 4, 3]
second_list + three_list # Concatena la listas usando +
second_list * 2  # Concatena la lista dos veces usando *
from operator import itemgetter
four_list = [(6, 3), (1, 3), (1, 2), (2, -1), (4, 10)]
sorted(four_list) # Ordena la lista de forma ascendente
sorted(four_list, key=itemgetter(0)) # Orden los elementos de la lista solo guiandose del primer elemento de la tupla
sorted(four_list, key=itemgetter(0,1)) # Similar a sorted(four_list)
sorted(four_list, key=itemgetter(1)) # Ordena en base al segundo elemento de la tupla
sorted(four_list, key=itemgetter(1, 0)) # Ordena en base al segundo y luego el primer elemento de la tupla
sorted(four_list, key=itemgetter(1), reverse=True) # Ordena en base al segundo elemento de la tupla y lo invierte

Una list se puede crear así [] = [] o cambiar un tipo de dato con list() = []
Las lists pueden cambiar, como en el siguiente ejemplo: [x + 5 for x in [2, 3, 4]] = [7, 8, 9]
La list descompone los caracteres de un string de la siguiente forma: list("Nicolas") = ['N', 'i', 'c', 'o', 'l', 'a', 's']


[(2, -1), (1, 2), (1, 3), (6, 3), (4, 10)]

### Bytearrays
Para concluir nuestra visión general de los tipos de secuencia mutables, dediquemos un momento al tipo *bytearray*. Básicamente, representan la versión mutable de los objetos *bytes*. Exponen la mayoría de los métodos habituales de las secuencias mutables, así como la mayoría de los métodos del tipo *bytes*. Los elementos de un *bytearray* son enteros en el rango [0, 256).

In [14]:
bytearray()
bytearray(10)
bytearray(range(5))
name = bytearray(b'Lina')
name.replace(b'L', b'l')
name.endswith(b'na')
name.upper()
name.count(b'L')

1

## Set types
Python también proporciona dos tipos de conjuntos, *set* y *frozenset*. El tipo *set* es mutable, mientras que *frozenset* es inmutable. Son colecciones desordenadas de objetos inmutables. La *hashabilidad* es una característica que permite utilizar un objeto como miembro de un conjunto y como clave de un diccionario, como veremos muy pronto. Tener en cuenta que los objetos que se comparan por igualdad deben tener el mismo valor *hash*.

In [14]:
# Mutables
small_par = set()
small_par.add(6)
small_par.add(8)
small_par.add(10)
small_par
small_par.add(4)
small_par
small_par.remove(6)
3 in small_par
print(f"{3 in small_par = }")
print(f"{3 not in small_par = }")
print(f"{small_par = }")
small_par.add(10)
print(f"{small_par = }")
small_impar = {1, 3, 5, 8, 9}
print(f"{small_impar = }")
print(f"{small_par | small_impar = }")
print(f"{small_par & small_impar = }")
print(f"{small_par - small_impar = }")
print(f"{small_impar - small_par = }")
print(f"{small_par ^ small_impar = }")

3 in small_par = False
3 not in small_par = True
small_par = {8, 10, 4}
small_par = {8, 10, 4}
small_impar = {1, 3, 5, 8, 9}
small_par | small_impar = {1, 3, 4, 5, 8, 9, 10}
small_par & small_impar = {8}
small_par - small_impar = {10, 4}
small_impar - small_par = {1, 3, 5, 9}
small_par ^ small_impar = {1, 3, 4, 5, 9, 10}


Ahora toca algunos ejemplos usando la la contraparte inmutable del tipo set, frozenset:

In [23]:
small_primes = frozenset([2, 3, 5, 7])
bigger_primes = frozenset([5, 7, 11])
try:
    small_primes.add(11)
except Exception as e:
    print(f"El siguiente comando small_primes.add(11) da como resultado: {e = }")
small_primes & bigger_primes # Intersección, unión, entre otros siempre funcionan
small_primes | bigger_primes
small_primes - bigger_primes

El siguiente comando small_primes.add(11) da como resultado: e = AttributeError("'frozenset' object has no attribute 'add'")


frozenset({2, 3})

## Mapping types: dictionaries
De todos los tipos de datos incorporados en Python, el *dictionary* es sin duda el más interesante. Es el único tipo de asignación estándar, y es la columna vertebral de cada objeto Python.

Un *dictionary* asigna claves a valores. Las claves deben ser objetos *hashables*, mientras que los valores pueden ser de cualquier tipo. Los diccionarios también son objetos mutables. Hay bastantes maneras diferentes de crear un diccionario, las cuales son:

In [36]:
first_dictionary = dict(A=1, B=2, C=3)
second_dictionary = {"A": 1, "B": 2, "C": 3}
third_dictionary = dict(zip(["A", "B", "C"], [1, 2, 3]))
fourth_dictionary = dict([("A", 1), ("B", 2), ("C", 3)])
fifth_dictionary = dict({"C": 3, "B": 2, "A": 1})
first_dictionary == second_dictionary == third_dictionary == fourth_dictionary == fifth_dictionary
first_dictionary is second_dictionary # No solo compara los valores sino tambien el espacio en memoria
list(zip(['h', 'e', 'l', 'l', 'o'], [1, 2, 3, 4, 5]))
list(zip('hello', range(1, 6)))


[('h', 1), ('e', 2), ('l', 3), ('l', 4), ('o', 5)]

Algunos métodos para manipular los *dictionaries* son:

In [68]:
dictionary_manipulation = {}
dictionary_manipulation["a"] = 1
dictionary_manipulation["b"] = 2
print(f"{dictionary_manipulation = }")
print(f"Para mostrar el número de elementos en el diccionario: {len(dictionary_manipulation) = }")
del dictionary_manipulation["a"]
print(f"Usando el método {repr("del")} removemos un valor del dictionary: {dictionary_manipulation =}")
dictionary_manipulation["c"] = 4
print(f"La clave {repr("c")} esta en el dictionary: {"c" in dictionary_manipulation}")
print(f"La clave {repr("3")} esta en el dictionary: {3 in dictionary_manipulation}")
dictionary_manipulation.clear() # Elimina todos los elementos del dictionary
dictionary_manipulation = dict(zip('Nicolas', range(7)))
print(f"{dictionary_manipulation = }")
dictionary_manipulation.keys()
dictionary_manipulation.values()
dictionary_manipulation.items()
3 in dictionary_manipulation.values()
("o", 3) in dictionary_manipulation.items()
dictionary_manipulation.pop("N") # Elimina la clave "N" con su valor
dictionary_manipulation.popitem() # Elimina una clave aleatoria y la muestra
dictionary_manipulation.update({'h': 4, 'd': 5}) # Agrega dos elementos, si se repite la clave, actualiza el valor
dictionary_manipulation.pop("not-a-key", "default-value")
print(f"{dictionary_manipulation.get("x") = }") # Si no existe la clave, devuelve el valor none
print(f"{dictionary_manipulation.get("x", 177) = }") # Si no existe la clave, arroja el valor del segundo parametro
dictionary_manipulation.setdefault("z", 15) # Si no existe la clave, la crea y le asigna un valor
dictionary_manipulation.clear()
dictionary_manipulation.setdefault("a", {}).setdefault("b", []).append(1)
dictionary_manipulation

dictionary_manipulation = {'a': 1, 'b': 2}
Para mostrar el número de elementos en el diccionario: len(dictionary_manipulation) = 2
Usando el método 'del' removemos un valor del dictionary: dictionary_manipulation ={'b': 2}
La clave 'c' esta en el dictionary: True
La clave '3' esta en el dictionary: False
dictionary_manipulation = {'N': 0, 'i': 1, 'c': 2, 'o': 3, 'l': 4, 'a': 5, 's': 6}
dictionary_manipulation.get("x") = None
dictionary_manipulation.get("x", 177) = 177


{'a': {'b': [1]}}

Python 3.9 dispone de un nuevo operador de unión para objetos dict, que fue introducido por PEP 584. Cuando se trata de aplicar la unión a objetos *dict*, necesitamos recordar que la unión para ellos no es conmutativa. Esto se hace evidente cuando los dos objetos *dict* que estamos fusionando tienen una o más claves en común, como se muestran en los siguientes ejemplos:

In [80]:
dict_one = dict(zip("nicolas", range(15, 22)))
dict_two = dict(zip("piero", range(5,10)))
print(f"La union del {dict_one = } \ny el {dict_two = } es: \n{dict_one | dict_two = }")
print(f"La union del {dict_two = } \ny el {dict_one = } es: \n{dict_two | dict_one = }")
print(f"La union del {dict_one = } \ny el {dict_two = } es: \n{({**dict_one, **dict_two}) = }")
print(f"La union del {dict_two = } \ny el {dict_one = } es: \n{({**dict_two, **dict_one}) = }")
dict_one |= dict_two
print(dict_one)

La union del dict_one = {'n': 15, 'i': 16, 'c': 17, 'o': 18, 'l': 19, 'a': 20, 's': 21} 
y el dict_two = {'p': 5, 'i': 6, 'e': 7, 'r': 8, 'o': 9} es: 
dict_one | dict_two = {'n': 15, 'i': 6, 'c': 17, 'o': 9, 'l': 19, 'a': 20, 's': 21, 'p': 5, 'e': 7, 'r': 8}
La union del dict_two = {'p': 5, 'i': 6, 'e': 7, 'r': 8, 'o': 9} 
y el dict_one = {'n': 15, 'i': 16, 'c': 17, 'o': 18, 'l': 19, 'a': 20, 's': 21} es: 
dict_two | dict_one = {'p': 5, 'i': 16, 'e': 7, 'r': 8, 'o': 18, 'n': 15, 'c': 17, 'l': 19, 'a': 20, 's': 21}
La union del dict_one = {'n': 15, 'i': 16, 'c': 17, 'o': 18, 'l': 19, 'a': 20, 's': 21} 
y el dict_two = {'p': 5, 'i': 6, 'e': 7, 'r': 8, 'o': 9} es: 
({**dict_one, **dict_two}) = {'n': 15, 'i': 6, 'c': 17, 'o': 9, 'l': 19, 'a': 20, 's': 21, 'p': 5, 'e': 7, 'r': 8}
La union del dict_two = {'p': 5, 'i': 6, 'e': 7, 'r': 8, 'o': 9} 
y el dict_one = {'n': 15, 'i': 16, 'c': 17, 'o': 18, 'l': 19, 'a': 20, 's': 21} es: 
({**dict_two, **dict_one}) = {'p': 5, 'i': 16, 'e': 7, 'r': 8, 

## Dates and times
La biblioteca estándar de Python proporciona varios tipos de datos que se pueden utilizar para tratar con fechas y horas. Este ámbito puede parecer sencillo a primera vista, pero en realidad es bastante complicado: zonas horarias, horario de verano, entre otros complica su manipulación.

Las principales bibliotecas estándar que tiene Python para trabajar con *dates and times* son: *datetime*, *calendar*, *zoneinfo* y *time*.

In [1]:
from datetime import date, datetime, time, timedelta, timezone
import time
import calendar as cal
from zoneinfo import ZoneInfo

Algunos ejemplos con *dates* son:

In [30]:
today = date.today()
now = datetime.now()
print(f"La fecha de hoy es: {today = }")
print(f"La fecha y hora actual es: {now = }")
print(f"La fecha actual es: {now.date() = } y la hora es: {now.time() = }")
print(f"La hora actual es: {now.timetz() = }")
print(f"El año actual es:  {now.year = }")
print(f"El mes actual es: {now.month = }")
print(f"El día actual es: {now.day = }")
print(f"La hora actual es: {now.hour = }, los segundos: {now.second = } y los microsegundos: {now.microsecond = }")
print(f"{today.ctime() = }")
print(f"{today.isoformat() = }")
print(f"{today.isocalendar() = }")
print(f"El dia en formato numerico (comenzando desde cero) es: {today.weekday()}")
print(f"El nombre del dia es: {cal.day_name[today.weekday()] = } y abreviado es: {cal.day_abbr[today.weekday()] = }")
print(f"{today.day, today.month, today.year = }")
print(f"El ordinal de la fecha {today.isoformat() = } es: {today.toordinal() = }")
print(f"{today.timetuple()}")

La fecha de hoy es: today = datetime.date(2024, 7, 12)
La fecha y hora actual es: now = datetime.datetime(2024, 7, 12, 18, 18, 28, 511201)
La fecha actual es: now.date() = datetime.date(2024, 7, 12) y la hora es: now.time() = datetime.time(18, 18, 28, 511201)
La hora actual es: now.timetz() = datetime.time(18, 18, 28, 511201)
El año actual es:  now.year = 2024
El mes actual es: now.month = 7
El día actual es: now.day = 12
La hora actual es: now.hour = 18, los segundos: now.second = 28 y los microsegundos: now.microsecond = 511201
today.ctime() = 'Fri Jul 12 00:00:00 2024'
today.isoformat() = '2024-07-12'
today.isocalendar() = datetime.IsoCalendarDate(year=2024, week=28, weekday=5)
El dia en formato numerico (comenzando desde cero) es: 4
El nombre del dia es: cal.day_name[today.weekday()] = 'Friday' y abreviado es: cal.day_abbr[today.weekday()] = 'Fri'
today.day, today.month, today.year = (12, 7, 2024)
El ordinal de la fecha today.isoformat() = '2024-07-12' es: today.toordinal() = 73907

Ahora, juguemos un poco con *time*:

In [44]:
print(f"La fecha actual es: {time.ctime() = }")
print(f"Devuelve un valor entero distinto de cero cuando se define el horario de verano (DST); de lo contrario, devuelve 0: {time.daylight = }")
print(f"La fecha y hora actual es: {time.gmtime() = }")
print(f"La fecha y hora actual es: {time.localtime() = }")
print(f"La hora actual en formato utc es: {time.time() = }")


La fecha actual es: time.ctime() = 'Fri Jul 12 23:27:44 2024'
Devuelve un valor entero distinto de cero cuando se define el horario de verano (DST); de lo contrario, devuelve 0: time.daylight = 0
La fecha y hora actual es: time.gmtime() = time.struct_time(tm_year=2024, tm_mon=7, tm_mday=13, tm_hour=4, tm_min=27, tm_sec=44, tm_wday=5, tm_yday=195, tm_isdst=0)
La fecha y hora actual es: time.localtime() = time.struct_time(tm_year=2024, tm_mon=7, tm_mday=12, tm_hour=23, tm_min=27, tm_sec=44, tm_wday=4, tm_yday=194, tm_isdst=0)
time.time() = 1720844864.9889536


Algunos ejemplos usando el objeto *datetime*, que simplifica los *dates* y *times*

In [72]:
now = datetime.now()
print(f"La fecha y hora actual es: {now = }")
print(f"La fecha actual es: {now.date() = }")
print(f"La hora actual es: {now.time() = }")
print(f"{now.day, now.month, now.year = }")
print(f"El ordinal de la fecha {now.isoformat() = } es: {now.toordinal() = }")
print(f"{now.date() == date.today() = }")
print(f"{now.hour, now.minute, now.second, now.microsecond = }")
print(f"{now.timetuple() = }")
print(f"{now.ctime() = }")
print(f"{now.tzinfo = }")
f_bday = datetime(1975, 12, 29, 12, 50, tzinfo=ZoneInfo('Europe/Rome'))
h_bday = datetime(1981, 10, 7, 15, 30, 50, tzinfo=timezone(timedelta(hours=2)))
diff = h_bday - f_bday
print(f"La diferencia entre {h_bday} y {f_bday} es: {diff = }")
print(f"EL tipo de dato es: {type(diff)}")
print(f"El número de dias es: {diff.days = }")
print(f"El total de segundos es: {diff.total_seconds() = }")
print(f"La fecha actual más 49 días es: {today+timedelta(days= 49) = }")
print(f"La fecha actual más una semana es: {now + timedelta(weeks=1)}")
print(f"{datetime.fromisoformat('1977-11-24T19:30:13+01:00') = }")
print(f"{datetime.fromtimestamp(time.time()) = }")

La fecha y hora actual es: now = datetime.datetime(2024, 7, 13, 0, 1, 36, 240801)
La fecha actual es: now.date() = datetime.date(2024, 7, 13)
La hora actual es: now.time() = datetime.time(0, 1, 36, 240801)
now.day, now.month, now.year = (13, 7, 2024)
El ordinal de la fecha now.isoformat() = '2024-07-13T00:01:36.240801' es: now.toordinal() = 739080
now.date() == date.today() = True
now.hour, now.minute, now.second, now.microsecond = (0, 1, 36, 240801)
now.timetuple() = time.struct_time(tm_year=2024, tm_mon=7, tm_mday=13, tm_hour=0, tm_min=1, tm_sec=36, tm_wday=5, tm_yday=195, tm_isdst=-1)
now.ctime() = 'Sat Jul 13 00:01:36 2024'
now.tzinfo = None
La diferencia entre 1981-10-07 15:30:50+02:00 y 1975-12-29 12:50:00+01:00 es: diff = datetime.timedelta(days=2109, seconds=6050)
EL tipo de dato es: <class 'datetime.timedelta'>
El número de dias es: diff.days = 2109
El total de segundos es: diff.total_seconds() = 182223650.0
La fecha actual más 49 días es: today+timedelta(days= 49) = datetime.

Existen algunas bibliotecas de terceros que son muy útiles a la hora de trabajar con *dates* y *times*:
- *dateutil*: Potente extensión para *datetime* (https://dateutil.readthedocs.io/en/stable/)
- *Arrow*: Mejores *dates* y *times* para Python (https://arrow.readthedocs.io/en/latest/)
- *pytz*: Definiciones de zonas horarias mundiales para Python (https://pythonhosted.org/pytz/)

Algunos ejemplos con la biblioteca *Arrow* son:

In [1]:
# pip install arrow
import arrow
print(f"La fecha y hora actual en tiempo universal es: {arrow.utcnow() = }")
print(f"La fecha y hora actual en mi ubicación actual es: {arrow.now() = }")
print(f"La fecha y hora actual en Europe - Rome es: {arrow.now('Europe/Rome') = }")
local_rome = arrow.now('Europe/Rome')
print(f"{local_rome.to("utc") = }")
print(f"{local_rome.to("Europe/Moscow") = }")
print(f"{local_rome.to("Asia/Tokyo") = }")
print(f"{local_rome.format('YYYY-MM-DD HH:mm:ss ZZ')}")
print(f"{local_rome.datetime = }")
print(f"{local_rome.isoformat = }")

La fecha y hora actual en tiempo universal es: arrow.utcnow() = <Arrow [2024-07-18T06:23:22.320961+00:00]>
La fecha y hora actual en mi ubicación actual es: arrow.now() = <Arrow [2024-07-18T01:23:22.320961-05:00]>
La fecha y hora actual en Europe - Rome es: arrow.now('Europe/Rome') = <Arrow [2024-07-18T08:23:22.535677+02:00]>
local_rome.to("utc") = <Arrow [2024-07-18T06:23:22.535677+00:00]>
local_rome.to("Europe/Moscow") = <Arrow [2024-07-18T09:23:22.535677+03:00]>
local_rome.to("Asia/Tokyo") = <Arrow [2024-07-18T15:23:22.535677+09:00]>
2024-07-18 08:23:22 +02:00
local_rome.datetime = datetime.datetime(2024, 7, 18, 8, 23, 22, 535677, tzinfo=tzfile('Europe/Rome'))
local_rome.isoformat = <bound method Arrow.isoformat of <Arrow [2024-07-18T08:23:22.535677+02:00]>>


## The collections module
Cuando los contenedores incorporados de propósito general de Python (tuple, list, set y dict) no son suficientes, podemos encontrar contenedores especializados en el módulo *collections*.

| Data type | Description | 
| --- | --- |
| namedtuple() | Función de fábrica para crear subclases de *tuples* con campos con nombre |
| deque | Es una versión óptima de lista que se utiliza para insertar y eliminar elementos |
| Chainmap | Combina muchos diccionarios y devuelve una lista de diccionarios |
| Counter | Es una estructura de datos incorporada que se utiliza para contar la ocurrencia de cada valor presente en una matriz o lista |
| OrderedDict | Subclase de diccionario con métodos que permiten reordenar las entradas |
| defaultdict | Subclase de diccionario que llama a una función de fábrica para suministrar los valores que faltan |
| UserDict | Envoltura de objetos de diccionario para facilitar la subclase de dictionary |
| UserList | Envoltura de objetos de diccionario para facilitar la subclase de list |
| UserString | Envoltura de objetos de diccionario para facilitar la subclase de string |

In [104]:
from collections import namedtuple
Point = namedtuple('Point', ['x', 'y'])
p = Point(11, 22)
print(f"La coordenada x es: {p.x = }")
print(f"La coordenada y es: {p.y = }")

La coordenada x es: p.x = 11
La coordenada y es: p.y = 22


In [105]:
from collections import defaultdict
default_dict = defaultdict(int)
print(f"El valor por defecto es: {default_dict['key'] = }")
default_dict['key'] += 1
print(f"El valor por defecto es: {default_dict['key'] = }")
print(f"El valor por defecto es: {default_dict['key2'] = }")
print(f"{default_dict = }")

El valor por defecto es: default_dict['key'] = 0
El valor por defecto es: default_dict['key'] = 1
El valor por defecto es: default_dict['key2'] = 0
default_dict = defaultdict(<class 'int'>, {'key': 1, 'key2': 0})


In [106]:
from collections import deque
d = deque(['a', 'b', 'c'])
d.append('d')
print(f"{d = }")
d.appendleft('z')
print(f"{d = }")

d = deque(['a', 'b', 'c', 'd'])
d = deque(['z', 'a', 'b', 'c', 'd'])


In [103]:
from collections import ChainMap
default_connection = {'host': 'localhost', 'port': 4567}
connection = {'port': 5678}
conn = ChainMap(connection, default_connection)
print(f"{conn = }")
print(f"{conn['host'] = }")
print(f"{conn.maps = }")
conn['host'] = 'packtpub.com'
print(f"{conn.maps = }")
del conn['port']
print(f"{conn.maps = }")
print(f"{conn['port'] = }")
print(f"{dict(conn) = }")

La coordenada x es: p.x = 11
La coordenada y es: p.y = 22
El valor por defecto es: default_dict['key'] = 0
El valor por defecto es: default_dict['key'] = 1
El valor por defecto es: default_dict['key2'] = 0
default_dict = defaultdict(<class 'int'>, {'key': 1, 'key2': 0})
d = deque(['a', 'b', 'c', 'd'])
d = deque(['z', 'a', 'b', 'c', 'd'])
conn = ChainMap({'port': 5678}, {'host': 'localhost', 'port': 4567})
conn['host'] = 'localhost'
conn.maps = [{'port': 5678}, {'host': 'localhost', 'port': 4567}]
conn.maps = [{'port': 5678, 'host': 'packtpub.com'}, {'host': 'localhost', 'port': 4567}]
conn.maps = [{'host': 'packtpub.com'}, {'host': 'localhost', 'port': 4567}]
conn['port'] = 4567
dict(conn) = {'host': 'packtpub.com', 'port': 4567}


In [107]:
from collections import Counter
c = Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    c[word] += 1
print(f"{c = }")

c = Counter({'blue': 3, 'red': 2, 'green': 1})


## Enums
Técnicamente, las enumeraciones no son un tipo de datos incorporado, ya que hay que importarlas del módulo enum, pero merece la pena mencionarlas.

La definición oficial de enumeración es que se trata de un conjunto de nombres simbólicos (miembros) ligados a valores únicos y constantes. Dentro de una enumeración, los miembros se pueden comparar por identidad, y se puede iterar sobre la propia enumeración.

Supongamos que necesitas representar semáforos; en tu código, podrías recurrir a lo siguiente:

In [110]:
color_green = 1
color_yellow = 2
color_red = 4
TRAFFIC_LIGHTS = (color_green, color_yellow, color_red)
traffic_lights = {'green': color_green, 'yellow': color_yellow, 'red': color_red}
print(f"{TRAFFIC_LIGHTS = } o en forma de dictionary {traffic_lights = }")

TRAFFIC_LIGHTS = (1, 2, 4) o en forma de dictionary traffic_lights = {'green': 1, 'yellow': 2, 'red': 4}


Este código no tiene nada de especial. De hecho, es algo muy común de encontrar. Pero, considere hacer esto en su lugar:

In [113]:
from enum import Enum
class TrafficLight(Enum):
    GREEN = 1
    YELLOW = 2
    RED = 4
print(f"{TrafficLight.GREEN = }")
print(f"{TrafficLight.GREEN.name = }")
print(f"{TrafficLight.GREEN.value = }")
print(f"{TrafficLight(1) = }")
print(f"{TrafficLight['GREEN'] = }")

TrafficLight.GREEN = <TrafficLight.GREEN: 1>
TrafficLight.GREEN.name = 'GREEN'
TrafficLight.GREEN.value = 1
TrafficLight(1) = <TrafficLight.GREEN: 1>
TrafficLight['GREEN'] = <TrafficLight.GREEN: 1>


Ignorando por un momento la complejidad (relativa) de la definición de una clase, se puede apreciar cómo este enfoque puede ser ventajoso. La estructura de datos es mucho más limpia, y la API que proporciona es mucho más potente.

# Consideraciones Finales
Este capítulo muestra una guía básica pero potente de una buena parte de las estructuras de datos de Python que se usan en diferentes áreas como finanzas, economía, ciberseguridad, entre otros. Antes de comenzar con el siguiente capítulo, es necesario tomar en cuenta algunas consideraciones finales sobre diferentes aspectos que son muy importantes en Python.

## Caché de valores pequeños
Cuando asignábamos un nombre a un objeto, Python creaba el objeto, establecía su valor y luego apuntaba el nombre a él. Podemos asignar diferentes nombres al mismo valor, y esperamos que se creen diferentes objetos, así:

In [116]:
obj_1 = 100000000
obj_2 = 100000000
obj_3 = 8
obj_4 = 8
print(f"{id(obj_1) == id(obj_2) = }")
print(f"{id(obj_3) == id(obj_4) = }")


id(obj_1) == id(obj_2) = False
id(obj_3) == id(obj_4) = True


¿Por qué ambos resultados son distintos si son los mismos valores? En el primer ejemplo, *obj_1* y *obj_2* están siendo asignados a dos objetos *int*, que tienen el mismo valor pero no son el mismo objeto puesto que su *id* es diferente. Pero, ¿qué paso con el segundo ejemplo? Python no se ha quebrado o ha dado mal el resultado sino que tiene que ver con el rendimiento.Python almacena en caché cadenas cortas y números pequeños para evitar tener muchas copias de ellos atascando la memoria del sistema.

## Cómo elegir estructuras de datos
Como hemos visto, Python te proporciona varios tipos de datos incorporados y, a veces, si no tienes mucha experiencia, elegir el que más te conviene puede ser complicado, sobre todo cuando se trata de colecciones. Por ejemplo, digamos que tienes muchos diccionarios para almacenar, cada uno de los cuales representa a un cliente. Dentro de cada diccionario de cliente, hay un código de identificación único 'id': 'code'. ¿En qué tipo de colección los colocarías? A menos que sepamos más sobre estos clientes, es muy difícil responder. ¿Qué tipo de acceso necesitaremos? ¿Qué tipo de operaciones tendremos que realizar con cada uno de ellos y cuántas veces? ¿Cambiará la colección con el tiempo? ¿Tendremos que modificar de algún modo los diccionarios de clientes? ¿Cuál será la operación más frecuente que tendremos que realizar sobre la colección?

Si puedes responder a las preguntas anteriores, sabrás qué elegir. Si la colección nunca se contrae ni crece (en otras palabras, no necesitará añadir/eliminar ningún objeto cliente tras su creación) ni se baraja, entonces las tuplas son una posible elección. En caso contrario, las listas son un buen candidato. Sin embargo, cada diccionario de clientes tiene un identificador único, por lo que incluso un diccionario podría funcionar. Permítanos esbozarle estas opciones:

In [117]:
# example customer objects
customer1 = {'id': 'abc123', 'full_name': 'Master Yoda'}
customer2 = {'id': 'def456', 'full_name': 'Obi-Wan Kenobi'}
customer3 = {'id': 'ghi789', 'full_name': 'Anakin Skywalker'}
# collect them in a tuple
customers = (customer1, customer2, customer3)
# or collect them in a list
customers = [customer1, customer2, customer3]
# or maybe within a dictionary, they have a unique id after all
customers = {
'abc123': customer1,
'def456': customer2,
'ghi789': customer3,
}

Una forma de saber si has elegido la estructura de datos adecuada es observar el código que tienes que escribir para manipularla. Si todo resulta fácil y fluye con naturalidad, es probable que hayas elegido correctamente, pero si te encuentras pensando que tu código se está complicando innecesariamente, entonces probablemente deberías intentar decidir si necesitas reconsiderar tus elecciones. Por ello, cuando se elija una estructura para los datos, se debe tener en mente la facilidad de uso y el rendimiento, y dar prioridad a lo que más importa en el contexto en el que te encuentres.

## Acerca de indexing y slicing
El slicing, en general, se aplica a una secuencia: tuples, lists, strings, etcétera. Con las lists, el corte también se puede utilizar para la asignación. Casi nunca hemos visto que esto se utilice en código profesional, pero aún así, sabes que se puede hacer.

Hay una característica de la indexación en Python que no se ha mencionado antes. Si una list tiene 10 elementos, entonces debido al sistema de posicionamiento de índice 0 de Python, el primero está en la posición 0 y el último en la posición 9. Por lo tanto, para obtener el último elemento, necesitamos conocer la longitud de toda la list (o tuple, o string, etc.) y luego restar 1: len(a) - 1. Se trata de una operación tan habitual que Python proporciona una forma de recuperar elementos utilizando la indexación negativa comenzando con -1 para el útlimo valor, -2 para el penúltimo, y así consecutivamente. Si se intentan direccionar índices mayores de 9 o menores de -10 se producirá un IndexError. 

In [119]:
list_1 = list(range(10))
print(f"{list_1 = }")
print(f"Numero de elementos en la lista: {len(list_1) = }")
print(f"El primer elemento de la lista es: {list_1[0] = }")
print(f"Último elemento de la lista es (primera forma): {list_1[len(list_1) - 1] = }")
print(f"Último elemento de la lista es (Python rocks): {list_1[-1] = }")


list_1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Numero de elementos en la lista: len(list_1) = 10
El primer elemento de la lista es: list_1[0] = 0
Último elemento de la lista es (primera forma): list_1[len(list_1) - 1] = 9
Último elemento de la lista es (Python rocks): list_1[-1] = 9


## Sobre los nombres
En un entorno real, cuando elija nombres para sus datos, debe hacerlo con cuidado: deben reflejar de qué tratan los datos. Una regla para colocar nombres a las variables es la siguiente: los nombres de los datos deben ser sustantivos, y los nombres de las funciones deben ser verbos. Además, los nombres deben ser tan expresivos como sea posible. Python es en realidad un muy buen ejemplo cuando se trata de nombres. La mayoría de las veces puedes adivinar cómo se llama una función si sabes lo que hace.

El capítulo 2 del libro *Clean Code* de *Robert C. Martin* está dedicado por completo a los nombres. Es un libro de lectura obligatoria si quieres llevar tu codificación al siguiente nivel.