# Sesión 1 – Bloque 2: Tipos y Literales en Python

**Curso:** Fundamentos de Programación y Analítica de Datos con Python  
**Duración del bloque:** ~40–60 min  
**Entorno:** Python 3.12.8 · VSCode · Jupyter Notebook  

---

## Objetivos del Bloque
- Comprender los **tipos de datos** fundamentales en Python y sus **literales**.
- Reconocer el modelo de **tipado dinámico y fuerte** de Python.
- Utilizar correctamente `type()`, `isinstance()`, **mutabilidad**, **identidad** (`is`) y **igualdad** (`==`).
- Aplicar **conversiones de tipo** y **buenas prácticas** para evitar errores comunes.
- Preparar el terreno para estructuras de datos y analítica de datos en sesiones posteriores.

> **Requisitos previos:** Entorno instalado (Python 3.12.8) y Jupyter operativo.


## 1. Conceptos clave: tipos y literales

**Definición (Tipos):** En Python, un **tipo** define el conjunto de valores y operaciones válidas para dichos valores. Ejemplos: `int`, `float`, `bool`, `str`, `bytes`, `NoneType`, entre otros.

**Definición (Literal):** Un **literal** es una forma de escribir un valor directamente en el código fuente. Ejemplos: `42` (literal entero), `3.14` (literal flotante), `"Hola"` (literal string), `True`/`False` (literales booleanos), `None` (literal nulo).

**Tipado en Python:**
- **Dinámico:** el tipo se asocia al **objeto**, no a la variable; las variables pueden referenciar objetos de distintos tipos a lo largo del programa.
- **Fuerte:** Python **no** convierte tipos de forma implícita cuando la operación no tiene sentido; hay que **convertir explícitamente**.

**Mutabilidad e Identidad:**
- **Mutables:** su contenido puede cambiar (e.g., `list`, `dict`, `set`, `bytearray`).
- **Inmutables:** su contenido no cambia (e.g., `int`, `float`, `str`, `tuple`, `bytes`, `frozenset`).
- **Identidad (`is`)** compara si dos referencias apuntan **al mismo objeto** en memoria.
- **Igualdad (`==`)** compara si dos objetos tienen **el mismo valor**.

**Funciones útiles:**
- `type(obj)`: retorna el tipo del objeto.
- `isinstance(obj, Tipo)`: verifica si `obj` es instancia de `Tipo` (admite herencia).

**Documentación recomendada:**
- *Built-in Types* (Python docs)
- *Data Model* (Python docs)


In [1]:
# Ejemplo: Tipo, igualdad e identidad
a = 10
b = 10
c = int("10")
d = a

print("El tipo de a es:", type(a))
print("¿a es igual a b?: ", a == b) # Igualdad de valor
print("Por identidad, ¿a is b?: ", a is b) # Identidad
print("¿a es igual a c?: ", a == c)
print("Por identidad, ¿a is c?: ", a is c) # Identidad
print("Por identidad, ¿a is d?: ", a is d) # Identidad

El tipo de a es: <class 'int'>
¿a es igual a b?:  True
Por identidad, ¿a is b?:  True
¿a es igual a c?:  True
Por identidad, ¿a is c?:  True
Por identidad, ¿a is d?:  True


## 2. Números: `int`, `float`, `complex`

### 2.1 `int` (enteros de precisión arbitraria)
- Soporta números grandes sin desbordamiento (limitado por memoria).
- Literales: base 10 (`42`), binario (`0b101010`), octal (`0o52`), hexadecimal (`0x2A`).
- Mejora de legibilidad: guiones bajos en literales (`1_000_000`).

### 2.2 `float` (punto flotante, IEEE 754 doble precisión)
- Aproximación binaria; puede causar **errores de precisión**.
- Literales: `3.14`, `1.0`, notación científica (`1e-3`, `2.5E6`).
- Comparaciones con `math.isclose()` cuando se esperan pequeñas diferencias.

### 2.3 `complex` (números complejos)
- Literal: `a + bj` (ej. `3+4j`).
- Partes real e imaginaria: `.real`, `.imag`.

> **Buenas prácticas:**  
> - Usar `Decimal` (módulo `decimal`) o `Fraction` (módulo `fractions`) si se requiere **exactitud financiera** o racional.
> - Usar `//` (división entera) vs `/` (división flotante) según el caso.


In [None]:
# Ejemplos con enteros
a = 1_000_000
b = 0b1010
c = 0xFF
print(a, b, c)

# Operaciones básicas
x, y = 10, 3
print(x, y)
print("x + y =", x + y)
print("x - y =", x - y)
print("x * y =", x * y)
print("x / y =", x / y)
print("x // y =", x // y)
print("x % y =", x % y)
print("x ** y =", x ** y)


1000000 10 255
10 3
x + y = 13
x - y = 7
x * y = 30
x / y = 3.3333333333333335
x // y = 3
x % y = 1
x ** y = 1000


In [None]:
# Ejemplos con flotantes y precisión
import math

m = 0.1 + 0.2
print("0.1 + 0.2 =", m )
print("¿Es m igual a 0.3?", m == 0.3)
print("Usando math.isclose:", math.isclose(m, 0.3))

# Notación científica
s, t = 1e-3, 2.5e6
print("s: ", s)
print("t: ", t)


0.1 + 0.2 = 0.30000000000000004
¿Es m igual a 0.3? False
Usando math.isclose: True
s:  0.001
t:  2500000.0


In [31]:
# Ejemplo con números complejos
import cmath

c = 3 + 4j
print("Número complejo:", c)
print("Parte real:", c.real)
print("Parte imaginaria:", c.imag)
print("Magnitud:", abs(c))
print("Fase:", cmath.phase(c)*180/cmath.pi)
print("Conjugado:", c.conjugate())

Número complejo: (3+4j)
Parte real: 3.0
Parte imaginaria: 4.0
Magnitud: 5.0
Fase: 53.13010235415598
Conjugado: (3-4j)


In [None]:
# Cuando se requiere exactitud decimal ( Finanzas )
from decimal import Decimal, ROUND_HALF_EVEN

precio = Decimal("19.99")
cantidad = Decimal("3")
total = precio * cantidad
total_rounded = total.quantize(Decimal("0.01"), rounding=ROUND_HALF_EVEN)

print("El precio es:", precio, "y la cantidad es: ", cantidad)
print("Total:", total)
print("Total redondeado:", total_rounded)

El precio es: 19.99 y la cantidad es:  3
Total: 59.97
Total redondeado: 59.97


## 3. Booleanos y "truthiness"

- `bool` tiene dos literales: `True`, `False`.  
- En Python, muchos objetos tienen un valor de **verdad** (truthiness) cuando se evalúan en condicionales.

**Falsos por convención:** `False`, `0`, `0.0`, `0j`, `''`, `b''`, `[]`, `{}`, `set()`, `range(0)`, `None`.  
Todo lo demás suele evaluarse como `True`.

> **Nota:** `bool` es técnicamente una subclase de `int` (por razones históricas), por lo que `True == 1` es `True`. Evite mezclar booleanos con aritmética para no introducir ambigüedades de lectura.


In [6]:
# TODO: Demostración de truthiness
valores = [False, 0, 0.0, '', [], {}, set(), None, 'Python', [1, 2, 3], 27]

print("En un contexto booleano:")
for v in valores:
  print(f"El valor {v!r} es considerado {'True' if v else 'False'}.")


En un contexto booleano:
El valor False es considerado False.
El valor 0 es considerado False.
El valor 0.0 es considerado False.
El valor '' es considerado False.
El valor [] es considerado False.
El valor {} es considerado False.
El valor set() es considerado False.
El valor None es considerado False.
El valor 'Python' es considerado True.
El valor [1, 2, 3] es considerado True.
El valor 27 es considerado True.


## 4. Cadenas de texto (`str`)

- **Unicode** por defecto (soporta caracteres internacionales).
- **Inmutables**: toda operación que modifica, retorna una **nueva** cadena.
- Literales: comillas simples `'...'`, dobles `"..."`, o triples `'''...'''` / `"""..."""` para múltiples líneas.
- **Escape**: `\n`, `\t`, `\"`, etc.
- **Raw strings**: prefijo `r"..."` evita interpretar escapes (útil en rutas o expresiones regulares).
- **f-strings**: formateo moderno y eficiente: `f"Total: {total:.2f}"`

**Operaciones frecuentes:** indexación, *slicing*, `len()`, métodos (`.lower()`, `.upper()`, `.strip()`, `.replace()`, `.split()`, `.join()`).

> **Buenas prácticas:** Usar **f-strings** para legibilidad y control de formato. Normalizar texto para comparaciones robustas (`.casefold()`).


In [26]:
# TODO: Literales y escapes
s1 = 'Hola DIAN!'
s2 = "Hola DIAN!"
s3 = 'Comillas Simples: \' y Comillas Dobles: \"'
s4a = 'Raw String: /Users/jhnavarrete/Desktop/python-course'
s4b = r'Raw String: /Users/jhnavarrete/Desktop/python-course'
s5 = """Linea 1
Linea 2"""
s6 = "Linea 1\n\tLinea 2\n\t\tLinea 3"

print(s1, s2)
print(s3)
print(s4a)
print(s4b)
print(s5)
print("----")
print(s6)

Hola DIAN! Hola DIAN!
Comillas Simples: ' y Comillas Dobles: "
Raw String: /Users/jhnavarrete/Desktop/python-course
Raw String: /Users/jhnavarrete/Desktop/python-course
Linea 1
Linea 2
----
Linea 1
	Linea 2
		Linea 3


In [3]:
# TODO: Indexación, slicing y métodos
texto = "  Analítica de Datos con Python y la DIAN.  "

print("Texto original:", repr(texto))
print("Longitud (len):", len(texto), "caracteres")
print("Strip - Texto sin espacios [ .strip() ]:", repr(texto.strip()))
print("Minusculas [ .lower() ]:", repr(texto.lower()))
print("Reemplazar 'a' por '@' [ .replace('a', '@') ]:", repr(texto.replace('a', '@')))
print("Substring [ .substring(2, 20) ]:", repr(texto[2:20]))
print("Substring 2 [ .substring(-7) ]:", repr(texto[-7:]))
print("Separar por espacios [ .split() ]:", repr(texto.split()))
print("Unir con guion [ '-'.join(...) ]:", repr('-'.join(texto.split())))
print("Buscar 'Python' [ .find('Python') ]:", texto.find('Python'))
print("Substring 3 [ .substring(25, 31) ]:", repr(texto[25:31]))
print("----")
print("Texto original:", repr(texto))
print("¿Empieza con 'Analítica'? [ .startswith('Analítica') ]:", texto.startswith('Analítica'))
print("¿Empieza con 'Analítica'? [ .startswith('Analítica') ]:", texto.strip().startswith('Analítica'))


Texto original: '  Analítica de Datos con Python y la DIAN.  '
Longitud (len): 44 caracteres
Strip - Texto sin espacios [ .strip() ]: 'Analítica de Datos con Python y la DIAN.'
Minusculas [ .lower() ]: '  analítica de datos con python y la dian.  '
Reemplazar 'a' por '@' [ .replace('a', '@') ]: '  An@lític@ de D@tos con Python y l@ DIAN.  '
Substring [ .substring(2, 20) ]: 'Analítica de Datos'
Substring 2 [ .substring(-7) ]: 'DIAN.  '
Separar por espacios [ .split() ]: ['Analítica', 'de', 'Datos', 'con', 'Python', 'y', 'la', 'DIAN.']
Unir con guion [ '-'.join(...) ]: 'Analítica-de-Datos-con-Python-y-la-DIAN.'
Buscar 'Python' [ .find('Python') ]: 25
Substring 3 [ .substring(25, 31) ]: 'Python'
----
Texto original: '  Analítica de Datos con Python y la DIAN.  '
¿Empieza con 'Analítica'? [ .startswith('Analítica') ]: False
¿Empieza con 'Analítica'? [ .startswith('Analítica') ]: True


In [64]:
# TODO: f-strings y especificadores de formato
monto = 1234.56789
print(f"Monto sin formato: {monto}")
print(f"Monto con 2 decimales: {monto:.2f}")
print(f"Monto con separador de miles: {monto:,.2f}")
print(f"Alineación derecha: |{monto:>10.2f}|")
print(f"Alineación izquierda: |{monto:<10.2f}|")
print(f"Alineación centrada: |{monto:^10.2f}|")
print(f"Porcentaje: {0.2567:.2%}")

Monto sin formato: 1234.56789
Monto con 2 decimales: 1234.57
Monto con separador de miles: 1,234.57
Alineación derecha: |   1234.57|
Alineación izquierda: |1234.57   |
Alineación centrada: | 1234.57  |
Porcentaje: 25.67%


## 5. Bytes y codificaciones (`bytes`, `bytearray`)

- **`bytes`**: secuencia inmutable de valores entre 0–255. Útil para E/S, redes, archivos binarios.
- **`bytearray`**: variante **mutable** de `bytes`.
- Conversión con texto requiere **codificación** (`encode`/`decode`), típicamente **UTF-8**.

> **Cuándo usarlos:** al leer/escribir binarios (imágenes, audio), sockets, procesar *payloads* o protocolos.


In [68]:
# TODO: Texto <-> Bytes con UTF-8
texto = "Analítica DIAN"
b_encode = texto.encode('utf-8')

print("Texto original:", texto)
print("Bytes (UTF-8):", b_encode)
print("Hex:", b_encode.hex())

b_decode = b_encode.decode('utf-8')
print("Decodificado de nuevo:", b_decode)

# TODO: Crear bytes desde hex
dian_encode = bytes.fromhex("44 49 41 4E")
print("Desde HEX: ", dian_encode.hex(), "->", dian_encode.decode('utf-8'))

Texto original: Analítica DIAN
Bytes (UTF-8): b'Anal\xc3\xadtica DIAN'
Hex: 416e616cc3ad74696361204449414e
Decodificado de nuevo: Analítica DIAN
Desde HEX:  4449414e -> DIAN


## 6. `None` (ausencia de valor)

- `None` representa la **ausencia de valor** o marcador nulo.
- Tipo: `NoneType`.
- Comparar con **`is`** (`if x is None:`), no con `==`.
- Funciones que no retornan nada, retornan `None` implícitamente.


In [None]:
# TODO: Funciones sin retorno
def sin_retorno():
    print("Esta función no retorna nada explícitamente.")

r = sin_retorno()
print("El valor retornado es:", r)
print("¿r is None?", r is None)
#! Caso prohibido
print("¿r is None?", r == None)

Esta función no retorna nada explícitamente.
El valor retornado es: None
¿r is None? True
¿r is None? True


In [79]:
import math

valor = math.nan
print("Valor especial NaN:", valor)
print("¿Es nan un None?", valor is None)
print("valor es NaN?", math.isnan(valor))

valor_1 = 27
valor_2 = 0
print(math.inf)

Valor especial NaN: nan
¿Es nan un None? False
valor es NaN? True
inf


In [None]:
print(type(None))

# Declaración
precio = None;


<class 'NoneType'>


## 7. Literales de colecciones (vista rápida)

- `list`: `[]` (mutable, ordenada)  
- `tuple`: `()` (inmutable, ordenada)  
- `dict`: `{clave: valor}` (mutable, mapeo)  
- `set`: `{elem1, elem2}` (mutable, no ordenado, sin duplicados)  
- **Vacíos:** `[]`, `()`, `{}` (¡ojo! `{}` es `dict`, **no** `set`), para conjunto vacío use `set()`.

> Profundizaremos en colecciones en el siguiente bloque de la sesión.


In [89]:
# TODO: Crear y manipular listas, tuplas, diccionarios y conjuntos
lista = [1, 2, 3, 4, 5]
tupla = (1, 2, 3, 4, 5)
diccionario = {'a': 1, 'b': 2, 'c': 3}
conjunto = {1, 1, 2, 2, 2, 2, 3, 4, 5}

print("Lista:", lista)
print("Tupla:", tupla)
print("Diccionario:", diccionario)
print("Conjunto:", conjunto)

print("Tipo de {} es:", type({}))
print("Tipo de {}[Conjunto Vacío] es:", type(set()))

Lista: [1, 2, 3, 4, 5]
Tupla: (1, 2, 3, 4, 5)
Diccionario: {'a': 1, 'b': 2, 'c': 3}
Conjunto: {1, 2, 3, 4, 5}
Tipo de {} es: <class 'dict'>
Tipo de {}[Conjunto Vacío] es: <class 'set'>


## 8. Conversión de tipos (casting explícito) y validación

- Usar **constructores**: `int("10")`, `float("3.14")`, `str(123)`, `bytes(...)`.
- Manejar excepciones (`ValueError`, `TypeError`) al convertir desde *strings*.
- Evitar conversiones implícitas sorpresivas; preferir claridad y validación temprana.

> **Patrón recomendado:** Funciones que validan y convierten, retornando tipos esperados o lanzando errores claros.


In [99]:
# TODO: Manejo de errores
print(type(int("10")))
print(type(str(123)), "y su valor es:", repr(str(123)))

<class 'int'>
<class 'str'> y su valor es: '123'


## 9. Buenas prácticas y errores comunes

- Usar **f-strings** para formateo claro y eficiente: `f"Total: {monto:.2f}"`.
- Evitar comparar flotantes con `==`; preferir `math.isclose` con tolerancias.
- Distinguir `==` (valor) de `is` (identidad).
- Para *strings*, normalizar (`strip`, `casefold`) antes de comparar.
- Para dinero, usar `Decimal` con redondeo bancario (no `float`).
- Usar guiones bajos en literales numéricos largos (`1_000_000`) para legibilidad.
- Documentar funciones con **docstrings** y validar parámetros (fail-fast).


---

# 10. Ejercicios con contexto técnico

> **Contexto:** Eres analista junior en un equipo de datos. Debes preparar insumos limpios y legibles para un reporte básico. Utiliza lo aprendido sobre **tipos**, **literales**, **cadenas**, **conversiones** y **buenas prácticas**.

## Ejercicio 1 – Limpieza de campos numéricos
Tienes una lista de precios capturados como cadenas:
```python
precios_raw = ["1_299.90", "249.5", "  19.99", "0.99", "12", "NaN", "1e3", "3.14159"]
```
1. Convierte los valores válidos a `float`.  
2. Descarta los inválidos (`NaN` textual sin semántica numérica).  
3. Calcula **promedio**, **mínimo** y **máximo** usando los valores válidos.  
4. Presenta los resultados con **f-strings** y formato a 2 decimales.

*Pista:* considera limpiar guiones bajos y espacios, y validar con `try/except` o funciones auxiliares.


## Ejercicio 2 – Normalización de texto y *truthiness*
Tienes posibles valores de entrada de usuario para una casilla de consentimiento:
```python
entradas = ["Sí", "si", "  YES ", "y", "True", "1", "no", "", "false", "0", None]
```
1. Implementa `to_bool_consent(texto)` que devuelva `True` para afirmativos y `False` para negativos o valores vacíos/nulos.  
2. Usa `.casefold()` y `.strip()` para normalización robusta.  
3. Escribe pruebas con ejemplos positivos y negativos.


## Ejercicio 3 – Reporte tabular con f-strings
Dada la lista de productos:
```python
productos = [
    {"sku": "A001", "nombre": "Cuaderno", "precio": 3.5, "stock": 120},
    {"sku": "A002", "nombre": "Lápiz", "precio": 0.8, "stock": 350},
    {"sku": "A003", "nombre": "Mochila", "precio": 24.99, "stock": 40},
]
```
1. Imprime un reporte tabular con columnas alineadas (`sku`, `nombre`, `precio`, `stock`, `valor_inventario = precio * stock`).  
2. Formatea `precio` y `valor_inventario` con 2 decimales y anchos fijos (alineación).


## Ejercicio 4 – Bytes y codificación
Recibes un *payload* en hexadecimal que representa texto UTF-8:
```python
hex_payload = "50 79 74 68 6f 6e 20 33 2e 31 32"
```
1. Convierte el hex a `bytes` y luego decódifícalo a `str`.  
2. Vuelve a codificar el texto a `bytes` y muéstralo en hexadecimal.  
3. Explica por qué la codificación es necesaria entre texto y bytes.


## Ejercicio 5 – Validación robusta de enteros
Escribe `to_int_safe(texto: str) -> int` (o reutiliza y mejora la versión anterior) que:
- Permita signo opcional (`+`/`-`) y espacios alrededor.
- Rechace cadenas con caracteres no numéricos o vacías.
- Lance `ValueError` con un mensaje claro.
- Incluye pruebas con entradas válidas/ inválidas. (NO PyTest)

> **Entrega:** Completa cada ejercicio en celdas nuevas debajo. Incluye comentarios, docstrings y, cuando aplique, pequeñas pruebas con `assert` para verificar.


In [None]:
# === Ejercicio 1: tu solución aquí ===
precios_raw = ["1_299.90", "249.5", "  19.99", "0.99", "12", "NaN", "1e3", "3.14159"]
# TODO: implementar limpieza, conversión y cálculo de métricas


In [None]:
# === Ejercicio 2: tu solución aquí ===
entradas = ["Sí", "si", "  YES ", "y", "True", "1", "no", "", "false", "0", None]
# TODO: implementar to_bool_consent y pruebas


In [3]:
# === Ejercicio 3: tu solución aquí ===
productos = [
    {"sku": "A001", "nombre": "Cuaderno", "precio": 3.5, "stock": 120},
    {"sku": "A002", "nombre": "Lápiz", "precio": 0.8, "stock": 350},
    {"sku": "A003", "nombre": "Mochila", "precio": 24.99, "stock": 40},
]
# TODO: imprimir reporte tabular con f-strings


In [None]:
# === Ejercicio 4: tu solución aquí ===
hex_payload = "50 79 74 68 6f 6e 20 33 2e 31 32"
# TODO: convertir hex -> bytes -> str y viceversa


In [None]:
# === Ejercicio 5: tu solución aquí ===
# TODO: re-implementar/mejorar to_int_safe y añadir pruebas
