# Sintaxis básica de Python


### Características de Python como lenguaje de programación
- Indentación: Python es un lenguaje que utiliza identación  para definir la estructura y los bloques de código
```python
if True:
    print('Verdadero')
```
- Utiliza un sistema de tipado dinámico
```java
int edad = 25
```
```python
edad = 25
```
- Type Hints: anotaciones (solo sugerencias, no restricciones) de tipo documentan el tipo de datos que se espera de una función (mypy)
```python
def calculate_accuracy(correct: int, total: int) -> float:
    """
    Calcula el accuracy de un modelo

    La sintaxis `correct: int`indica que esperamos un entero
    La sintaxis `-> float` indica que la función retorna un float

    IMPORTANTE: Estos son HINTS (sugerencias), no restricciones
    """
    return correct / total
```
- Duck typing 
- Strong typing
- Everything is an object
    1. Python crea un objeto con el valor 42 en MEMORIA.
    2.  x es una refecencia (puntero) a ese objeto en memoria.
    3.  El objeto siempre tiene metadatos (tipo, valor, reference count, etc)

### Variables en Python
Cuando creamos una variable de Python:
    1. Python crea un objeto con metadatos (tipo, valor..) en memoria.
    2. El nombre de esa variable es un puntero que referencia a ese objeto.

### Naming variables
- Los nombre de variables no pueden comenzar con un número o con un caracter especial a especión del _
- No debo sobrepasar los 79 caracteres, en caso de hacerlo debo utilizar el caracter \ para generar el break-salto de línea.
- Por convención se utilizan minúsculas y snake_case para declarar variables cuyo naming incluya dos o más palabras.  
- Nombre de las variables siempre deben ser descriptivos
- Puedo declarar variables en bloque
- No puedo utilizar palabras reservadas de la propia tecnologia

In [2]:
%whos # Muestra las variables definidas en el entorno actual
import sys # Importar el módulo sys para obtener información del sistema
import math # Importar el módulo math para operaciones matemáticas

x = 42

"""
Esto es un comentarios
de múltiples líneas
Se puede crear rápidamente seleccionando el texto y presionando
Shift + Alt + A
"""

# Ver el ID del objeto en memoria
print(f"ID de x: {id(x)}") 

# Ver el tamaño del objeto en bytes
print(f"Tamaño de x: {sys.getsizeof(x)} bytes")

# Ver el tipo de dato
print(f"Tipo de x: {type(x)}")

#Reference counting
print(f"Reference count de x: {sys.getrefcount(x)}")

x = "hello"
print(f"Tipo de x: {type(x)}")

# Tipos de datos en Python 
cadena_texto = "Hola, Mundo!"  # str
cadena_texto_dos = 'Hola, Mundo!' # str
numero_entero = 42             # int
numero_flotante = 3.14         # float
booleano = True                # bool

# Buenas prácticas en la declaración de variables
NOMBRE = "Alejandra" # Esto no es correcto
nombre_y_apellido = "Alejandra Espinosa" # snake_case
camelCase = "variable" # Esto no es correcto
patatas_fritas = "Alejandra" # Esto no es descriptivo ni correcto
alias, anios, altura = "Ale", 78, 1.70 # Declaración en bloque
texto = "Some teams strongly prefer a longer line length. For code maintained \
exclusively or primarily by a team that can reach agreement on this issue, it is \
    okay to increase the line length limit up to 99 characters, \
    provided that comments and docstrings are still wrapped at 72 characters."


No variables match your requested type.
ID de x: 4554049048
Tamaño de x: 28 bytes
Tipo de x: <class 'int'>
Reference count de x: 1000000041
Tipo de x: <class 'str'>


- En Python no se pueden utilizar palabras reservadas para nombrar variables

In [3]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


### Estructura básica de un script en Python

1. Importación de módulos- Al inicio del archivo
2. Definición de funciones o variables -naming &rarr; snake_case
3. Código principal

In [4]:
# Variables globales
pi = 3.1416
def calcular_area_circulo(radio):
    return math.pi * (radio ** 2)
    # variables_locales = None -> No accesibles fuera de la función
radio = 8
print("El área del círculo es:", calcular_area_circulo(radio))

El área del círculo es: 201.06192982974676


# TIPOS DE DATOS

## INTEGERS - ENTEROS

Representan números sin decimales
- Ejemplo de Sample
 -IRIS DATASET: altura y anchura de los sépalos, altura y anchura de los pétalos
 sample 100 (el número de registro es el index): 2.5, 3, 4.2, 4.7

In [5]:
numero_entero = 10

#Operacioens básicas con enteros
batch_size = 32
num_epochs = 100 
total_samples = 10000

#Operaciones aritméticas
total_batches = total_samples // batch_size  # División entera
total_batches_flotante = total_samples / batch_size  # División entera
print(f"Número total de batches por época: {total_batches}")
print(f"Número total de batches por época: {total_batches_flotante}")

#El operador // realiza una división entera, devolviendo el cociente sin la parte decimal.
# El operador / realiza una división estándar (flotante), devolviendo un número de punto flotante incluso si la división es exacta.

# Módulo (resto de la división)
remainder = total_samples % batch_size
print(f"Muestras sobrantes: {remainder}")

# Potenciación
hidden_dim = 2 ** 5 # 2 elevado a la potencia de 5
print(f"Tamaño de la capa oculta: {hidden_dim}")

#Operaciones básicas - suma
learning_rate = 0.01
momentum = 0.9
total_rate = learning_rate + momentum
print(f"Tasa total: {total_rate}")

numero_flotante = 3.14
print(f"El id de número flotante es: {id(numero_flotante)}")
numero_entero = 45
suma = numero_flotante + numero_entero
print(f"Suma: {suma}")
saludo = "Hola, "
suma_imposible = str(numero_flotante) 
print(f"El id de suma imposible es: {id(suma_imposible)}") # Esto generará un error
print(f"Suma imposible: {suma_imposible}")
numero_flotante = 3.15
print(f"El id de número flotante es: {id(numero_flotante)}")

# Resta
num_1 = 10
num_2 = 4
diferencia = num_1 - num_2
print(f"Diferencia: {diferencia}") 

# Multiplicación
multiply = num_1 * num_2
print(f"Multiplicación: {multiply}")



Número total de batches por época: 312
Número total de batches por época: 312.5
Muestras sobrantes: 16
Tamaño de la capa oculta: 32
Tasa total: 0.91
El id de número flotante es: 4587780240
Suma: 48.14
El id de suma imposible es: 4590382640
Suma imposible: 3.14
El id de número flotante es: 4589227568
Diferencia: 6
Multiplicación: 40


## FLOATS- NÚMEROS FLOTANTES

- Falta de precisión de los floats: Los floats no pueden representar todos los decimal exactamente. El almacenamiento en binario y la complejidad de Python a la hora de realizar las operaciones con estos binarios hacen que obtengamos resultados inesperados. NUNCA comparar floats con ==, es mejor utilizzr tolerancia 

In [6]:
learning_rate = 1e-3 # 1 x 10 ^(-3) = 0.001
learning_rate_small = 1e-6 # 1 x 10 ^(-6) = 0.000001

# Operaciones con flotantes
loss = 2.5
improved_loss = loss * 0.8
print(f"Pérdida mejorada: {improved_loss}")

# IMPORTANTE: Precisión limitada de los números flotantes
a = 0.1 + 0.2
print(f"0.1 + 0.2 = {a}")  # Puede no ser exactamente 0.3 debido a la precisión limitada
print(f"¿0.1 + 0.2 es igual a 0.3? {a == 0.3}")

# SOLUCIÓN: Usar tolerancia al comparar flotantes
tolerance = 1e-9
is_equal = abs(a - 0.3) < tolerance
print(f"¿0.1 + 0.2 es aproximadamente igual a 0.3? {is_equal}")



Pérdida mejorada: 2.0
0.1 + 0.2 = 0.30000000000000004
¿0.1 + 0.2 es igual a 0.3? False
¿0.1 + 0.2 es aproximadamente igual a 0.3? True


## STRINGS o CADENAS DE CARACTERES

In [None]:
string_multilinea = """
Esto es una ca
dena de texto"""

#Concatencación de strings
model_name = "ResNet"
version = "50"
full_model_name = model_name + "-" + version
print(f"Nombre completo del modelo: {full_model_name}")

# F-strings para formateo
accuracy = 0.923445453
print(f"Precisión del modelo {full_model_name}: {accuracy:.2%}") 

# Métodos clave
sentence = "  Aprendiendo Python para IA  "

# Limpieza 
clear_output = sentence.strip() # Quitar espacios en blanco al inicio y al final
print(f"Cadena limpia: '{clear_output}'")

# Mayúsculas y minúsculas
upper_case = sentence.upper()
print(f"Cadena en mayúsculas: '{upper_case}'")
lower_case = sentence.lower()
print(f"Cadena en minúsculas: '{lower_case}'")

# Spliting
words = sentence.split()    # Por defecto separa por espacios
print(f"Palabras en la oración: {words}")

# Verificaciones de contenido
contains_python = "Python" in sentence
print(f"¿La oración contiene 'Python'? {contains_python}")

stars_with_aprendiendo = sentence.strip().startswith("Aprendiendo")
print(f"¿La oración empieza con 'Aprendiendo'? {stars_with_aprendiendo}")



Nombre completo del modelo: ResNet-50
Precisión del modelo ResNet-50: 92.34%
Cadena limpia: 'Aprendiendo Python para IA'
Cadena en mayúsculas: '  APRENDIENDO PYTHON PARA IA  '
Cadena en minúsculas: '  aprendiendo python para ia  '
Palabras en la oración: ['Aprendiendo', 'Python', 'para', 'IA']
¿La oración contiene 'Python'? True
¿La oración empieza con 'Aprendiendo'? True


## BOOLEANS - Booleanos 
1. Operadores lógicos:
    - `and`: Ambos deben ser True
    - `or`: Al menos uno debe ser True
    - `not`: Invierte el valor


**Truthy y Falsy**: Python tiene valores que se comportan como True o False en condiciones:

- Falsy: `False`, `None`, `0`, `""`, `[]`, `{}`
- Truthy: Todo lo demás

Esto es muy útil: if data: es más pythonic que if len(data) > 0:
**Comparaciones**: <, >, <=, >=, ==, !=

In [None]:
# Valores booleanos


is_trained = True
has_converger = False

# Operadores de comparación
epoch = 40
max_epochs = 50

should_continue = max_epochs > epoch
print(f"¿Deberíamos continuar el entrenamiento? {should_continue}")

# Operadores lógicos
learning_rate = 0.1
is_valid_lr = learning_rate > 0.2 or learning_rate < 1 # Arrojara True si una condiciones son ciertas
print(f"¿La tasa de aprendizaje es válida? {is_valid_lr}")

# Truthy y falsy
data_loaded = []  # Lista vacía
if data_loaded:
    print("Los datos no se han cargado.")

# Operador ternario
mode = "testing"
is_training = True if mode == "train" else False # Valor si verdadero + (if) condición + (else)valor si falso
print(f"¿Estamos en modo entrenamiento? {is_training}")


¿Deberíamos continuar el entrenamiento? True
¿La tasa de aprendizaje es válida? True
¿Estamos en modo entrenamiento? False


## LISTAS - Lists

Las listas son colecciones ordenadas y mutables que pueden contener elementos de cualquier tipo.

**Características principales:**
- Ordenadas: Los elementos mantienen el orden de inserción
- Mutables: Se pueden modificar después de su creación
- Indexables: Se accede a los elementos por índice (empezando en 0)
- Permiten duplicados
- Pueden contener diferentes tipos de datos

**Métodos importantes:**
- `append()`: Añadir elemento al final
- `insert()`: Insertar elemento en posición específica
- `remove()`: Eliminar primera ocurrencia de un valor
- `pop()`: Eliminar y retornar elemento por índice
- `sort()`: Ordenar la lista
- `reverse()`: Invertir el orden
- `extend()`: Añadir múltiples elementos

**List comprehension**: Forma concisa de crear listas aplicando una expresión a cada elemento de un iterable
```python
# Sintaxis: [expresion for item in iterable if condicion]
cuadrados = [x**2 for x in range(10)]
```

## TUPLAS - Tuples

Las tuplas son colecciones ordenadas e **inmutables** que pueden contener elementos de cualquier tipo.

**Características principales:**
- Ordenadas: Los elementos mantienen el orden de inserción
- **Inmutables**: NO se pueden modificar después de su creación
- Indexables: Se accede a los elementos por índice (empezando en 0)
- Permiten duplicados
- Pueden contener diferentes tipos de datos
- Más eficientes en memoria que las listas

**Diferencias clave con listas:**
- Listas: Mutables, se usan cuando los datos pueden cambiar
- Tuplas: Inmutables, se usan para datos constantes o que no deben modificarse

**Cuándo usar tuplas:**
- Datos que no deben cambiar (dimensiones de imágenes, coordenadas, configuraciones)
- Como claves en diccionarios (las listas no pueden ser claves)
- Para retornar múltiples valores desde una función
- Mejor rendimiento cuando no se necesita mutabilidad

**Unpacking**: Asignar los elementos de una tupla a múltiples variables
```python
coordenadas = (10, 20)
x, y = coordenadas  # Unpacking
```

## DICCIONARIOS - Dictionaries

Los diccionarios son colecciones no ordenadas de pares clave-valor, mutables y muy eficientes para búsquedas.

**Características principales:**
- No ordenados (antes de Python 3.7) / Ordenados por inserción (Python 3.7+)
- Mutables: Se pueden modificar después de su creación
- Acceso por clave (no por índice numérico)
- Las claves deben ser únicas e inmutables (strings, números, tuplas)
- Los valores pueden ser de cualquier tipo
- Muy eficientes: búsqueda O(1) en promedio

**Métodos importantes:**
- `keys()`: Retorna todas las claves
- `values()`: Retorna todos los valores
- `items()`: Retorna pares (clave, valor)
- `get()`: Obtener valor con valor por defecto si no existe
- `update()`: Actualizar con otro diccionario
- `pop()`: Eliminar y retornar valor por clave
- `clear()`: Vaciar el diccionario

**Dictionary comprehension**: Forma concisa de crear diccionarios
```python
# Sintaxis: {clave: valor for item in iterable if condicion}
cuadrados = {x: x**2 for x in range(5)}
```

**Uso en IA/ML:**
- Configuraciones de modelos
- Almacenar métricas
- Mapear etiquetas a índices
- Hiperparámetros

## SETS - Conjuntos

Los sets son colecciones no ordenadas de elementos únicos y mutables.

**Características principales:**
- No ordenados: No mantienen orden de inserción
- No indexables: No se puede acceder por índice
- **Elementos únicos**: Automáticamente elimina duplicados
- Mutables: Se pueden añadir/eliminar elementos
- Elementos deben ser inmutables (no se pueden añadir listas, solo tuplas)
- Muy eficientes para operaciones de pertenencia: O(1)

**Operaciones de conjuntos:**
- `union()` o `|`: Unión de conjuntos
- `intersection()` o `&`: Intersección (elementos comunes)
- `difference()` o `-`: Diferencia (elementos en A pero no en B)
- `symmetric_difference()` o `^`: Diferencia simétrica (elementos en A o B pero no en ambos)
- `issubset()`: Verificar si es subconjunto
- `issuperset()`: Verificar si es superconjunto

**Métodos de modificación:**
- `add()`: Añadir un elemento
- `remove()`: Eliminar elemento (error si no existe)
- `discard()`: Eliminar elemento (no error si no existe)
- `clear()`: Vaciar el conjunto

**Uso en IA/ML:**
- Eliminar duplicados de datos
- Encontrar elementos únicos
- Comparar vocabularios
- Validar datos


###

# ESTRUCTURAS DE CONTROL

## CONDICIONALES - if/elif/else

Las estructuras condicionales permiten ejecutar diferentes bloques de código según se cumplan ciertas condiciones.

**Sintaxis básica:**
```python
if condicion:
    # código si la condición es True
elif otra_condicion:
    # código si la primera es False y esta es True
else:
    # código si todas las anteriores son False
```

**Características importantes:**
- La **indentación** es obligatoria (normalmente 4 espacios)
- Los dos puntos `:` son obligatorios después de cada condición
- `elif` es opcional (puede haber varios)
- `else` es opcional
- Las condiciones se evalúan de arriba hacia abajo
- Solo se ejecuta el primer bloque cuya condición sea True

**Operadores de comparación:**
- `==`: Igual a
- `!=`: Diferente de
- `>`: Mayor que
- `<`: Menor que
- `>=`: Mayor o igual que
- `<=`: Menor o igual que

**Operadores lógicos:**
- `and`: Ambas condiciones deben ser True
- `or`: Al menos una condición debe ser True
- `not`: Invierte el valor booleano

**Operador ternario:**
```python
valor = resultado_si_true if condicion else resultado_si_false
```

## BUCLES - Loops

Los bucles permiten ejecutar un bloque de código repetidamente.

### BUCLE FOR

Itera sobre una secuencia (lista, tupla, string, diccionario, set, range).

**Sintaxis básica:**
```python
for elemento in secuencia:
    # código a ejecutar en cada iteración
```

**Funciones útiles con for:**
- `range(n)`: Genera números de 0 a n-1
- `range(inicio, fin, paso)`: Genera números del inicio al fin-1 con un paso
- `enumerate(secuencia)`: Devuelve índice y valor
- `zip(seq1, seq2)`: Itera sobre múltiples secuencias en paralelo

### BUCLE WHILE

Ejecuta un bloque mientras una condición sea True.

**Sintaxis básica:**
```python
while condicion:
    # código a ejecutar mientras la condición sea True
```

**Control de bucles:**
- `break`: Termina el bucle inmediatamente
- `continue`: Salta a la siguiente iteración
- `pass`: No hace nada (placeholder)

**else en bucles:**
```python
for elemento in secuencia:
    # código
else:
    # se ejecuta si el bucle termina normalmente (sin break)
```

**Cuándo usar cada uno:**
- `for`: Cuando sabes cuántas iteraciones necesitas
- `while`: Cuando la cantidad de iteraciones depende de una condición

# FUNCIONES

Las funciones son bloques de código reutilizables que realizan una tarea específica.

**Sintaxis básica:**
```python
def nombre_funcion(parametros):
    """Docstring: descripción de la función"""
    # código
    return resultado
```

**Componentes de una función:**
- `def`: Palabra clave para definir una función
- `nombre_funcion`: Nombre descriptivo en snake_case
- `parametros`: Valores de entrada (opcional)
- `docstring`: Documentación de la función (opcional pero recomendado)
- `return`: Valor que devuelve la función (opcional)

**Tipos de parámetros:**
1. **Posicionales**: Se pasan en orden
2. **Por defecto**: Tienen un valor predeterminado
3. **Keyword arguments**: Se pasan por nombre
4. **`*args`**: Número variable de argumentos posicionales
5. **`**kwargs`**: Número variable de argumentos por nombre

**Scope (alcance) de variables:**
- **Local**: Variables definidas dentro de la función
- **Global**: Variables definidas fuera de la función
- Usar `global` para modificar variables globales (no recomendado)

**Lambda functions:**
Funciones anónimas de una sola línea
```python
lambda parametros: expresion
```

**Type hints:**
```python
def funcion(param: tipo) -> tipo_retorno:
    pass
```

# MANEJO DE ERRORES (EXCEPCIONES)

El manejo de errores permite que el programa continúe ejecutándose incluso cuando ocurren problemas.

**Sintaxis básica:**
```python
try:
    # código que puede generar un error
except TipoDeError:
    # código que se ejecuta si ocurre ese error
else:
    # código que se ejecuta si NO ocurre error
finally:
    # código que SIEMPRE se ejecuta
```

**Orden de ejecución**:

1. **try**: Se intenta ejecutar
2. **except**: Solo si hubo excepción del tipo especificado
3. **else**: Solo si NO hubo excepción
4. **finally**: SIEMPRE, al final

**Cuándo usar cada uno**:

- **finally**: Cleanup (cerrar archivos, conexiones)
- **else**: Código que depende del éxito de try
- **except with as**: Cuando necesitas detalles del error

**Re-lanzar excepciones**:
``````python
except ValueError as e:
    log_error(e)  # Log local
    raise  # Re-lanza para que código superior maneje
``````

**Tipos comunes de excepciones:**
- `Exception`: Clase base de todas las excepciones
- `ValueError`: Valor incorrecto (ej: convertir "abc" a int)
- `TypeError`: Tipo de dato incorrecto
- `KeyError`: Clave no existe en diccionario
- `IndexError`: Índice fuera de rango en lista
- `FileNotFoundError`: Archivo no encontrado
- `ZeroDivisionError`: División por cero
- `AttributeError`: Atributo no existe

**Capturar múltiples excepciones:**
```python
except (ValueError, TypeError):
    # maneja ambos tipos
```

**Capturar todas las excepciones:**
```python
except Exception as e:
    print(f"Error: {e}")
```

**Lanzar excepciones:**
```python
raise ValueError("Mensaje de error")
```

**Crear excepciones personalizadas:**
```python
class MiError(Exception):
    pass
```

**Buenas prácticas:**
- Capturar excepciones específicas, no todas las excepciones
- No usar try/except para control de flujo normal
- Documentar qué excepciones puede lanzar una función
- Limpiar recursos en `finally` (cerrar archivos, conexiones, etc.)


Python tiene una **jerarquía de excepciones**:

BaseException
├── SystemExit
├── KeyboardInterrupt
├── GeneratorExit
└── Exception
    ├── ArithmeticError
    │   ├── ZeroDivisionError
    │   ├── OverflowError
    │   └── FloatingPointError
    ├── LookupError
    │   ├── IndexError
    │   └── KeyError
    ├── ValueError
    ├── TypeError
    ├── AttributeError
    ├── ImportError
    ├── OSError
    │   ├── FileNotFoundError
    │   ├── PermissionError
    │   └── ...
    └── ...


**Capturar por jerarquía**:
``````python
except ArithmeticError:
    # Captura ZeroDivisionError, OverflowError, etc.

except LookupError:
    # Captura IndexError, KeyError

except Exception:
    # Captura casi todo (pero NO SystemExit ni KeyboardInterrupt)
``````

**Orden de except blocks**:

**IMPORTANTE**: Siempre de **más específico a más general**:
``````python
# Correcto
except IndexError:      # Específico
    ...
except LookupError:     # Medio
    ...
except Exception:       # General
    ...

# Incorrecto
except Exception:       # General primero
    ...
except IndexError:      # Nunca se ejecutará!
    ...
``````

**Excepciones que NO debes capturar**:

1. **SystemExit**: Llamado por `sys.exit()` - debe propagarse
2. **KeyboardInterrupt**: Ctrl+C - usuario quiere detener
3. **GeneratorExit**: Generador cerrado - manejo interno
``````python
# MAL
except:  # Captura TODO, incluso SystemExit
    pass

# BIEN
except Exception:  # NO captura SystemExit ni KeyboardInterrupt
    pass
``````

**Exception vs BaseException**:

- `except Exception`: Captura errores del programa (recomendado)
- `except BaseException`: Captura TODO (casi nunca usar)
- `except:` (sin tipo): Equivale a BaseException (evitar)


**En ML**:
``````python
try:
    model.train()
except RuntimeError as e:
    log_error(e)
    save_checkpoint()  # Guardar progreso
    raise  # Permitir que script principal maneje
finally:
    cleanup_gpu_memory()  # Siempre liberar memoria
`````"


# TRABAJO CON ARCHIVOS (FILE I/O)

Python permite leer y escribir archivos de diferentes formatos para trabajar con datos.

## ARCHIVOS DE TEXTO

**Modos de apertura:**
- `'r'`: Lectura (read) - archivo debe existir
- `'w'`: Escritura (write) - crea archivo nuevo o sobrescribe
- `'a'`: Añadir (append) - añade al final del archivo
- `'r+'`: Lectura y escritura
- `'b'`: Modo binario (ej: `'rb'`, `'wb'`)

**Sintaxis básica:**
```python
# Forma tradicional (requiere cerrar el archivo)
archivo = open('nombre.txt', 'r')
contenido = archivo.read()
archivo.close()

# Forma recomendada (context manager - cierra automáticamente)
with open('nombre.txt', 'r') as archivo:
    contenido = archivo.read()
```

**Métodos de lectura:**
- `read()`: Lee todo el contenido
- `readline()`: Lee una línea
- `readlines()`: Lee todas las líneas en una lista

**Métodos de escritura:**
- `write(texto)`: Escribe texto
- `writelines(lista)`: Escribe múltiples líneas

**Encoding:**
Usar `encoding='utf-8'` para caracteres especiales
```python
with open('archivo.txt', 'r', encoding='utf-8') as f:
    contenido = f.read()
```

## ARCHIVOS CSV (Comma-Separated Values)

CSV es uno de los formatos más comunes para datasets en Machine Learning.

**Módulo csv:**
```python
import csv
```

**Lectura de CSV:**
```python
# Leer CSV como lista de listas
with open('datos.csv', 'r') as archivo:
    lector = csv.reader(archivo)
    for fila in lector:
        print(fila)

# Leer CSV como diccionarios (usa la primera fila como claves)
with open('datos.csv', 'r') as archivo:
    lector = csv.DictReader(archivo)
    for fila in lector:
        print(fila)
```

**Escritura de CSV:**
```python
# Escribir desde lista de listas
with open('datos.csv', 'w', newline='') as archivo:
    escritor = csv.writer(archivo)
    escritor.writerow(['columna1', 'columna2'])
    escritor.writerow(['valor1', 'valor2'])

# Escribir desde diccionarios
with open('datos.csv', 'w', newline='') as archivo:
    columnas = ['nombre', 'edad']
    escritor = csv.DictWriter(archivo, fieldnames=columnas)
    escritor.writeheader()
    escritor.writerow({'nombre': 'Ana', 'edad': 25})
```

**Parámetros importantes:**
- `delimiter`: Separador (por defecto ',')
- `quotechar`: Carácter para entrecomillar (por defecto '"')
- `newline=''`: Evita líneas en blanco extra en Windows

## ARCHIVOS JSON (JavaScript Object Notation)

JSON es un formato muy común para configuraciones, APIs y almacenamiento de datos estructurados.

**Módulo json:**
```python
import json
```

**Estructura:**
- Similar a diccionarios de Python
- Tipos de datos: strings, números, booleanos, null, arrays, objetos

**Escritura de JSON:**
```python
# Escribir datos Python a archivo JSON
datos = {"nombre": "Ana", "edad": 25}
with open('datos.json', 'w') as archivo:
    json.dump(datos, archivo)

# Convertir a string JSON
json_string = json.dumps(datos)
```

**Lectura de JSON:**
```python
# Leer JSON desde archivo
with open('datos.json', 'r') as archivo:
    datos = json.load(archivo)

# Parsear string JSON
datos = json.loads(json_string)
```

**Parámetros útiles:**
- `indent`: Añade indentación para mejor legibilidad
- `ensure_ascii=False`: Permite caracteres UTF-8
- `sort_keys=True`: Ordena las claves alfabéticamente

```python
# JSON legible
json.dump(datos, archivo, indent=2, ensure_ascii=False)
```

# MÓDULOS E IMPORTS

Los módulos permiten organizar y reutilizar código, importando funcionalidades de otros archivos o bibliotecas.

## ¿QUÉ ES UN MÓDULO?

Un módulo es un archivo de Python (.py) que contiene definiciones y declaraciones de Python (funciones, clases, variables).

**Tipos de módulos:**
1. **Módulos estándar**: Incluidos con Python (os, sys, math, csv, json, etc.)
2. **Módulos de terceros**: Instalados con pip (numpy, pandas, requests, etc.)
3. **Módulos propios**: Archivos .py que creamos

## IMPORTAR MÓDULOS

**Sintaxis básica:**
```python
import modulo                  # Importar módulo completo
import modulo as alias         # Importar con alias
from modulo import funcion     # Importar función específica
from modulo import *           # Importar todo (no recomendado)
```

**Ejemplos:**
```python
import math
resultado = math.sqrt(16)

import numpy as np             # Alias común
array = np.array([1, 2, 3])

from math import sqrt, pi
resultado = sqrt(16)

from os import path, listdir
```

## MÓDULOS ESTÁNDAR IMPORTANTES

**Para archivos y sistema:**
- `os`: Operaciones del sistema operativo
- `sys`: Parámetros y funciones del sistema
- `pathlib`: Manejo de rutas de archivos

**Para datos:**
- `csv`: Archivos CSV
- `json`: Archivos JSON
- `pickle`: Serialización de objetos

**Para matemáticas:**
- `math`: Funciones matemáticas
- `random`: Números aleatorios
- `statistics`: Estadísticas básicas

**Para tiempo:**
- `time`: Tiempo y delays
- `datetime`: Fechas y horas

**Para web:**
- `urllib`: Cliente HTTP básico
- `http`: Protocolo HTTP

## INSTALAR PAQUETES CON PIP

```bash
pip install nombre_paquete
pip install numpy pandas matplotlib
pip uninstall nombre_paquete
pip list  # Ver paquetes instalados
pip show nombre_paquete  # Ver información
```

## ESTRUCTURA DE IMPORTS

```python
# 1. Biblioteca estándar
import os
import sys
from pathlib import Path

# 2. Bibliotecas de terceros
import numpy as np
import pandas as pd

# 3. Módulos locales
from mi_modulo import mi_funcion
```

# WEB SCRAPING

El web scraping permite extraer datos de páginas web de forma automatizada.

## WEB SCRAPING CON BEAUTIFULSOUP

BeautifulSoup es una biblioteca Python para extraer datos de archivos HTML y XML.

**Instalación:**
```bash
pip install beautifulsoup4
pip install requests
pip install lxml
```

**Importación:**
```python
from bs4 import BeautifulSoup
import requests
```

**Flujo básico:**
1. Hacer petición HTTP para obtener HTML
2. Parsear HTML con BeautifulSoup
3. Encontrar elementos específicos
4. Extraer datos
5. Guardar en archivo

**Parsers disponibles:**
- `'html.parser'`: Parser HTML incluido en Python
- `'lxml'`: Más rápido (requiere instalación)
- `'html5lib'`: Más tolerante (requiere instalación)

**Métodos principales de búsqueda:**
```python
soup.find('tag')               # Primer elemento
soup.find_all('tag')          # Todos los elementos
soup.find(id='elemento')      # Por ID
soup.find(class_='clase')     # Por clase
soup.select('selector CSS')   # Selector CSS
```

**Acceder a contenido:**
```python
elemento.text                  # Texto del elemento
elemento.get_text()           # Texto (con opciones)
elemento['atributo']          # Valor de atributo
elemento.attrs                # Todos los atributos
```

**Buenas prácticas:**
- Respetar robots.txt del sitio
- No hacer scraping masivo (usar delays)
- Verificar términos de servicio del sitio
- Manejar errores (timeout, conexión, etc.)
- Usar User-Agent para identificarse

## WEB SCRAPING CON SCRAPY

Scrapy es un framework potente y completo para web scraping a gran escala.

**Diferencias con BeautifulSoup:**
- **BeautifulSoup**: Biblioteca simple, scraping básico, procesa HTML descargado
- **Scrapy**: Framework completo, scraping avanzado, incluye descarga + procesamiento + almacenamiento

**Ventajas de Scrapy:**
- Manejo automático de requests y delays
- Soporte para scraping multi-página
- Sistema de pipelines para procesar datos
- Manejo de cookies y sesiones
- Exportación automática a múltiples formatos
- Scrapy Shell para debugging
- Más rápido (asíncrono)

**Instalación:**
```bash
pip install scrapy
```

**Estructura de proyecto Scrapy:**
```
mi_proyecto/
    scrapy.cfg
    mi_proyecto/
        __init__.py
        items.py          # Define estructura de datos
        middlewares.py    # Componentes personalizados
        pipelines.py      # Procesa datos extraídos
        settings.py       # Configuración
        spiders/          # Spiders (extractores)
            __init__.py
            mi_spider.py
```

**Spider básico:**
```python
import scrapy

class MiSpider(scrapy.Spider):
    name = 'mi_spider'
    start_urls = ['https://example.com']
    
    def parse(self, response):
        # Extraer datos
        titulo = response.css('h1::text').get()
        
        yield {
            'titulo': titulo
        }
```

**Selectores en Scrapy:**
- CSS: `response.css('selector')`
- XPath: `response.xpath('//xpath')`

**Ejecutar spider:**
```bash
scrapy crawl mi_spider -o resultados.json
scrapy crawl mi_spider -o resultados.csv
```

**Scrapy Shell (debugging):**
```bash
scrapy shell "https://example.com"
# Luego en shell:
>>> response.css('title::text').get()
>>> response.xpath('//h1/text()').get()
```

# PROGRAMACIÓN ORIENTADA A OBJETOS (POO)

La POO es un paradigma fundamental para trabajar con frameworks de IA/ML como PyTorch, TensorFlow y scikit-learn.

## ¿Por qué es importante POO en IA?
- Los modelos de ML son clases (`model = LinearRegression()`)
- Los datasets personalizados son clases
- Las capas de redes neuronales son clases
- Necesitas entender `self`, métodos y atributos para trabajar con estos frameworks

## Conceptos clave:
- **Clase**: Plantilla o molde para crear objetos
- **Objeto**: Instancia de una clase
- **Atributo**: Variable que pertenece a un objeto
- **Método**: Función que pertenece a un objeto
- **Herencia**: Una clase puede heredar propiedades de otra
- **Encapsulación**: Ocultar detalles internos de implementación

# GENERADORES Y YIELD

Los generadores son una forma eficiente de crear iteradores en Python. Son cruciales para trabajar con grandes datasets que no caben en memoria.

## ¿Por qué son importantes en IA/ML?

- **Eficiencia de memoria**: Generan valores uno a la vez (lazy evaluation)
- **Datasets grandes**: Procesar millones de imágenes sin cargar todo en RAM
- **Data augmentation**: Generar variaciones de datos en tiempo real
- **Streaming de datos**: Procesar datos que llegan continuamente

## Diferencias clave:

| Característica | Función normal (return) | Generador (yield) |
|---------------|------------------------|-------------------|
| Retorna | Un valor, luego termina | Múltiples valores, uno a la vez |
| Memoria | Toda la lista en memoria | Un valor a la vez |
| Estado | No se mantiene | Se mantiene entre llamadas |
| Uso | Cuando necesitas todos los datos | Cuando procesas datos grandes |

# TYPE HINTS AVANZADOS

Los type hints (anotaciones de tipo) son sugerencias que documentan qué tipos de datos espera una función. NO son restricciones forzadas en tiempo de ejecución, pero herramientas como `mypy` las pueden verificar.

## ¿Por qué son importantes en IA/ML?

- **Documentación**: Código más legible y autodocumentado
- **IDEs**: Mejor autocompletado y detección de errores
- **Debugging**: Encontrar bugs antes de ejecutar
- **Colaboración**: Equipos grandes se benefician de tipos explícitos
- **Frameworks**: PyTorch, TensorFlow usan type hints extensivamente

## Herramienta recomendada:
```bash
pip install mypy
mypy tu_script.py
```

# EXPRESIONES REGULARES (REGEX)

Las expresiones regulares son patrones para buscar y manipular texto. Son fundamentales en NLP (Procesamiento de Lenguaje Natural) y limpieza de datos.

## ¿Por qué son importantes en IA/ML?

- **NLP**: Tokenización, extracción de entidades, limpieza de texto
- **Preprocesamiento**: Eliminar caracteres especiales, emails, URLs
- **Validación**: Validar formatos de datos (fechas, teléfonos, etc.)
- **Feature extraction**: Extraer características de texto

## Módulo `re` de Python

```python
import re
```

## Patrones básicos:

| Patrón | Significado | Ejemplo |
|--------|-------------|---------|
| `.` | Cualquier carácter | `a.c` → abc, a1c |
| `\d` | Dígito (0-9) | `\d\d` → 42, 99 |
| `\w` | Letra, dígito o _ | `\w+` → hello |
| `\s` | Espacio en blanco | `\s+` → espacios |
| `*` | 0 o más veces | `a*` → "", a, aa |
| `+` | 1 o más veces | `a+` → a, aa |
| `?` | 0 o 1 vez | `a?` → "", a |
| `[]` | Conjunto | `[abc]` → a, b o c |
| `^` | Inicio de línea | `^hello` |
| `$` | Fin de línea | `world$` |

# NUMPY - LIBRERÍA FUNDAMENTAL PARA IA/ML

NumPy (Numerical Python) es la biblioteca fundamental para computación científica en Python. Es la BASE de todo en Machine Learning y Deep Learning.

## ¿Por qué es CRÍTICO en IA/ML?

- **Base de todo**: PyTorch y TensorFlow están construidos sobre NumPy
- **Tensores**: Los arrays de NumPy son similares a tensores
- **Operaciones vectoriales**: 100x más rápido que listas de Python
- **Álgebra lineal**: Multiplicación de matrices, productos punto, etc.
- **Broadcasting**: Operaciones entre arrays de diferentes dimensiones

## Instalación:
```bash
pip install numpy
```

## Importación estándar:
```python
import numpy as np
```

# PANDAS - ANÁLISIS Y MANIPULACIÓN DE DATOS

Pandas es LA biblioteca para trabajar con datos tabulares (como Excel/CSV). Es esencial para exploración, limpieza y preparación de datos en ML.

## ¿Por qué es CRÍTICO en IA/ML?

- **90% del tiempo en ML**: Se pasa en limpieza y preparación de datos
- **DataFrames**: Estructura tabular perfecta para datasets
- **Análisis exploratorio**: Estadísticas, visualizaciones rápidas
- **Integración**: Funciona perfectamente con NumPy y scikit-learn

## Instalación:
```bash
pip install pandas
```

## Importación estándar:
```python
import pandas as pd
```

## Estructuras de datos:
- **Series**: Array 1D etiquetado (como una columna)
- **DataFrame**: Tabla 2D (como Excel/SQL)

# MATPLOTLIB Y SEABORN - VISUALIZACIÓN DE DATOS

La visualización es esencial para entender datos, detectar patrones, outliers y comunicar resultados en ML.

## ¿Por qué son importantes en IA/ML?

- **Análisis exploratorio**: Entender distribuciones, correlaciones, outliers
- **Debugging de modelos**: Visualizar curvas de aprendizaje, confusión matrices
- **Comunicación**: Presentar resultados de forma clara
- **Feature engineering**: Identificar relaciones entre variables

## Bibliotecas:

- **Matplotlib**: Base de visualización (más control, más código)
- **Seaborn**: Construido sobre Matplotlib (más fácil, gráficos bonitos)

## Instalación:
```bash
pip install matplotlib seaborn
```

## Importación estándar:
```python
import matplotlib.pyplot as plt
import seaborn as sns
```