<img src="https://i.postimg.cc/cCjTSn8r/ss-cumf.png" alt="reporte" border="0"/>

# **DATACLASES & PYDANTIC**

## **ORM**
Un Object Relational Mapper (ORM) es una herramienta de programación que facilita la interacción entre sistemas de gestión de bases de datos relacionales (como MySQL, PostgreSQL, SQLite, etc.) y el código de una aplicación en un lenguaje de programación orientado a objetos, como Python, Java o Ruby.

La idea central detrás de un ORM es proporcionar una interfaz orientada a objetos para trabajar con datos en lugar de tener que usar consultas SQL directamente. Esto facilita la manipulación y persistencia de datos en la base de datos mediante el uso de clases y objetos en el código, lo que hace que el desarrollo de aplicaciones sea más intuitivo y menos dependiente de detalles específicos de la base de datos.


<img src="https://cipsa.net/wp-content/uploads/01-img-Que-es-un-ORM-y-cuando-emplearlo.png.webp" alt="reporte" border="0"/>



<img src="https://www.fullstackpython.com/img/visuals/orms-bridge.png" alt="reporte" border="0"/>



## **DATACLASES**


Las data classes están diseñadas para reducir la cantidad de código repetitivo que a menudo se encuentra al definir clases que solo tienen campos para almacenar datos y no tienen una lógica compleja. Ejemplo:

si quisieramos crear el objeto persona normalmente, realizariamos el constructur y se realizaria de la siguiente manera

```python
class Person:
  def __init__(self, name, age):
      self.name = name
      self.age = age
```

Y si tuvieramos que crear muchos objetos serián trabajos muy repetitivos.


Las `dataclases` son un nuevo módulo agregado en la biblioteca estándar de Python desde la versión 3.7. Define el decorador @dataclass que genera automáticamente el método mágico del constructor `__init__()`, el método de representación de cadenas `__repr__()`, el método `__eq__()` que sobrecarga el operador `== `(y algunos más) para una clase definida por el usuario.



```python
@dataclass
class Person:
  name: str
  age: int
```





In [61]:
# muchos datos asociados a un proceso, es mala practica tenerlos en variables separadas
device_type: str
status: str
project: str
# enviar estas variables a otro proceso, quiere decir que la funcion que las va a recibir
# necesita tener la misma cantidad de variables


# buena practica
@dataclass
class EjemploNasa:
  device_type: str
  status: str
  project: str
  on: int = 0

# usando clases con atributos, puedo enviar varias cosas en una solo objeto
objeto = EjemploNasa(device_type = "CAR", status="unknown", project="COLONY_MONN")
print(objeto)
print(objeto.status)

EjemploNasa(device_type='CAR', status='unknown', project='COLONY_MONN', on=0)
unknown


In [64]:
from dataclasses import dataclass
from typing import List # importancia de usar typing

@dataclass
class Ejemplo:
  edad: int
  etiquetas: List[str]


ejemplo = Ejemplo(edad=1, etiquetas=["s"])
print(ejemplo)

Ejemplo(edad=1, etiquetas=['s'])


In [65]:

ejemplo = Ejemplo(edad="abc", etiquetas={})
print(ejemplo)

Ejemplo(edad='abc', etiquetas={})


## **PYDANTIC**
<p><img src="https://www.sequoiacap.com/wp-content/uploads/sites/6/2023/08/name-and-logo-path.svg" alt="" width="500" height="300" /></p>

**Pydantic** es una biblioteca de **Python** que se utiliza para validar y serializar datos en aplicaciones Python. Proporciona una forma sencilla y declarativa de definir modelos de datos (schemas) utilizando clases de Python. Estos modelos pueden contener anotaciones de tipo que describen la estructura y los tipos de datos esperados. Pydantic se utiliza comúnmente en aplicaciones web, API, procesamiento de datos y cualquier escenario donde la validación y la serialización de datos sean necesarias.

### **DIFERENCIAS DATACLASES VS PYDENTIC**

Las dataclasses y Pydantic son dos enfoques diferentes para trabajar con estructuras de datos en Python, y cada uno tiene sus propias características y casos de uso específicos. Aquí hay una comparación de las diferencias clave entre dataclasses y Pydantic:

**Dataclasses:**

* **Estándar de Python**: Las dataclasses son una característica estándar de Python introducida a partir de `Python 3.7`. No requieren bibliotecas externas y están disponibles en la biblioteca estándar de Python.

* **Sintaxis sencilla**: La sintaxis para definir dataclasses es simple y se basa en decoradores. Puedes definir una dataclass utilizando el decorador @dataclass.

* **Menos funcionalidad incorporada**: Las dataclasses proporcionan funcionalidad básica como la generación automática de los métodos `__init__()`, `__repr__()`, `__eq__()`, entre otros. No incluyen validación de tipos incorporada ni capacidad de serialización y deserialización.

* **No requiere definición explícita de tipos**: En las dataclasses, no es necesario definir explícitamente los tipos de atributos a través de anotaciones de tipo, aunque es común hacerlo para documentación y claridad.

* **No incluye validación avanzada**: Las dataclasses no realizan validación avanzada de datos. No verifican que los valores sean válidos según un esquema específico.

**Pydantic:**

* **Biblioteca externa**: Pydantic es una biblioteca de terceros que debes instalar por separado utilizando pip. No es una característica estándar de Python.

* **Sintaxis más detallada**: Pydantic utiliza una sintaxis más detallada para definir modelos de datos. Debes crear clases derivadas de pydantic.BaseModel y definir atributos con tipos de datos específicos y validadores.

* **Funcionalidad avanzada**: Pydantic proporciona una amplia gama de funcionalidades avanzadas, incluyendo validación de tipos, conversión de tipos, serialización y deserialización de datos, manejo de esquemas JSON y más.

* **Validación de tipos incorporada**: Pydantic realiza una validación exhaustiva de los datos de entrada y garantiza que cumplan con los tipos especificados en el modelo, lo que ayuda a prevenir errores en tiempo de ejecución.

* **Esquemas y serialización**: Pydantic permite definir esquemas de datos más complejos y admite la serialización y deserialización de datos en formatos como JSON.

**QUIEN LO USA**

<p><img src="https://i.postimg.cc/T3KwcZsz/customers.png" alt="" width="500" height="500" /></p>

In [66]:
# solo para google colab
!pip install tensorflow --upgrade --quiet # colab topics
!pip install pydantic --upgrade --quiet

# en sus proyectos
# pip install pydantic
# poetry add pydantic

In [39]:
from pydantic import BaseModel, Field, validator
from decimal import Decimal
from typing_extensions import Annotated
import pydantic

In [67]:
class Ejemplo(BaseModel):
  edad: int
  etiquetas: List[str]

ejemplo_pd = Ejemplo(edad=1, etiquetas=["s"])
print(ejemplo_pd)

edad=1 etiquetas=['s']


In [68]:
ejemplo = Ejemplo(edad="abc", etiquetas={})
print(ejemplo)

ValidationError: 2 validation errors for Ejemplo
edad
  Input should be a valid integer, unable to parse string as an integer [type=int_parsing, input_value='abc', input_type=str]
    For further information visit https://errors.pydantic.dev/2.5/v/int_parsing
etiquetas
  Input should be a valid list [type=list_type, input_value={}, input_type=dict]
    For further information visit https://errors.pydantic.dev/2.5/v/list_type

In [69]:
ejemplo = Ejemplo(edad=1, etiquetas=[1])
print(ejemplo)

ValidationError: 1 validation error for Ejemplo
etiquetas.0
  Input should be a valid string [type=string_type, input_value=1, input_type=int]
    For further information visit https://errors.pydantic.dev/2.5/v/string_type

### **FIELD**

Es una clase que se utiliza para personalizar la validación y configuración de los campos en los modelos definidos con Pydantic.

#### **DEFAULT**

In [72]:
from uuid import uuid4
class Usuario(BaseModel):
  nombre: str = Field(default='Luis')
  nombre_2: str = "Fernando"

usuario = Usuario()
print(usuario)

nombre='Luis' nombre_2='Fernando'


#### **DEFAULT FACTORY**

In [77]:
from uuid import uuid4
class Usuario(BaseModel):
  id: str = Field(default_factory=lambda: uuid4().hex)
  fecha: str = Field(default_factory=lambda: "18/01/2024")
usuario = Usuario()
print(usuario)

id='2a078912bd0547848f9dcec5dbb01194' fecha='18/01/2024'


#### **ALIAS**

produndizar enmascaramiento

In [79]:
class Usuario(BaseModel):
  secreto: str = Field(..., alias="token")
  nombre_completo_usuario_bootcamp: str = Field(default='ac', alias="nusbootc")

usuario = Usuario(token="123")
print(usuario)

# activar los alias
print(usuario.model_dump(by_alias=True))

secreto='123' nombre_completo_usuario_bootcamp='ac'
{'token': '123', 'nusbootc': 'ac'}


#### **RESTRICCIONES NÚMERICAS (NUMERIC CONSTRAINTS)**

* **gt** : mayor que(*greater than*)
* **lt** : menor que(*less than*)
* **ge** : mayor o igual que(*greater than or equal to*)
* **le** : menor o igual que(*less than or equal to*)
* **multiple_of** : multiplo de un numero dado
* **allow_inf_nan**  permite valores '`inf`', '`-inf`', '`nan`'
* **decimal_places** : max decimales

In [81]:
class Numeros(BaseModel):
  positivo: int = Field(gt=0)
  # 1 validar que el num sea entero : if isinstance(numero, int)
  # 2 validar que el num sea mayor a 0 : if numero > 0:
  no_genativo: int = Field(ge=0)
  negativo: int = Field(lt=0)
  no_positivo: int = Field(le=0)
  multiplo: int = Field(multiple_of=2)
  datos_nan: float = Field(allow_inf_nan=True)

  decimal: Decimal = Field(max_digits=3, decimal_places=1)

numeros = Numeros(
  positivo=1,
  no_genativo=0,
  negativo=-1,
  no_positivo=0,
  multiplo=10,
  datos_nan=float('inf'),
  decimal=Decimal('12.1')
)
print(numeros)

positivo=1 no_genativo=0 negativo=-1 no_positivo=0 multiplo=10 datos_nan=inf decimal=Decimal('12.1')


In [82]:
class PersonaDisco(BaseModel):
  mayor: int = Field(default=18, ge=18)
  menor: int = Field(default=5, ge=5, lt=18)

In [84]:
# validación mayor de edad
print(PersonaDisco(mayor=19))
PersonaDisco(mayor=10)

mayor=19 menor=5


ValidationError: 1 validation error for PersonaDisco
mayor
  Input should be greater than or equal to 18 [type=greater_than_equal, input_value=10, input_type=int]
    For further information visit https://errors.pydantic.dev/2.5/v/greater_than_equal

In [86]:
# validación menor de edad
print(PersonaDisco(menor=8))
PersonaDisco(menor=21)

mayor=18 menor=8


ValidationError: 1 validation error for PersonaDisco
menor
  Input should be less than 18 [type=less_than, input_value=21, input_type=int]
    For further information visit https://errors.pydantic.dev/2.5/v/less_than

## **BOLEANOS**

In [88]:
class Booleanos(BaseModel):
  demo: bool
# verdadero
print("imprimiendo True \n")
booleanos1 = Booleanos(demo=1)
booleanos2 = Booleanos(demo=True)
booleanos3 = Booleanos(demo='true')
booleanos4 = Booleanos(demo='on')
booleanos5 = Booleanos(demo='yes')

# falso
booleanos6 = Booleanos(demo=0)
booleanos7 = Booleanos(demo=False)
booleanos8 = Booleanos(demo='false')
booleanos9 = Booleanos(demo='off')
booleanos10 = Booleanos(demo='no')
print(booleanos1)
print(booleanos2)
print(booleanos3)
print(booleanos4)
print(booleanos5)

print("\nimprimiendo Fasle \n")
print(booleanos6)
print(booleanos7)
print(booleanos8)
print(booleanos9)
print(booleanos10)

imprimiendo True 

demo=True
demo=True
demo=True
demo=True
demo=True

imprimiendo Fasle 

demo=False
demo=False
demo=False
demo=False
demo=False


### **RESTRICCIONES DE TEXTO (TEXT CONSTRAINTS)**

* **min_length** : Longitud min
* **max_length** : Longitud min
* **max_digits** : max numeros enteros
* **pattern** : aplica expresiones regulares

In [89]:
class Textos(BaseModel):
  corto: str = Field(min_length=3)
  largo: str = Field(max_length=10)
  regex: str = Field(pattern=r'^\d*$') # solo numeros

texto = Textos(
  corto='abc',
  largo='abcdefg',
  regex="123"
)

print(texto)

corto='abc' largo='abcdefg' regex='123'


In [90]:
texto = Textos(
  corto='an',
  largo='abcdefg',
  regex="123d"
)

ValidationError: 2 validation errors for Textos
corto
  String should have at least 3 characters [type=string_too_short, input_value='an', input_type=str]
    For further information visit https://errors.pydantic.dev/2.5/v/string_too_short
regex
  String should match pattern '^\d*$' [type=string_pattern_mismatch, input_value='123d', input_type=str]
    For further information visit https://errors.pydantic.dev/2.5/v/string_pattern_mismatch

### **ENUMERADORES**

In [40]:
from enum import Enum

In [105]:
class EstadoProducto(str, Enum):
  MALO: str = 'malo'
  BUENO: str = 'bueno'
  MASO: str = 'si_pero_no'

class Producto(BaseModel):
  producto: str
  estado: EstadoProducto

Producto(
  producto="BootCamp",
  estado= "bueno"
)



Producto(producto='BootCamp', estado=<EstadoProducto.BUENO: 'bueno'>)

In [106]:
Producto(
  producto="BootCamp",
  estado= "xyz",
)

ValidationError: 1 validation error for Producto
estado
  Input should be 'malo', 'bueno' or 'si_pero_no' [type=enum, input_value='xyz', input_type=str]

#### **ANOTACIONES**

`Annotated` es utilizada para proporcionar anotaciones adicionales a las variables en Python. Esta clase permite agregar información adicional sobre las variables, como metadata o restricciones, lo que puede ser útil en el contexto de la verificación estática de tipos y en el desarrollo de aplicaciones más robustas.

In [42]:
# info adicional | meterlo en un modelo
nombre: Annotated[str, "este es el nombre de una persona"] = "demo"
print(nombre)

demo


In [107]:
# campo personalizado
EnteroPositivo = Annotated[int, Field(gt=0), "un campo personalizado"]

In [109]:
class Producto(BaseModel):
  valor_positivo: EnteroPositivo
  estado: Annotated[EstadoProducto, Field(default="bueno", description="demo annotated")]


Producto(valor_positivo=1, estado="si_pero_no")

Producto(valor_positivo=1, estado=<EstadoProducto.MASO: 'si_pero_no'>)

In [110]:
Producto(valor_positivo=-1, estado="xyz_si_pero_no")

ValidationError: 2 validation errors for Producto
valor_positivo
  Input should be greater than 0 [type=greater_than, input_value=-1, input_type=int]
    For further information visit https://errors.pydantic.dev/2.5/v/greater_than
estado
  Input should be 'malo', 'bueno' or 'si_pero_no' [type=enum, input_value='xyz_si_pero_no', input_type=str]

In [111]:
class Usuariocurso(BaseModel):
  nombre: str
  edad: EnteroPositivo

#### **VALIDACIONES**

In [116]:
from datetime import datetime
from pydantic import field_validator

class MiModelo(BaseModel):
  fecha: str

  @field_validator('fecha')
  def validar_fecha(cls, valor):
    try:
        datetime.strptime(valor, "%d/%m/%Y")
    except ValueError:
        raise ValueError("el formato de fecha no es válido. Formato: dd/mm/yyyy")
    return valor

In [113]:
MiModelo(fecha="18/01/2024")

MiModelo(fecha='18/01/2024')

In [117]:
MiModelo(fecha="18/01/20")

ValidationError: 1 validation error for MiModelo
fecha
  Value error, el formato de fecha no es válido. Formato: dd/mm/yyyy [type=value_error, input_value='18/01/20', input_type=str]
    For further information visit https://errors.pydantic.dev/2.5/v/value_error