**CLASE 6 : Composición inteligente de estructuras – práctica integral**

**Objetivos de la clase**

1. Elegir la estructura adecuada para cada tipo de dato
    * No todo se resuelve con listas. A veces un set es mejor (unicidad), un dict (mapeo clave-valor) o incluso combinaciones como dict[str, list[dict]].

2. Usar IA y otras herramientas para transformar, validar y limpiar estructuras mal diseñadas

    * Convertir datos anidados confusos en estructuras claras y consistentes.
    * Ejemplo: limpiar duplicados, normalizar campos de texto.

3. Refactorizar: quitar redundancias, aplicar estructuras correctas para mejorar legibilidad y eficiencia.

**1. Elección de la estructura adecuada**

_En Python tenemos:_

* Listas (**list**) → datos ordenados, permiten duplicados.

* Tuplas (**tuple**) → datos ordenados e inmutables.

* Conjuntos (**set**) → colecciones sin duplicados, no ordenadas.

* Diccionarios (**dict**) → pares clave-valor, ideal para representar relaciones.

_Revisar el siguiente ejemplo:_

In [2]:
# Lista de autores (ordenada, Puede repertirse)
autores = ["Gabriel Gacía Márquez", "Julio Cortázar", "Gabriel Gacía Márquez"]
autores

['Gabriel Gacía Márquez', 'Julio Cortázar', 'Gabriel Gacía Márquez']

In [3]:
# Conjunto de autores (unicidad Garantizada)
autores_unicos = set(autores)
autores_unicos

{'Gabriel Gacía Márquez', 'Julio Cortázar'}

In [4]:
# Diccionario Libro y autor
libros = {
    "Cien años de Soledad": "Gabriel García Márquez",
    "Rayuela": "Julio Cortázar"
}
libros

{'Cien años de Soledad': 'Gabriel García Márquez', 'Rayuela': 'Julio Cortázar'}

**Estructuras Aninadas:**

Muchas veces necesitamos estructuras dentro de otras:

* Listas dentro de diccionarios
* Diccionarios dentro de listas
* Diccionarios dentro de diccionarios
* Listas dentro de listas
* Tuplas dentro de listas
* Listas dentro de tuplas
* Diccionarios dentro de tuplas
* Tuplas dentro de diccionarios
* Listas dentro de listas de listas
* Listas dentro de listas de tuplas
* Listas dentro de listas de diccionarios
* Listas dentro de tuplas de listas
* Listas dentro de tuplas de diccionarios
* Listas dentro de diccionarios de listas
* Listas dentro de diccionarios de tuplas
* Listas dentro de diccionarios de diccionarios
* Tuplas dentro de listas de listas
* Tuplas dentro de listas de tuplas
* Tuplas dentro de listas de diccionarios

_podemos anidar mas estructuras dentro de otras._

Realiza un ejemplo de cada tipo de estructura anidada.


In [5]:
# Tenemos un diccionaro con dos claves libros y prestamos que estan apunto a la lista de diccionarios.
biblioteca ={
    "libros": [
        {"titulo": "Cien años de Soledad", "autor": "Gabriel García Márquez", "año": 1967},
        {"titulo": "Rayuela", "autor": "Julio Cortázar", "año": 1963}
    ],
    "prestados": [
        {"libro": "Cien años de Soledad", "usario": "carlos", "fecha": "2023-07-15"},
    ]
}

biblioteca

{'libros': [{'titulo': 'Cien años de Soledad',
   'autor': 'Gabriel García Márquez',
   'año': 1967},
  {'titulo': 'Rayuela', 'autor': 'Julio Cortázar', 'año': 1963}],
 'prestados': [{'libro': 'Cien años de Soledad',
   'usario': 'carlos',
   'fecha': '2023-07-15'}]}

In [6]:
# Ejemplo de Diccionarios dentro de listas

# Lista de libros con diccionarios
lista_de_libros = [
    {"titulo": "Cien años de Soledad", "autor": "Gabriel García Márquez", "año": 1967},
    {"titulo": "Rayuela", "autor": "Julio Cortázar", "año": 1963}
]

lista_de_libros

[{'titulo': 'Cien años de Soledad',
  'autor': 'Gabriel García Márquez',
  'año': 1967},
 {'titulo': 'Rayuela', 'autor': 'Julio Cortázar', 'año': 1963}]

In [7]:
# Diccionarios dentro de diccionarios


# Esto es un ejemplo de Diccionarios dentro de diccionarios
biblioteca_diccionarios = {
    "libros": {
        "Cien años de Soledad": {"autor": "Gabriel García Márquez", "año": 1967},
        "Rayuela": {"autor": "Julio Cortázar", "año": 1963}
    },
    "prestamos": {
        "Carlos": [{"libro": "Cien años de Soledad", "fecha": "2023-07-15"}]
    }
}

biblioteca_diccionarios


{'libros': {'Cien años de Soledad': {'autor': 'Gabriel García Márquez',
   'año': 1967},
  'Rayuela': {'autor': 'Julio Cortázar', 'año': 1963}},
 'prestamos': {'Carlos': [{'libro': 'Cien años de Soledad',
    'fecha': '2023-07-15'}]}}

**Transformación y limpieza**

_Transformar estructuras desordenadas o inconsistentes en algo limpio y fácil de usar._

In [8]:
# datos inconsistentes y mal estructurados
datos_inconsistentes = [
    {"book": " Rayuela", "author": "Julio cortázar", "date": "1963"},
    {"book": "Cien años de Soledad", "author": "gabriel garcía márquez", "date": "1967"},
    {"book": "Rayuela", "author": "Julio Cortázar", "date": "1963"}
]

datos_inconsistentes

[{'book': ' Rayuela', 'author': 'Julio cortázar', 'date': '1963'},
 {'book': 'Cien años de Soledad',
  'author': 'gabriel garcía márquez',
  'date': '1967'},
 {'book': 'Rayuela', 'author': 'Julio Cortázar', 'date': '1963'}]

**Problemas**:

1. Autores escritos con mayúsculas inconsistentes.

2. Duplicados.

3. Claves en inglés mezcladas con español.

**Refactorización** **Limpia**:

1. Esta Funcion realiza la limpieza de los datos.
2. Normaliza los campos de texto.
3. Elimina duplicados los nombres de autores.
4. Devuelve una lista de diccionarios con la estructura limpia.
5. La estructura final es una lista de diccionarios con claves "titulo", "autor" y "año".
6. La función utiliza un conjunto para rastrear los libros ya vistos y evitar duplicados.
7. La normalización de los nombres de autores se realiza convirtiendo a título y eliminando espacios adicionales. El año se convierte a entero para asegurar consistencia en el tipo de dato.
8. Esta función es útil para limpiar y estructurar datos de una biblioteca o colección de libros.

In [9]:
# Función para limpiar y normalizar datos de libros
def limpiar_datos(datos): # datos es una lista de diccionarios
    estructura_limpia = [] # Lista para almacenar los datos limpios
    vistos = set() # Conjunto para rastrear libros ya vistos

    for d in datos: # Recorrer cada dato en la lista
        libro = d["book"].strip()  # Eliminar espacios
        autor = d["author"].title().strip() # Normalizar autor a título y eliminar espacios
        año = int(d["date"]) # Convertir año a entero

        # Generar clave única para cada libro
        clave = (libro, autor, año)  # clave es un tuple para evitar duplicados
        if clave not in vistos: # vistos es un conjunto para evitar duplicados
            vistos.add(clave) # Agregar clave al conjunto de vistos
            estructura_limpia.append({ # Agregar datos limpios a la lista de estructuras limpias
                "titulo": libro, # Normalizar título del libro
                "autor": autor, # Normalizar autor
                "año": año # Normalizar año
            })
    return estructura_limpia # Devolver la lista de estructuras limpias

# datos inconsistentes es una lista de diccionarios con claves "book", "author" y "date"
biblioteca_limpia = limpiar_datos(datos_inconsistentes)
print(biblioteca_limpia)

[{'titulo': 'Rayuela', 'autor': 'Julio Cortázar', 'año': 1963}, {'titulo': 'Cien años de Soledad', 'autor': 'Gabriel García Márquez', 'año': 1967}]


La fncion genero una estructura coherente, sin duplicados, normalizada y lista para usarse.

**Refactorización**
Replatear la estructura:




1. Evistar redundacia de datos.
2. Mejorar la accesibilidad de los datos
3. Claridad en las relaciones.

In [10]:
# Ejemplo no refactorizado
prestamos = [
    {"titulo": "Cien Años de Soledad", "usuario": "Carlos", "fecha": "2023-07-15"},
    {"titulo": "Cien Años de Soledad", "usuario": "Carlos", "fecha": "2023-07-16"}
]
prestamos

[{'titulo': 'Cien Años de Soledad',
  'usuario': 'Carlos',
  'fecha': '2023-07-15'},
 {'titulo': 'Cien Años de Soledad',
  'usuario': 'Carlos',
  'fecha': '2023-07-16'}]

In [11]:
# Ejemplo Refactorizado
prestamos = {
    "Carlos": [
        {"titulo": "Cien Años de soledad", "fecha": "2023-07-15"},
    ]
}
prestamos

{'Carlos': [{'titulo': 'Cien Años de soledad', 'fecha': '2023-07-15'}]}

Ahora sabemos qué usuario pidió qué libros, sin duplicar información.

**Esquema de Biblioteca**

1.   Libros
2.   Autores
3.   Préstamos

Nota:



*   elegir la estrutura
*   limpiar y normalizar datos
*   refactorización del comido, eliminando datos duplicados y rebundancia
*   Usar  estructuras anidadas  para remplazar relaciones reales:
    Libros > autors > préstamos

In [12]:
biblioteca = {
    "autores": {
        "Gabriel García Márquez": {"nacionalidad": "Colombiano"},
        "Julio Cortazar": {"nacionalidad": "Argentino"}
    },
    "libros": {
        "Cien años de soledad": {"autor": "Gabriel García Márquez", "año": 1967},
        "Rayuela": {"autor": "Julio Cortazar", "año": 1963}
    },
    "prestamos": {
        "Carlos": [{
            "libro": "Cien Años de Soledad", "fecha": "2023-07-15"
        }]
    }
}
biblioteca

{'autores': {'Gabriel García Márquez': {'nacionalidad': 'Colombiano'},
  'Julio Cortazar': {'nacionalidad': 'Argentino'}},
 'libros': {'Cien años de soledad': {'autor': 'Gabriel García Márquez',
   'año': 1967},
  'Rayuela': {'autor': 'Julio Cortazar', 'año': 1963}},
 'prestamos': {'Carlos': [{'libro': 'Cien Años de Soledad',
    'fecha': '2023-07-15'}]}}