
# Ejercicio final: Extraer información de un archivo JSON usando expresiones regulares (regex)


## Objetivo:

El objetivo de este ejercicio es practicar la utilización de expresiones regulares (regex) para extraer información específica de un archivo JSON. El ejercicio se enfocará en la lectura y análisis de un archivo JSON que contiene información sobre clientes.

## Descripción:

### Obtener el archivo JSON:
Lea archivo JSON 'clientes.json' que contiene la información sobre clientes. El archivo debe tener una estructura similar a la siguiente:

In [None]:
{
  "clientes": [
    {
      "nombre": "Juan Pérez",
      "direccion": "Calle Mayor 123",
      "ciudad": "San José",
      "telefono": "+506 2222-3333"
    },
    {
      "nombre": "María Gómez",
      "direccion": "Avenida Central 456",
      "ciudad": "Alajuela",
      "telefono": "+506 8888-4444"
    },
    {
      "nombre": "Pedro Ramírez",
      "direccion": "Barrio Escalante 789",
      "ciudad": "Heredia",
      "telefono": "+506 5555-6666"
    },
    {
      "nombre": "Ana Castro",
      "direccion": "Avenida 10 Calle 5",
      "ciudad": "Cartago",
      "telefono": "+506 3333-4444"
    },
    {
      "nombre": "Carlos Jiménez",
      "direccion": "Calle Principal 12",
      "ciudad": "Liberia",
      "telefono": "+506 6666-7777"
    },
    {
      "nombre": "Diana Solano",
      "direccion": "Barrio La Unión 78",
      "ciudad": "Puntarenas",
      "telefono": "+506 9999-8888"
    }
  ]
}

##

## Extraer información usando regex:
### Utilice expresiones regulares para extraer la siguiente información de cada cliente:
- Nombre completo: Juan Pérez, María Gómez, Pedro Ramírez
- Dirección completa: Calle Mayor 123, Avenida Central 456, Barrio Escalante 789
- Ciudad: San José, Alajuela, Heredia
- Número de teléfono: +506 2222-3333, +506 8888-4444, +506 5555-6666

### Imprima la información extraída para cada cliente en un formato claro y organizado.


## Pistas:

- Utilice la librería re de Python para trabajar con expresiones regulares.
- Defina patrones de expresión regular específicos para cada tipo de información que desea extraer.
- Recorra el archivo JSON y aplique los patrones regex a cada cliente.
- Utilize métodos como findall() o search() para encontrar las coincidencias en el texto.

In [5]:
import json
import re

# Cargar el archivo JSON
try:
    with open("clientes.json", "r", encoding="utf-8",errors ="replace") as archivo:
        datos_clientes = json.load(archivo)
except FileNotFoundError as e:
    print(f"Error: El archivo JSON 'clientes.json' no se encontró.")
except json.JSONDecodeError as e:
    print(f"Error al decodificar el archivo JSON: {e}")
except Exception as e:
    print(f"Error inesperado: {e}")

def reparar_texto(texto):
    return texto.encode("latin1").decode("utf-8")

# Leer el archivo clientes.json
#with open("clientes.json", "r", encoding="utf-8") as f:
#    data = json.load(f)

# Definir expresiones regulares para cada campo
patron_nombre = re.compile(r"^[A-ZÁÉÍÓÚÑ][a-záéíóúñ]+(?:\s[A-ZÁÉÍÓÚÑ][a-záéíóúñ]+)*$")
patron_direccion = re.compile(r"^[A-Za-zÁÉÍÓÚáéíóúñÑ\s\d]+$")
patron_ciudad = re.compile(r"^[A-Za-zÁÉÍÓÚáéíóúñÑ\s]+$")
patron_telefono = re.compile(r"\+506\s\d{4}-\d{4}")

# Recorrer la lista de clientes
for cliente in datos_clientes["clientes"]:
    # Obtener y reparar los datos
    nombre = reparar_texto(cliente.get("nombre", "Desconocido"))
    direccion = reparar_texto(cliente.get("direccion", "Desconocida"))
    ciudad = reparar_texto(cliente.get("ciudad", "Desconocida"))
    telefono = reparar_texto(cliente.get("telefono", "Desconocido"))

    # Buscar coincidencias con regex usando search() y findall()
    nombre_match = re.search(patron_nombre, nombre)
    direccion_match = re.search(patron_direccion, direccion)
    ciudad_match = re.search(patron_ciudad, ciudad)
    telefono_match = re.findall(patron_telefono, telefono)  # findall devuelve una lista

    # Si todas las coincidencias son válidas, mostrar la información
    if nombre_match and direccion_match and ciudad_match and telefono_match:
        print(f"📌 Cliente:")
        print(f"   📌 Nombre: {nombre_match.group()}")
        print(f"   📌 Dirección: {direccion_match.group()}")
        print(f"   📌 Ciudad: {ciudad_match.group()}")
        print(f"   📌 Teléfono: {telefono_match[0]}")  # Como es una lista, tomamos el primer resultado
        print("-" * 50)
    else:
        print(f"❌ Datos inválidos para el cliente: {nombre}")


📌 Cliente:
   📌 Nombre: Juan Pérez
   📌 Dirección: Calle Mayor 123
   📌 Ciudad: San José
   📌 Teléfono: +506 2222-3333
--------------------------------------------------
📌 Cliente:
   📌 Nombre: María Gómez
   📌 Dirección: Avenida Central 456
   📌 Ciudad: Alajuela
   📌 Teléfono: +506 8888-4444
--------------------------------------------------
📌 Cliente:
   📌 Nombre: Pedro Ramírez
   📌 Dirección: Barrio Escalante 789
   📌 Ciudad: Heredia
   📌 Teléfono: +506 5555-6666
--------------------------------------------------
📌 Cliente:
   📌 Nombre: Ana Castro
   📌 Dirección: Avenida 10 Calle 5
   📌 Ciudad: Cartago
   📌 Teléfono: +506 3333-4444
--------------------------------------------------
📌 Cliente:
   📌 Nombre: Carlos Jiménez
   📌 Dirección: Calle Principal 12
   📌 Ciudad: Liberia
   📌 Teléfono: +506 6666-7777
--------------------------------------------------
📌 Cliente:
   📌 Nombre: Diana Solano
   📌 Dirección: Barrio La Unión 78
   📌 Ciudad: Puntarenas
   📌 Teléfono: +506 9999-8888
----