# Proyecto Final de SQL

## Proyecto

SQL vs hojas de cálculo para gestionar la informacion

El presente proyecto busca, además de poner a prueba todo todo lo aprendido en los temas de SQL, demostrar por qué es mejor gestionar nuestros datos en Bases de Datos, y como el uso de lenguajes de programación maximizan las labores de la gestión de la información.

 Se debe demostrar por qué el pasar a utilizar Bases de Datos es bastante más aconsejable que mantener nuestra información hojas actualizadas de excel.

1. Brinde por lo menos 5 argumentos técnicos de por qué es mejor gestionar los datos en bases de datos, y no en hojas de cálculo.
2. Diseñe un esquema de base de datos (snowflake), en donde ud analizará los gastos de una compañía. El esquema debe contener una tabla hecho, y por lo menos 6 tablas de dimensión (DDL). 
3. EXTRA: Se desea visualizar el esquema de la base de datos, con sus tablas y sus relaciones según las llaves. Por ejemplo
4. Inserte, para la tabla de hecho, por lo menos 1000 casos, y para las demás tablas de dimensión, por lo menos 30 casos. En este caso, es recomendable que use Python para generar el código SQL con los datos simulados a ser importantes (DML).
5. Cree ciertas reglas para que solo las personas con los correos “admin@mundodata.com ” , “fernando@mundodata.com”, “jennifer@mundodata.com ” y “oscar@mundodata.com” sean los únicos que pueden ingresar a la base de datos (DCL).
6. A la hora de insertar los casos, muestre que la transacciones fueron ejecutadas, y que ahora son parte de la base de datos (TCL). 
7. EXTRA: se puede crear algun tipo de alerta que indica a cierta persona, por email, que cuando se insertaron los datos de forma correcta, esta llegue al administrador de la plataforma ?
8. Muestreo con unas 10 consultas a la base de datos, algunos resultados que podrían ser de interés (DQL).
9. Se desea escalar este sistema, y mostrar que la base de datos se puede estar ingestando información, sin necesidad de importar o hacer un proceso manual, esto es, tan solo con programación. Muestre en una primera forma, como se tienen tres tablas con información externa, y estas se pueden ingestar a la base de datos.
10. EXTRA: sería adecuado crear una tarea automática o rutina, que cada hora produzca datos, y estos datos, deben ser luego ser exportados a la base de datos. Como se puede crear un proceso batch para demostrar que las bases de datos se pueden alimentar, de forma automática (puede crear un DataFrame, o archivos .txt o .csv para probar lo anterior).


## 1. Brinde por lo menos 5 argumentos técnicos de por qué es mejor gestionar los datos en bases de datos, y no en hojas de cálculo.



1. Integridad y Consistencia de Datos

Las bases de datos aseguran la integridad y la consistencia de los datos mediante el uso de restricciones, como claves primarias y foráneas, y reglas de integridad de datos. Esto previene errores como duplicaciones, referencias no válidas y otros problemas de consistencia que son comunes en las hojas de cálculo.

2. Manejo de Grandes Volúmenes de Datos

Las bases de datos están diseñadas para manejar grandes cantidades de datos de manera eficiente. Las hojas de cálculo tienen limitaciones en cuanto al número de filas y columnas, y su rendimiento disminuye significativamente a medida que aumenta el tamaño del archivo. En cambio, las bases de datos pueden manejar millones de registros con un rendimiento optimizado.

3. Seguridad y Control de Acceso

Las bases de datos ofrecen opciones robustas de seguridad y control de acceso. Puedes definir permisos detallados a nivel de usuario, controlando quién puede ver, modificar, añadir o eliminar datos. Las hojas de cálculo, por otro lado, ofrecen un control de acceso más limitado, lo que las hace menos seguras para datos confidenciales.

4. Operaciones de Consulta y Análisis Avanzadas

Las bases de datos soportan lenguajes de consulta complejos como SQL, que permiten realizar operaciones de búsqueda, actualización y análisis avanzadas de manera eficiente. Las hojas de cálculo, aunque tienen funciones de filtrado y búsqueda, carecen de la capacidad de realizar consultas complejas y operaciones de unión entre múltiples conjuntos de datos.

5. Concurrencia y Control de Transacciones

Las bases de datos manejan de manera eficiente el acceso concurrente de múltiples usuarios, asegurando que las operaciones de varios usuarios no interfieran entre sí. Además, las bases de datos utilizan el control de transacciones, lo que significa que las operaciones múltiples pueden ser agrupadas en una única transacción que es atómica, consistente, aislada y duradera (propiedades ACID). Las hojas de cálculo carecen de estas capacidades, lo que las hace inadecuadas para entornos donde múltiples usuarios necesitan modificar datos simultáneamente.

## Diseñe un esquema de base de datos (snowflake), en donde ud analizará los gastos de una compañía. El esquema debe contener una tabla hecho, y por lo menos 6 tablas de dimensión (DDL). 

In [1]:
# 1. Establecer la Conexión con MySQL

import mysql.connector
from mysql.connector import Error

try:
    # Establecer la conexión con la base de datos
    conexion = mysql.connector.connect(
        host="127.0.0.1",
        port=3306,
        user="root",
        password="amoaDios1986!"
    )

    if conexion.is_connected():
        print("Conexión exitosa.")
except Error as e:
    print("Error al conectar a MySQL", e)


Conexión exitosa.


In [2]:
# 2. Creación de la Base de Datos y las Tablas

# Continuación del código anterior

try:
    # Crear un cursor para ejecutar operaciones en la base de datos
    cursor = conexion.cursor()

    # Crear la base de datos Gastos_test
    cursor.execute("CREATE DATABASE IF NOT EXISTS Gastos_test;")
    cursor.execute("USE Gastos_test;")

    # Crear las tablas en la base de datos Gastos_test
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Departamento (
        ID_Departamento INT AUTO_INCREMENT PRIMARY KEY,
        Nombre VARCHAR(255) NOT NULL,
        Gerente VARCHAR(255),
        Ubicación VARCHAR(255),
        Presupuesto DECIMAL(10, 2),
        Número_Empleados INT
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Proveedor (
        ID_Proveedor INT AUTO_INCREMENT PRIMARY KEY,
        Nombre VARCHAR(255) NOT NULL,
        Dirección VARCHAR(255),
        Contacto VARCHAR(255),
        Teléfono VARCHAR(20),
        Correo_Electrónico VARCHAR(255)
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS CategoríaGasto (
        ID_CategoríaGasto INT AUTO_INCREMENT PRIMARY KEY,
        Nombre VARCHAR(255) NOT NULL,
        Descripción TEXT,
        Presupuesto_Asignado DECIMAL(10, 2),
        Presupuesto_Utilizado DECIMAL(10, 2)
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Fecha (
        ID_Fecha INT AUTO_INCREMENT PRIMARY KEY,
        Día INT,
        Mes INT,
        Año INT,
        Día_Semana VARCHAR(15),
        Es_FinDeSemana BOOLEAN
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Empresa (
        ID_Empresa INT AUTO_INCREMENT PRIMARY KEY,
        Nombre VARCHAR(255) NOT NULL,
        Sector VARCHAR(255),
        Dirección VARCHAR(255),
        Número_Empleados INT,
        Ingresos_Anuales DECIMAL(15, 2)
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Empleado (
        ID_Empleado INT AUTO_INCREMENT PRIMARY KEY,
        Nombre VARCHAR(255) NOT NULL,
        Rol VARCHAR(255),
        Departamento_ID INT,
        Correo_Electrónico VARCHAR(255),
        Teléfono VARCHAR(20),
        FOREIGN KEY (Departamento_ID) REFERENCES Departamento(ID_Departamento)
    );
    """)
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS Gastos (
        ID_Gasto INT AUTO_INCREMENT PRIMARY KEY,
        ID_Departamento INT,
        ID_Proveedor INT,
        ID_CategoríaGasto INT,
        ID_Fecha INT,
        Monto DECIMAL(10, 2),
        ID_Empresa INT,
        FOREIGN KEY (ID_Departamento) REFERENCES Departamento(ID_Departamento),
        FOREIGN KEY (ID_Proveedor) REFERENCES Proveedor(ID_Proveedor),
        FOREIGN KEY (ID_CategoríaGasto) REFERENCES CategoríaGasto(ID_CategoríaGasto),
        FOREIGN KEY (ID_Fecha) REFERENCES Fecha(ID_Fecha),
        FOREIGN KEY (ID_Empresa) REFERENCES Empresa(ID_Empresa)
    );
    """)

    # Hacer commit de las transacciones
    conexion.commit()
    print("La base de datos y las tablas se han creado con éxito")

except Error as e:
    print("Error al ejecutar SQL", e)

finally:
    # Cerrar el cursor y la conexión
    if conexion.is_connected():
        cursor.close()
        conexion.close()
        print("Conexión a MySQL cerrada")


La base de datos y las tablas se han creado con éxito
Conexión a MySQL cerrada


## 3. EXTRA: Se desea visualizar el esquema de la base de datos, con sus tablas y sus relaciones según las llaves. Por ejemplo