### **APP DE CONEXIÓN BASE DE DATOS**

---

In [61]:
# Importación de librerias utilizadas para la conección y tratamiento de la información
# Conección
from sqlalchemy import create_engine
from sqlalchemy.engine import URL 
import pypyodbc as odbc
# Tratamiento de información
import pandas as pd
import pandasql as ps
import numpy as np
# Tratamiento de fechas
from datetime import date
# Usuarios y contraseñas protegidas
import getpass

In [62]:
# Solicitar usuario y contraseña de acceso
SERVER_NAME = input('NOMBRE DEL SERVIDOR: ')
DATABASE_NAME = input('NOMBRE DE DATABASE: ')
db = input('NOMBRE TABLA/VISTA: ')
UID = input('Ingresa tu usuario: ')
PWD = getpass.getpass('Ingresa tu contraseña: ')

In [63]:
# Variable de login
connection_string = f'''
Driver={{SQL Server}};
Server={SERVER_NAME};
Database={DATABASE_NAME};
Uid={UID};
Pwd={PWD};
'''

In [64]:
# Variable SQL: Consulta SQL para extracción de data
# Filtro de fecha: WHERE CONVERT(DATE, fecha, 103) >= CONVERT(DATE, GETDATE()-1, 103)
# Código 103 corresponde al formateo de fecha DD/MM/YYYY
sql_query = f'''
SELECT *
FROM {db} 
'''

In [65]:
# Script de conexión con base de datos y servidor
connection_url = URL.create('mssql+pyodbc', query={'odbc_connect': connection_string})
engine = create_engine(connection_url, module=odbc)

In [66]:
# Script de descarga de data de la base de datos de acuerdo a la consulta SQL
df = pd.read_sql_query(sql_query, engine)

---

#### **ANÁLISIS DE DATA**

Funciones personalizadas

In [67]:
# Funciones de formateo de registros
# Formeteo de fecha
def date_formatting(fecha):
    date = fecha
    if type(date) == str:
        date = pd.to_datetime(date)
    result = date.strftime('%d-%m-%Y')
    return result

# Formateo de numeros
def num_formatting(numero):
    return '{:,.2f}'.format(numero)

# Proceso de DataFrame a travez de pandasql as ps para realizar consultas sql
def show_query(query, df):
    result = ps.sqldf(query, locals())
    return result

Datos generales del DataFrame "df"

In [68]:
# Variables de la base de datos
fecha_min = date_formatting(df['fecha'].min())
fecha_max = date_formatting(df['fecha'].max())
cuenta_df = num_formatting(df['fecha'].nunique())
cuenta_total_registros = num_formatting(df['fecha'].count())
cuenta_registros_df_max = num_formatting((df['fecha'] == df['fecha'].max()).sum())

In [69]:
# Visualización de información "df"
print("Datos de Generales")
print(f"Tabla: {db}")
print('------------------------------------------------------------')
print(f"Fecha mínima:       {fecha_min}")
print(f"Fecha máxima:       {fecha_max}")
print(f"Bases de datos:     {cuenta_df} Bases de datos")
print(f"Registos totales:   {cuenta_total_registros} en {cuenta_df} DB")
print(f"Registos ultima DB: {cuenta_registros_df_max} regristros de fecha {fecha_max}")

Datos de Generales
Tabla: vst_matriz_tbl
------------------------------------------------------------
Fecha mínima:       22-11-2023
Fecha máxima:       15-01-2024
Bases de datos:     46.00 Bases de datos
Registos totales:   733,378.00 en 46.00 DB
Registos ultima DB: 15,925.00 regristros de fecha 15-01-2024


* Análisis exploratorio

In [70]:
query = '''
SELECT * 
FROM df
'''
df_query = show_query(query, df)

In [71]:
# Variables de la base de datos
fecha_min_df = date_formatting(df_query['fecha'].min())
fecha_max_df = date_formatting(df_query['fecha'].max())
cuenta_df_df = num_formatting(df_query['fecha'].nunique())
cuenta_total_registros_df = num_formatting(df_query['fecha'].count())
cuenta_registros_df_max_df = num_formatting((df_query['fecha'] == df_query['fecha'].max()).sum())

In [72]:
# Visualización de información "df_query"
print("Datos de control de la tabla")
print(f"Tabla: DataFrame con Sub-consulta SQL a {db}")
print('------------------------------------------------------------')
print(f"Fecha mínima:       {fecha_min_df}")
print(f"Fecha máxima:       {fecha_max_df}")
print(f"Bases de datos:     {cuenta_df_df} Bases de datos")
print(f"Registos totales:   {cuenta_total_registros_df} en {cuenta_df_df} DB")
print(f"Registos ultima DB: {cuenta_registros_df_max_df} regristros de fecha {fecha_max_df}")

Datos de control de la tabla
Tabla: DataFrame con Sub-consulta SQL a vst_matriz_tbl
------------------------------------------------------------
Fecha mínima:       22-11-2023
Fecha máxima:       15-01-2024
Bases de datos:     46.00 Bases de datos
Registos totales:   733,378.00 en 46.00 DB
Registos ultima DB: 15,925.00 regristros de fecha 15-01-2024
