# 📊 PROYECTO SQL + PYTHON: GRÁFICOS INTERACTIVOS  


### 🚀 Análisis de Datos con SQL Server y Visualización con Plotly  
Este proyecto combina **SQL Server** y **Python** para extraer, analizar y visualizar datos de manera interactiva, utilizando la base de datos **Northwind**.  

🔹 **Tecnologías utilizadas:**  
- **SQL Server** (para consultas y análisis de datos)  
- **Python** (procesamiento y transformación de datos)  
- **Plotly** (visualización interactiva de los resultados)  

🔹 **Casos de uso abordados:**  
✅ Tendencias de ventas por categoría de producto  
✅ Comparación de ingresos por región  
✅ Distribución de pedidos por cliente  
✅ Relación entre precio y cantidad vendida  
✅ Mapas de calor de ventas por mes y categoría  
... ¡y más!  


 ### 📌 **Redes Profesionales y Portafolio:**  
🔗 [LinkedIn](https://www.linkedin.com/in/brayan-rafael-neciosup-bola%C3%B1os-407a59246/)  
🔗 [GitHub](https://github.com/BrayanR03)  
🔗 [Portafolio de Proyectos](https://bryanneciosup626.wixsite.com/brayandataanalitics)  

### CASUÍSTICAS 🧠📊👇

<!-- Primero nos conectaremos a SQL SERVER para poder leer las vistas que previamente 
     han sido creadas a raíz de requerimientos del negocio. Utilizando la Base de Datos NORTHWIND
 -->

In [1]:
# LIBRERÍAS A UTILIZAR
import pandas as pd # Pandas: Librería para la manipoulación de datos
from sqlalchemy import create_engine # SQLALCHEMY: Librería para realizar la conexión a SQL SERVER
import plotly.express as px # Plotly: Librería utlizada para crear gráficos (interactivos).

In [2]:
# CONEXIÓN A SQL SERVER
server_name = "LAPTOP-D05MS1MQ\SQLEXPRESS" # Nombre de tu servidor SQL SERVER (Nombre que aparece en la ventana al iniciar SSMS)
user = "sa" # Usuario de tu SQL SERVER al iniciar sesión (Por defecto: sa)
password = "12345" # Contraseña de tu SQL SERVER al iniciar sesión (Se configura al instalar SSMS)
database_name = "Northwind" # Nombre de la base de datos a utilizar
try:
    connection_to_sql = f'mssql+pyodbc://{user}:{password}@{server_name}/{database_name}?driver=ODBC+Driver+17+for+SQL+Server'
    print("Conexión exitosa")
except Exception as e:
    print(f"Error al conectarse a SQL SERVER: {e}")

Conexión exitosa


In [3]:
# FUNCIÓN EN PYTHON QUE DEVOLVERÁ UN DATAFRAME
"""
Parámetros:
a). query_sql : Consulta escrita en SQL para traer información desde la BD (Enviamos la query a la VISTA).
b). connection : Cadena de conexión necesaria para SQL SERVER
"""
def dataframe_query(query_sql):
    try:
        engine = create_engine(connection_to_sql) # Esta línea permite crear una instancia de SQL SERVER
        return pd.read_sql(query_sql,engine) # Usando pandas, leemos la query y retornamos esos datos leidos.
    except Exception as e:
        print(f"Error: {e}")

In [80]:
# 1: Tendencia de ventas por categoría de producto
query_sql_uno = "SELECT * FROM v_TendenciaVentasPorCategoriaProductos"
df_uno = dataframe_query(query_sql=query_sql_uno)
# df_uno.head()

line_plot = px.line(data_frame=df_uno,x="Año-Mes",y="TotalVentas",color="Categoria",title="Tendencia Ventas")
line_plot.update_layout(
    xaxis_title ='AÑO - MES',
    yaxis_title = 'Ventas ($)',
    hoverlabel=dict(
            bgcolor="green",
            font_color = "white"
        )
)
line_plot.show()



In [10]:
# 2: Comparación de ingresos por región
query_sql_dos = 'SELECT* FROM v_ComparasionIngresosPorRegion'
df_dos = dataframe_query(query_sql=query_sql_dos)
# df_dos.head()

bar_plot = px.bar(data_frame=df_dos,x="TotalVentas",y="Region",color="Region",title="Ingresos Por Región",orientation="h")
bar_plot.update_layout(
    hoverlabel = dict(
        bgcolor = "white"
    )
)
bar_plot.show()


In [None]:
# 3: Distribución de pedidos por cliente
query_sql_tres = "SELECT * FROM v_DistribucionPedidosPorCliente"
df_tres = dataframe_query(query_sql=query_sql_tres)
# df_tres.head()
histograma_plot = px.histogram(data_frame=df_tres,x="CompanyName",y="CantidadPedidos",color="CompanyName",title="Distribucion Pedidos")
histograma_plot.update_layout(
    yaxis_title = "Cantidad Pedidos",
    xaxis_title = "Cliente",
    hoverlabel = dict(
        bgcolor = "white"
    )
)
histograma_plot.update_traces( # Modificar labels de los tooltip de los ejes
    hovertemplate = "Cantidad Pedido: %{y}<br>Cliente: %{x}<extra></extra>"
)
histograma_plot.show()


In [46]:
# 4: Relación entre precio y cantidad vendida
query_sql_cuatro = "SELECT * FROM v_ProductoPrecioCantidadVendida"
df_cuatro = dataframe_query(query_sql=query_sql_cuatro)
# df_cuatro.head()

scatter_plot = px.scatter(data_frame=df_cuatro,x="UnitPrice",y="CantidadTotalVendida",color="UnitPrice")
scatter_plot.update_layout(
    xaxis_title = "Precio del Producto",
    yaxis_title = "Unidades Vendidas",
    title = "Distribución Precio vs Unidades Vendidas",
    title_x = 0.5
)
scatter_plot.update_traces(
    hovertemplate = "Unidades Vendidas: %{y}<br>Precio Unitario: %{x}<extra></extra>"
)
scatter_plot.show()


In [7]:
# 5: Mapa de calor de ventas por mes y categoría
query_sql_cinco = "SELECT * FROM v_VentasMensualesPorCategoria" 
df_cinco = dataframe_query(query_sql=query_sql_cinco)
# df_cinco.head()

heat_map = px.density_heatmap(data_frame=df_cinco,x="Categoria",y="Mes",z="TotalVentas",color_continuous_scale="viridis")
heat_map.update_layout(
    title = "Ventas Mensuales por Categoría",
    title_x = 0.5,
    coloraxis_colorbar_title = "Monto Ventas"
)

heat_map.show()

In [11]:
# 6:  Productos más vendidos por cantidad
sql_query_seis = "SELECT * FROM v_Top10ProductoMasVendidos"
df_seis = dataframe_query(query_sql=sql_query_seis)
# df_seis.head()

bar_plot_seis = px.bar(data_frame=df_seis,x="CantidadTotalVendida",y="ProductName",color="ProductName",
                       orientation="h")
bar_plot_seis.update_layout(
    showlegend = False,
    title = "Productos Mas Vendidos",
    xaxis_title = "PRODUCTO",
    yaxis_title = "Unidades Vendidas",
    
    hoverlabel = dict(
        bgcolor = "green",
        font_color = "white"
    )
)
bar_plot_seis.update_traces(
    hovertemplate = "Unidades Vendidas:%{y}<br>Producto:%{x}<extra></extra>"
)
bar_plot_seis.show()


In [91]:
# 7: Promedio de días entre pedido y entrega por país
sql_query_siete = "SELECT * FROM v_PromedioDiasPedido"
df_siete = dataframe_query(query_sql=sql_query_siete)
# df_siete.head()

bubble_plot = px.scatter(data_frame=df_siete,x="ShipCountry",y="DiferenciaDiasEntrega",
                         color="ShipCountry",size="DiferenciaDiasEntrega",title = "DIAS PROMEDIO DE ENTREGA DE PEDIDOS")
bubble_plot.update_layout(
    showlegend = False,
    yaxis_title = "Promedio Dias",
    xaxis_title = "PAISES",
    hoverlabel =dict(
        bgcolor = "green",
        font_color = "white"
    )
)
bubble_plot.show()


In [19]:
# 8: Comparación de ventas por empleado
query_sql_ocho = "SELECT * FROM v_VentasPorEmpleado"
df_ocho = dataframe_query(query_sql=query_sql_ocho)
# df_ocho.head()
column_plot = px.bar(data_frame=df_ocho,x="Employee",y="TotalVentas",color="Employee")
column_plot.update_layout(
    showlegend = False,
    xaxis_title = "EMPLEADO",
    yaxis_title = "VENTAS ($)",
    title = "Ventas x Empleado",
    title_x = 0.5,
    hoverlabel = dict(
        bgcolor = "white"
    )
)
column_plot.update_traces(
    hovertemplate = "Empleado :%{x}<br>Ventas: %{y}<extra></extra>"
)
column_plot.show()


In [55]:
# 9: Participación de cada proveedor en el total de productos vendidos
query_sql_nueve = "SELECT * FROM v_ParticipacionProveedoresTotalUnidadesVendidas"
df_nueve = dataframe_query(query_sql=query_sql_nueve)
df_nueve_top_5 = df_nueve.head(5) # Elejimos solo los 5 primeros empleados, para que el grafico tenga cohesión.
TotalUnidadesVendidas = df_nueve["CantidadTotalVendida"].sum()
pie_plot = px.pie(data_frame=df_nueve_top_5,names="Supplier",values="%Participacion") 
# pie_plot = px.pie(data_frame=df_nueve,names="Supplier",values="%Participacion")# Gráfico con el total de datos
pie_plot.update_layout(
    title = "% de Participación de Proveedor",
    hoverlabel = dict(
        bgcolor = "white"
    )
)
pie_plot.update_traces(
    hovertemplate = "Proveedor:%{label}<br>UnidadesVendidas:%{customdata}"
)
pie_plot.update_traces(
    customdata = df_nueve["CantidadTotalVendida"]
)
pie_plot.show()

In [78]:
# 10: Análisis de descuentos aplicados por categoría de producto
query_sql_diez = "SELECT * FROM v_DescuentosAplicadosPorCategoria"
df_diez = dataframe_query(query_sql=query_sql_diez)
# df_diez.head()

barras_agrupadas_plot = px.bar(data_frame=df_diez,x="Categoria",y="PromedioDescuentoAplicado",barmode="group",color="Categoria")
barras_agrupadas_plot.update_layout(
    title = "Promedio Descuentos Por Categoria",
    title_x = 0.5,
    bargroupgap = 0,
    hoverlabel = dict(
        bgcolor = "green",
        font_color = "white"
    ),
    xaxis_title = "CATEGORIA",
    yaxis_title = "DESCUENTO ($)"
    
)
barras_agrupadas_plot.update_traces(
    hovertemplate = "Descuentos ($):%{y}<br>Categoria:%{x}<extra></extra>"
)
barras_agrupadas_plot.show()