# NORTHWIND DATABASE

El **objetivo** de este ejercicio es generar una serie de consultas SQL que permitan extraer información relevante de la base de datos y luego exportar los resultados para construir dashboards o visualizaciones que proporcionen insights valiosos para la toma de decisiones empresariales.

La base de datos Northwind es una base de datos de ejemplo clásica que simula las operaciones de una empresa minorista. Contiene tablas relacionales que representan diferentes aspectos del negocio, como productos, clientes, pedidos y empleados. Utilizando consultas SQL, podrás explorar y analizar estos datos para comprender mejor el desempeño del negocio en diferentes áreas.

Una vez que hayas realizado las consultas SQL y obtenido los resultados, podrás utilizarlos para herramientas de visualización de datos como Tableau, Power BI, Streamlit o cualquier otra herramienta de tu elección. 

![img](./img/northwind-er-diagram.png)

Tendrás que elegir uno de los retos a resolver:

### **1. Análisis de Ventas por Región**
Analiza las ventas de productos por región. El objetivo es identificar las regiones que generan más ingresos y las tendencias de ventas a lo largo del tiempo en esas regiones. 
Pista: Utiliza gráficos de barras y líneas para mostrar la evolución de las ventas, así como mapas geográficos para visualizar la distribución de ingresos por región.

In [8]:
import sqlite3
import pandas as pd

conn = sqlite3.connect('./data/northwind.db')


In [9]:
tables_query = "SELECT name FROM sqlite_master WHERE type='table';"
tables = pd.read_sql_query(tables_query, conn)
print(tables)


                    name
0             Categories
1        sqlite_sequence
2   CustomerCustomerDemo
3   CustomerDemographics
4              Customers
5              Employees
6    EmployeeTerritories
7          Order Details
8                 Orders
9               Products
10               Regions
11              Shippers
12             Suppliers
13           Territories


In [10]:
def get_table_schema(table_name):
    schema_query = f"PRAGMA table_info({table_name});"
    schema = pd.read_sql_query(schema_query, conn)
    return schema

orders_schema = get_table_schema('Orders')
print(orders_schema)



    cid            name      type  notnull dflt_value  pk
0     0         OrderID   INTEGER        1       None   1
1     1      CustomerID      TEXT        0       None   0
2     2      EmployeeID   INTEGER        0       None   0
3     3       OrderDate  DATETIME        0       None   0
4     4    RequiredDate  DATETIME        0       None   0
5     5     ShippedDate  DATETIME        0       None   0
6     6         ShipVia   INTEGER        0       None   0
7     7         Freight   NUMERIC        0          0   0
8     8        ShipName      TEXT        0       None   0
9     9     ShipAddress      TEXT        0       None   0
10   10        ShipCity      TEXT        0       None   0
11   11      ShipRegion      TEXT        0       None   0
12   12  ShipPostalCode      TEXT        0       None   0
13   13     ShipCountry      TEXT        0       None   0


In [14]:
def get_table_content(table_name):
    content_query = f"SELECT * FROM {table_name};"
    content_table = pd.read_sql_query(content_query, conn)
    return content_table

for table in tables['name']:
    print(f"\nContenido de la tabla '{table}':")
    content_db = get_table_content(table)
    print(content_db)



Contenido de la tabla 'Categories':
   CategoryID    CategoryName  \
0           1       Beverages   
1           2      Condiments   
2           3     Confections   
3           4  Dairy Products   
4           5  Grains/Cereals   
5           6    Meat/Poultry   
6           7         Produce   
7           8         Seafood   

                                         Description  \
0        Soft drinks, coffees, teas, beers, and ales   
1  Sweet and savory sauces, relishes, spreads, an...   
2                Desserts, candies, and sweet breads   
3                                            Cheeses   
4                Breads, crackers, pasta, and cereal   
5                                     Prepared meats   
6                          Dried fruit and bean curd   
7                                   Seaweed and fish   

                                             Picture  
0  b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x02\x00...  
1  b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x02\x00.

DatabaseError: Execution failed on sql 'SELECT * FROM Order Details;': near "Order": syntax error

In [11]:
def get_table_preview(table_name, limit=5):
    preview_query = f"SELECT * FROM {table_name} LIMIT {limit};"
    preview = pd.read_sql_query(preview_query, conn)
    return preview

orders_preview = get_table_preview('Orders')
print(orders_preview)

   OrderID CustomerID  EmployeeID   OrderDate RequiredDate ShippedDate  \
0    10248      VINET           5  2016-07-04   2016-08-01  2016-07-16   
1    10249      TOMSP           6  2016-07-05   2016-08-16  2016-07-10   
2    10250      HANAR           4  2016-07-08   2016-08-05  2016-07-12   
3    10251      VICTE           3  2016-07-08   2016-08-05  2016-07-15   
4    10252      SUPRD           4  2016-07-09   2016-08-06  2016-07-11   

   ShipVia  Freight                   ShipName           ShipAddress  \
0        3    16.75  Vins et alcools Chevalier    59 rue de l-Abbaye   
1        1    22.25         Toms Spezialitäten         Luisenstr. 48   
2        2    25.00              Hanari Carnes       Rua do Paço, 67   
3        1    20.25       Victuailles en stock    2, rue du Commerce   
4        2    36.25           Suprêmes délices  Boulevard Tirou, 255   

         ShipCity      ShipRegion ShipPostalCode ShipCountry  
0           Reims  Western Europe          51100      Franc

In [15]:
query = '''
SELECT region
FROM customers
'''


In [7]:
df = pd.read_sql_query(query, conn)

df

Unnamed: 0,Region
0,Western Europe
1,Central America
2,Central America
3,British Isles
4,Northern Europe
...,...
88,Scandinavia
89,South America
90,North America
91,Scandinavia


### **2. Análisis de Desempeño de Productos**
Analiza el desempeño de los productos de la empresa. Examina las ventas de productos por categoría, identificando los productos más vendidos y los menos vendidos. 

Pista: Utiliza gráficos de barras y de tarta para visualizar la participación de mercado de cada categoría y los ingresos generados por los productos individuales.

### **3. Análisis de Rentabilidad de Clientes**
Analiza la rentabilidad de los clientes de la empresa. Examina los ingresos generados por cada cliente, así como los costos asociados con el servicio o producto proporcionado. 

Pista: Utiliza gráficos de dispersión y tablas dinámicas para identificar los clientes más rentables y aquellos que requieren mayor atención.

### **4. Análisis de Inventarios y Proveedores**
Analiza los niveles de inventario y la gestión de proveedores de la empresa. Examina el inventario disponible por categoría de productos, así como el rendimiento de los proveedores en términos de puntualidad de entrega y calidad de los productos. 

Pista: Utiliza gráficos de líneas y tablas dinámicas para mostrar tendencias y comparar el desempeño de los proveedores.


### **5. Análisis de Comportamiento de Empleados**
Analiza el comportamiento de los empleados de la empresa. Examina las ventas realizadas por cada empleado, así como su eficiencia en el manejo de pedidos y su puntualidad en la entrega de productos. 

Pista: Utiliza gráficos de barra y de dispersión para comparar el desempeño de los empleados y identificar áreas de mejora.