# Extrayendo la información para el Dashboard.

Ya tenemos la información necesaria y hemos observado qué pasa con la comunidad de la pagina web y los productos que se comercializan.

Ahora tenemos que darle valor de negocio a estos datos para lo cual vamos a generar un Dashboard en *POWER BI* para poder ver los productos, la actividad de la página web y los usuarios.

Para esto lo primero que tenemos que hacer es valorar qué información tenemos, si esta información que disponemos está adecuada a la representación y la preparación de los datos que vamos a utilizar.

## ¿Qué información tenemos en la base de datos?

Principalmente disponemos de:

  - Los **precios** de los distintos productos que hemos descargado periodicamente.
    Los precios que disponemos son los precios sin descuento y los precios con descuento.

  - La actividad de los **comentarios** realizados.
    En este sentido tenemos las fechas, la valoración dada y que usuarios han sido los que han realizado la valoración.

  - Las **etiquetas** de los productos.
    Disponemos por tanto de las etiquetas de los productos.


## ¿La información está adecuada a las necesidades de datos que precisamos?

¿Hay que realizar alguna preparación de los datos?

Cabe indicar que la información está adecuada a las necesidades, recordemos que las tablas que disponemos actualmente representan estos datos directamente.

Por este motivo podemos usar las tablas creadas para generar ficheros .csv directamente de ellas.

## Generando los ficheros  .csv

### Librerías y variables

In [1]:
import os
import sqlite3
import csv
os.chdir(os.path.split(os.getcwd())[0])
folder=os.getcwd()
database="Resources/online_shop.db"
path=r'Data\Dashboard'
ext=r'.csv'


### Realizamos la conexión a la base de datos.

In [2]:
conn = sqlite3.connect(database)
cursor = conn.cursor()

### Extraemos la información.

In [43]:
lista_tables=[]
res = cursor.execute("SELECT name FROM sqlite_master WHERE type='table'")
for name in res:
    lista_tables.append(name[0])

print(lista_tables)

['PRODUCT', 'PRICES', 'COMMENT', 'TAGS', 'USERS']


Si vemos los datos de una posición de la lista podemos ver como obtenemos los datos.

Estos datos están en forma de tuplas por cada registro.

In [44]:
i=lista_tables[1]
print ("Tomando los datos de la tabla", i)
cursor.execute(f"SELECT * FROM {i}")                            # Seleccionamos la información de los registros
data=cursor.fetchall()                                          # Obtenemos los datos seleccionados

print(data)

Tomando los datos de la tabla PRICES
[(0, 0, 69.99, 39.99, '231012.0'), (1, 1, 99.99, 44.99, '231012.0'), (2, 2, 79.99, 29.99, '231012.0'), (3, 3, 34.99, 17.99, '231012.0'), (4, 4, 79.99, 59.99, '231012.0'), (5, 5, 69.99, 37.99, '231012.0'), (6, 6, 17.99, 6.99, '231012.0'), (7, 7, 59.99, 24.99, '231012.0'), (8, 8, 44.99, 26.99, '231012.0'), (9, 9, 149.99, 79.99, '231012.0'), (10, 10, 9.99, 7.99, '231012.0'), (11, 11, 89.99, 39.99, '231012.0'), (12, 12, 99.99, 49.99, '231012.0'), (13, 13, 99.99, 49.99, '231012.0'), (14, 14, 299.99, 99.99, '231012.0'), (15, 15, 109.99, 49.99, '231012.0'), (16, 16, 49.99, 29.99, '231012.0'), (17, 17, 59.99, 39.99, '231012.0'), (18, 18, 89.99, 36.99, '231012.0'), (19, 19, 69.99, 49.99, '231012.0'), (20, 20, 59.99, 17.99, '231012.0'), (21, 21, 99.99, 49.99, '231012.0'), (22, 22, 69.99, 44.99, '231012.0'), (23, 23, 119.99, 79.99, '231012.0'), (24, 24, 59.99, 26.99, '231012.0'), (25, 25, 49.99, 17.99, '231012.0'), (26, 26, 69.99, 39.99, '231012.0'), (27, 27, 

Vamos a  ver como obtengo los nombres de las columnas de cada table por ejemplo el de PRODUCT.

Para ello nos vamos a basar en la función que tenemos llamada *sql_query*.

In [45]:
i=lista_tables[0]
print ("Tomando los datos de la tabla", i)
cursor.execute(f"SELECT * FROM {i}")     
ans = cursor.fetchall()
names = [description[0] for description in cursor.description]
names


Tomando los datos de la tabla PRODUCT


['ID', 'PRODUCT', 'SLOGAN', 'DESCRIPTION', 'CHARACTERISTICS', 'URL']

In [22]:
i=lista_tables[1]
cursor.execute(f"SELECT * FROM {i}")                            # Seleccionamos la información de los registros
data=cursor.fetchall()                                          # Obtenemos los datos seleccionados
names = [description[0] for description in cursor.description]

print(f"Las columnas de la tabla {i} son {names},\nlos datos almacenados son {data}")

Tomando los datos de la tabla PRICES
Las columnas de la tabla PRICES son ['ID', 'ID_PRODUCT', 'REGULAR_PRICE', 'DISCOUNT_PRICE', 'DATE_DOWNLOAD'],
 los datos almacenados son [(0, 0, 69.99, 39.99, '231012.0'), (1, 1, 99.99, 44.99, '231012.0'), (2, 2, 79.99, 29.99, '231012.0'), (3, 3, 34.99, 17.99, '231012.0'), (4, 4, 79.99, 59.99, '231012.0'), (5, 5, 69.99, 37.99, '231012.0'), (6, 6, 17.99, 6.99, '231012.0'), (7, 7, 59.99, 24.99, '231012.0'), (8, 8, 44.99, 26.99, '231012.0'), (9, 9, 149.99, 79.99, '231012.0'), (10, 10, 9.99, 7.99, '231012.0'), (11, 11, 89.99, 39.99, '231012.0'), (12, 12, 99.99, 49.99, '231012.0'), (13, 13, 99.99, 49.99, '231012.0'), (14, 14, 299.99, 99.99, '231012.0'), (15, 15, 109.99, 49.99, '231012.0'), (16, 16, 49.99, 29.99, '231012.0'), (17, 17, 59.99, 39.99, '231012.0'), (18, 18, 89.99, 36.99, '231012.0'), (19, 19, 69.99, 49.99, '231012.0'), (20, 20, 59.99, 17.99, '231012.0'), (21, 21, 99.99, 49.99, '231012.0'), (22, 22, 69.99, 44.99, '231012.0'), (23, 23, 119.99, 

De este modo podemos hacer un loop para extraer los datos de cada tabla y ver los nombres de las columnas.

Este es un paso inicial para cargarlo en un fichero .csv.

In [46]:
for table in lista_tables:
    cursor.execute(f"SELECT * FROM {table}")                            # Seleccionamos la información de los registros
    data=cursor.fetchall()                                          # Obtenemos los datos seleccionados
    names = [description[0] for description in cursor.description]
    print(f"Las columnas de la tabla {table} son {names},\nlos datos almacenados son {data}")

Las columnas de la tabla PRODUCT son ['ID', 'PRODUCT', 'SLOGAN', 'DESCRIPTION', 'CHARACTERISTICS', 'URL'],
los datos almacenados son [(0, 'MASABOOM', 'El gran masajeador sexual', 'Este es el juguete para todas, todos y todes. Un juguete que es para todas las partes de nuestro cuerpo, para cuidarlo y darle el masaje completo que se merece. El bienestar sexual empieza por conseguir un estado de relajación total. Para ello te animamos a parar un poco el ritmo y a que conectes con los malestares de tu cuerpo y los mimes a tope. Esto hará que te sientas más receptiva para luego tener relaciones sexuales.¿Eres fan de los masajes? Si la respuesta es sí, te presentamos MASABOOM, un masajeador con forma de micrófono. Este modelo en concreto tiene las dimensiones más grandes que podemos encontrar en este tipo de juguete. Gracias a esto podemos llegar a más partes del cuerpo si somos nosotras mismas las que nos estamos masajeando. Si estamos con otra persona también nos echará un cable en postura

Vamos a cargar los datos de una TABLA dentro de un fichero .csv.

In [30]:
with open ('db_users.csv','w',newline='') as archivo_csv:
    escritor_csv=csv.writer(archivo_csv)
    escritor_csv.writerow(names)
    for fila in data:
        escritor_csv.writerow(fila)
archivo_csv.close()


In [37]:
name=lista_tables[-1]+ext
file=os.path.join(path,name)
file

USERS


'Data\\Dashboard\\USERS.csv'

Vamos a generar los nombres de los ficheros donde cargaremos cada una de las tablas.

Realmente es modificar el primer bucle para incorporar esta variable.

In [47]:
for table in lista_tables:
    name=table+ext
    file=os.path.join(path,name)    
    print(file)

Data\Dashboard\PRODUCT.csv
Data\Dashboard\PRICES.csv
Data\Dashboard\COMMENT.csv
Data\Dashboard\TAGS.csv
Data\Dashboard\USERS.csv


In [49]:
lista_tables=[]
res = cursor.execute("SELECT name FROM sqlite_master WHERE type='table'")
for name in res:
    lista_tables.append(name[0])

for table in lista_tables:
    cursor.execute(f"SELECT * FROM {table}")                            # Seleccionamos la información de los registros
    name=table+ext
    file=os.path.join(path,name)
    data=cursor.fetchall()                                          # Obtenemos los datos seleccionados
    names = [description[0] for description in cursor.description]

    print(f"El fichero se llama {file},\nLas columnas de la tabla {table} son {names},\nlos datos almacenados son {data}")

El fichero se llama Data\Dashboard\PRODUCT.csv,
Las columnas de la tabla PRODUCT son ['ID', 'PRODUCT', 'SLOGAN', 'DESCRIPTION', 'CHARACTERISTICS', 'URL'],
los datos almacenados son [(0, 'MASABOOM', 'El gran masajeador sexual', 'Este es el juguete para todas, todos y todes. Un juguete que es para todas las partes de nuestro cuerpo, para cuidarlo y darle el masaje completo que se merece. El bienestar sexual empieza por conseguir un estado de relajación total. Para ello te animamos a parar un poco el ritmo y a que conectes con los malestares de tu cuerpo y los mimes a tope. Esto hará que te sientas más receptiva para luego tener relaciones sexuales.¿Eres fan de los masajes? Si la respuesta es sí, te presentamos MASABOOM, un masajeador con forma de micrófono. Este modelo en concreto tiene las dimensiones más grandes que podemos encontrar en este tipo de juguete. Gracias a esto podemos llegar a más partes del cuerpo si somos nosotras mismas las que nos estamos masajeando. Si estamos con otr

Nos queda agregar la carga de datos a los ficheros .csv.

In [51]:
lista_tables=[]
res = cursor.execute("SELECT name FROM sqlite_master WHERE type='table'")
for name in res:
    lista_tables.append(name[0])

for table in lista_tables:
    cursor.execute(f"SELECT * FROM {table}")                            # Seleccionamos la información de los registros
    name=table+ext
    file=os.path.join(path,name)
    data=cursor.fetchall()                                          # Obtenemos los datos seleccionados
    names = [description[0] for description in cursor.description]

    # print(f"El fichero se llama {file},\nLas columnas de la tabla {table} son {names},\nlos datos almacenados son {data}")
    print (f'Cargando el fichero {file}')
    
    with open (file,'w',newline='') as archivo_csv:
        escritor_csv=csv.writer(archivo_csv)
        escritor_csv.writerow(names)
        for fila in data:
            escritor_csv.writerow(fila)
    archivo_csv.close()

Cargando el fichero Data\Dashboard\PRODUCT.csv


UnicodeEncodeError: 'charmap' codec can't encode character '\u200b' in position 735: character maps to <undefined>

### Cerramos la conexión a la base de datos.

In [52]:
conn.commit()
cursor.close()
conn.close()