# **Detección de estados de ánimo a través de sensores**
-----
## **Notebook 4:** Configuración del entorno de MongoDB.

La idea de esta notebook es configurar el entorno de MongoDB, la plataforma que almacenará los datos del cliente. Ahora, vamos a subir los datos de uno de los pacientes que no fue utilizado para entrenar el modelo.

La idea es subir los datos desde esta notebook, simulando una pipeline que toma los datos de la base de datos del cliente, los envía a MongoDB. Luego, vamos a intentar consumirlos, para probar que funciona el llamado a los datos no estructurados.

Posteriormente, necesitaremos incluir todas estas funciones en la pipeline que le entregaremos al cliente.

# Test: Upload data

In [1]:
%pip install pymongo bson





In [2]:
import os, pickle
import gridfs
import bson
from pymongo import MongoClient
from bson.binary import Binary
import certifi, pymongo, pprint
import zlib, numpy as np, bson.json_util as ju
from mongodb import to_bin, from_bin


In [3]:
user = "gerardoaboulafia18"
pwd = "pwd"
uri  = f"mongodb+srv://{user}:{pwd}@wesad-cluster.ldfv7ur.mongodb.net/?retryWrites=true&w=majority"
print(uri)   

mongodb+srv://gerardoaboulafia18:pwd@wesad-cluster.ldfv7ur.mongodb.net/?retryWrites=true&w=majority


In [4]:
client = pymongo.MongoClient(uri, tlsCAFile=certifi.where())
print(client.list_database_names())   
db = client["wesad_db"]
fs     = gridfs.GridFS(db, collection="signals")

['wesad_db', 'admin', 'local']


In [5]:
pkl_path = r"C:\Users\mical\OneDrive - UCA\UCA\2025\1er cuatrimestre\Laboratorio de datos I\A WESAD PROYECTO\S16\S16.pkl"
patient_id = os.path.basename(os.path.splitext(pkl_path)[0])

In [6]:
with open(pkl_path, "rb") as f:
    data = pickle.load(f, encoding="latin1")

chest  = data["signal"]["chest"]              # ACC, ECG, EMG, EDA, Temp, Resp
labels = data["label"].astype(np.int8)        

doc = {
    "_id"     : patient_id,
    "Paciente": patient_id,
    "signal"  : {
        "chest": {
            "ACC_zlib" : to_bin(chest["ACC"]),
            "ECG_zlib" : to_bin(chest["ECG"]),
            "EMG_zlib" : to_bin(chest["EMG"]),
            "EDA_zlib" : to_bin(chest["EDA"]),
            "Temp_zlib": to_bin(chest["Temp"]),
            "Resp_zlib": to_bin(chest["Resp"]),
        }
    },
    "label_zlib": to_bin(labels, dtype=np.int8)
}

raw_bytes = bson.json_util.dumps(doc).encode()

for old in fs.find({"filename": patient_id}):
    fs.delete(old._id)

file_id = fs.put(raw_bytes, filename=patient_id, encoding="json+zlib")
print(f" Paciente {patient_id} guardado en GridFS (_id={file_id})")

 Paciente S16 guardado en GridFS (_id=686401c61920c53ae3f8f267)


# Pull data

In [7]:
for f in fs.find().limit(10):
    print(f.filename, f._id)

S11 68423ba27548aacc142bb3e3
S8 6861762a38d21a7215983280
S16 686401c61920c53ae3f8f267


In [8]:
file_obj = fs.find_one({"filename": "S8"})
doc      = ju.loads(file_obj.read().decode())

acc  = from_bin(doc["signal"]["chest"]["ACC_zlib"],  np.float32).reshape(-1, 3)
eda  = from_bin(doc["signal"]["chest"]["EDA_zlib"],  np.float32)
labels = from_bin(doc["label_zlib"], np.int8)

print("ACC shape:", acc.shape, "labels:", labels.shape)

ACC shape: (1287300, 3) labels: (1287300,)
