CancerGeneSignatures

> Documento vivo para alinear objetivos, datos, arquitectura y plan de trabajo del proyecto.

## Resumen
CancerGeneSignatures centraliza análisis de firmas génicas (miRNAs y genes normalizadores) para distintos tejidos. Este notebook describe el marco general del proyecto, las dependencias, el flujo de trabajo y el plan de unificación de notebooks.

## Objetivos
- Consolidar análisis dispersos en un flujo reproducible.
- Definir y documentar el set de datos de entrada.
- Establecer notebooks modulares y reutilizables (exploración, procesamiento, resultados).
- Facilitar evaluación y trazabilidad (versionado y métricas).

## Alcance y Entregables
- Pipeline reproducible para análisis de miRNAs y genes normalizadores.
- Notebooks consolidados y documentados.
- Resultados clave (tablas, figuras) exportados.
- Guía de ejecución (README y este notebook).

## Datos y Fuentes
- Directorio de datos: `raw_data/` (archivos Excel/CSV).
- Anotar versiones relevantes de archivos fuente utilizados en los análisis.
- Mantener diccionario de datos en README o anexo.

## Arquitectura y Organización
- `notebooks/`: análisis interactivos (e.g., `genes_normalizadores.ipynb`, `miRNAS.ipynb`, `uimeo_data_analysis.ipynb`).
- `raw_data/`: insumos originales.
- `desktop_app/`: componentes de la aplicación (si aplica).
- Estandarizar nombres: prefijos numéricos para el orden (este archivo: `00_`).

## Plan de Unificación de Notebooks
1. Inventario de celdas y resultados relevantes en notebooks existentes.
2. Extraer utilidades repetidas a funciones (o módulo) reutilizable(s).
3. Crear notebooks por etapa: 01_exploracion, 02_procesamiento, 03_resultados.
4. Validar concordancia de resultados vs. versión original.
5. Documentar supuestos, parámetros y métricas.

## Flujo de Trabajo (propuesto)
- Ingesta y validación de datos (tipos, faltantes).
- Preprocesamiento/normalización (definir estrategia y justificación).
- Análisis estadístico y visualizaciones.
- Generación de reportes y exportables.
- Revisión/QA y versionado.

In [None]:
# Configuración base del proyecto
from pathlib import Path
import sys

REPO_ROOT = Path.cwd()  # Ajustar si se ejecuta desde otra ruta
DATA_DIR = REPO_ROOT / 'raw_data'
NOTEBOOKS_DIR = REPO_ROOT / 'notebooks'

print('Repo:', REPO_ROOT)
print('Datos:', DATA_DIR)
print('Notebooks:', NOTEBOOKS_DIR)


## Checklist / TODO
- [ ] Completar inventario de notebooks y secciones críticas.
- [ ] Definir funciones auxiliares comunes.
- [ ] Dividir flujo en 01/02/03 notebooks y probar end-to-end.
- [ ] Documentar parámetros y resultados clave.
- [ ] Preparar reporte final y guía de ejecución.

## Registro de Cambios (este notebook)
- v0.1: Estructura inicial y plan de unificación.