# üß™ Tests del Sistema RAG Aconex - Demo en Google Colab

Este notebook permite ejecutar y validar los tests del sistema RAG **sin necesidad de clonar desde GitHub**.

## üéØ 3 Formas de Usar Este Notebook

### ‚úÖ Opci√≥n 1: Subir Archivos ZIP (M√°s F√°cil - Recomendado)
1. Comprime tu carpeta `backend-acorag` en un archivo ZIP
2. Ejecuta la celda del Paso 1 y sube el archivo cuando te lo pida
3. Contin√∫a con el Paso 2

### ‚úÖ Opci√≥n 2: Google Drive
1. Sube la carpeta `backend-acorag` a tu Google Drive
2. Descomenta y ejecuta la "Opci√≥n C" en el Paso 1
3. Ajusta la ruta a tu ubicaci√≥n en Drive
4. Contin√∫a con el Paso 2

### ‚úÖ Opci√≥n 3: GitHub (Solo si el repo es p√∫blico)
1. Descomenta la "Opci√≥n A" en el Paso 1
2. Ejecuta la celda
3. Contin√∫a con el Paso 2

---

## üìä Suite de Tests
- **Total**: 19 tests (9 positivos + 10 negativos)
- **Cobertura**: Ingesta, B√∫squeda Sem√°ntica, Upload, Utilidades
- **Objetivo**: 100% passing

---

## üì¶ Paso 1: Clonar Repositorio y Configurar Entorno

Primero clonamos el repositorio y configuramos el entorno de Python.

In [None]:
!git clone https://github.com/luiscornejo1/back-acorag.git
%cd back-acorag/backend-acorag

## üîß Paso 2: Instalar Dependencias

Instalamos todas las dependencias necesarias para ejecutar los tests.

In [None]:
# Instalar dependencias del proyecto
!pip install -q pytest pytest-asyncio pytest-mock pytest-cov
!pip install -q psycopg2-binary numpy sentence-transformers
!pip install -q pyjwt python-jose[cryptography] bcrypt passlib
!pip install -q fastapi uvicorn python-multipart

print("‚úÖ Dependencias instaladas correctamente")

## üìÅ Paso 3: Verificar Estructura del Proyecto

Verificamos que todos los archivos de tests est√©n presentes.

In [None]:
import os

# Verificar archivos de tests
test_files = [
    'tests/conftest.py',
    'tests/test_ingest.py',
    'tests/test_search.py',
    'tests/test_upload.py',
    'tests/test_utils.py'
]

print("üìÇ Verificando archivos de tests:\n")
for file in test_files:
    exists = "‚úÖ" if os.path.exists(file) else "‚ùå"
    print(f"{exists} {file}")

# Listar todos los tests disponibles
print("\nüìã Tests disponibles:")
!pytest tests/ --collect-only -q

## üß™ Paso 4: Ejecutar Tests Positivos (9 tests)

Estos son los tests que validan el funcionamiento correcto del sistema.

In [None]:
# Ejecutar solo tests positivos (sin los negativos)
!pytest tests/test_ingest.py::test_normalize_doc_complete -v
!pytest tests/test_ingest.py::test_iter_docs_from_file_json_and_ndjson -v
!pytest tests/test_search.py::test_semantic_search_basic -v
!pytest tests/test_search.py::test_semantic_search_with_project_filter -v
!pytest tests/test_upload.py::test_extract_text_from_txt -v
!pytest tests/test_upload.py::test_generate_document_id_unique -v
!pytest tests/test_utils.py::test_simple_chunk_with_overlap -v
!pytest tests/test_utils.py::test_get_db_connection_success -v
!pytest tests/test_utils.py::test_simple_chunk_edge_cases -v

## üö® Paso 5: Ejecutar Tests Negativos (10 tests)

Estos tests validan el manejo correcto de errores y casos inv√°lidos.

In [None]:
# Ejecutar tests negativos (validaci√≥n de errores)
!pytest tests/test_ingest.py::test_normalize_doc_missing_fields -v
!pytest tests/test_ingest.py::test_iter_docs_invalid_json -v
!pytest tests/test_search.py::test_semantic_search_empty_query -v
!pytest tests/test_search.py::test_semantic_search_invalid_project_id -v
!pytest tests/test_upload.py::test_extract_text_file_not_found -v
!pytest tests/test_upload.py::test_extract_text_invalid_encoding -v
!pytest tests/test_utils.py::test_simple_chunk_invalid_parameters -v
!pytest tests/test_utils.py::test_get_db_connection_invalid_credentials -v
!pytest tests/test_utils.py::test_get_db_connection_missing_env_vars -v

## üìä Paso 6: Ejecutar TODOS los Tests con Reporte Completo

Ejecutamos la suite completa y generamos un reporte detallado.

In [None]:
# Ejecutar todos los tests con output detallado
!pytest tests/ -v --tb=short --color=yes

print("\n" + "="*80)
print("üìà RESUMEN DE EJECUCI√ìN")
print("="*80)

## üìâ Paso 7: Generar Reporte de Cobertura (Opcional)

Generamos un reporte de cobertura de c√≥digo para ver qu√© porcentaje del c√≥digo est√° testeado.

In [None]:
# Ejecutar tests con reporte de cobertura
!pytest tests/ --cov=app --cov-report=term-missing --cov-report=html

print("\n‚úÖ Reporte de cobertura generado en htmlcov/index.html")

## üìö Paso 8: Ver Documentaci√≥n de Tests

Mostramos la documentaci√≥n completa de los tests.

In [None]:
# Mostrar documentaci√≥n de tests
!cat DOCUMENTACION_TESTS.md | head -100

print("\nüìñ Para ver la documentaci√≥n completa:")
print("   - DOCUMENTACION_TESTS.md")
print("   - ERRORES_Y_SOLUCIONES_TESTS.md")
print("   - TESTING_SUMMARY.md")

## üîç Paso 9: Ejecutar Test Individual (Debug)

Si quieres ejecutar y debuggear un test espec√≠fico:

In [None]:
# Ejecutar un test espec√≠fico con m√°ximo detalle
test_name = "tests/test_ingest.py::test_normalize_doc_complete"  # Cambiar aqu√≠

!pytest {test_name} -vvs --tb=long

print(f"\n‚úÖ Test '{test_name}' ejecutado con detalle completo")

## üìä Paso 10: Resumen Final

Generamos un resumen estad√≠stico de todos los tests.

In [None]:
import subprocess
import re

# Ejecutar tests y capturar output
result = subprocess.run(
    ['pytest', 'tests/', '-v', '--tb=no'],
    capture_output=True,
    text=True
)

# Parsear resultados
output = result.stdout + result.stderr

# Contar tests
passed = len(re.findall(r'PASSED', output))
failed = len(re.findall(r'FAILED', output))
total = passed + failed

# Generar reporte
print("="*80)
print("üìä RESUMEN FINAL DE TESTS")
print("="*80)
print(f"\n‚úÖ Tests Pasando: {passed}/{total} ({(passed/total*100):.1f}%)")
print(f"‚ùå Tests Fallando: {failed}/{total} ({(failed/total*100):.1f}%)")
print(f"\nüìÅ Archivos Testeados:")
print("   - app/ingest.py")
print("   - app/search_core.py")
print("   - app/upload.py")
print("   - app/utils.py")
print(f"\nüéØ Objetivo: 19/19 tests pasando (100%)")
print(f"üìà Estado Actual: {passed}/{total} ({(passed/total*100):.1f}%)")

if passed == total:
    print("\nüéâ ¬°TODOS LOS TESTS PASANDO! Sistema RAG validado correctamente.")
else:
    print(f"\n‚ö†Ô∏è Hay {failed} test(s) fallando. Revisar output arriba para detalles.")

print("\n" + "="*80)

## üìñ Informaci√≥n Adicional

### Estructura de Tests

```
tests/
‚îú‚îÄ‚îÄ conftest.py              # Fixtures y configuraci√≥n
‚îú‚îÄ‚îÄ test_ingest.py           # Tests de ingesta (4 tests)
‚îú‚îÄ‚îÄ test_search.py           # Tests de b√∫squeda (4 tests)
‚îú‚îÄ‚îÄ test_upload.py           # Tests de upload (4 tests)
‚îî‚îÄ‚îÄ test_utils.py            # Tests de utilidades (6 tests)
```

### Tests Positivos (9)
1. `test_normalize_doc_complete` - Normalizaci√≥n de documentos
2. `test_iter_docs_from_file_json_and_ndjson` - Lectura de archivos
3. `test_semantic_search_basic` - B√∫squeda sem√°ntica b√°sica
4. `test_semantic_search_with_project_filter` - Filtrado por proyecto
5. `test_extract_text_from_txt` - Extracci√≥n de texto
6. `test_generate_document_id_unique` - Generaci√≥n de IDs
7. `test_simple_chunk_with_overlap` - Chunking con overlap
8. `test_get_db_connection_success` - Conexi√≥n a BD
9. `test_simple_chunk_edge_cases` - Casos extremos de chunking

### Tests Negativos (10)
1. `test_normalize_doc_missing_fields` - Campos faltantes
2. `test_iter_docs_invalid_json` - JSON malformado
3. `test_semantic_search_empty_query` - Query vac√≠a
4. `test_semantic_search_invalid_project_id` - Proyecto inexistente
5. `test_extract_text_file_not_found` - Archivo no encontrado
6. `test_extract_text_invalid_encoding` - Encoding inv√°lido
7. `test_simple_chunk_invalid_parameters` - Par√°metros inv√°lidos
8. `test_get_db_connection_invalid_credentials` - Credenciales incorrectas
9. `test_get_db_connection_missing_env_vars` - Variables faltantes

---

**Autor**: Luis Cornejo  
**Fecha**: Noviembre 25, 2025  
**Repositorio**: https://github.com/luiscornejo1/back-acorag