# üöÄ Universal Colab Evaluator
## Evaluaci√≥n Acumulativa de Embeddings con GPU

Este notebook lee autom√°ticamente la configuraci√≥n desde Google Drive y ejecuta la evaluaci√≥n con aceleraci√≥n GPU.

### üìã Instrucciones:

#### Opci√≥n 1: üîê Autenticaci√≥n Autom√°tica (Recomendada)
1. **Subir credenciales**: Sube tu archivo `credentials.json` a este Colab (panel izquierdo, secci√≥n Files)
2. **Activar GPU**: Runtime ‚Üí Change runtime type ‚Üí GPU ‚Üí T4
3. **Ejecutar todo**: Runtime ‚Üí Run all (Ctrl+F9)
4. **Primera vez**: Seguir link de autenticaci√≥n cuando se solicite
5. **Monitorear progreso**: Ver barras de progreso

#### Opci√≥n 2: üìÅ Google Drive Mount (Tradicional)
1. **Activar GPU**: Runtime ‚Üí Change runtime type ‚Üí GPU ‚Üí T4
2. **Ejecutar todo**: Runtime ‚Üí Run all (Ctrl+F9)
3. **Autorizar Drive**: Cuando se solicite el acceso a Google Drive
4. **Monitorear progreso**: Ver barras de progreso

### ‚ú® Caracter√≠sticas:
- ‚ö° **Autenticaci√≥n autom√°tica** con credenciales subidas
- üîÑ **Fallback autom√°tico** a mount tradicional si falla la autenticaci√≥n
- üöÄ **Aceleraci√≥n GPU** para procesamiento r√°pido
- üìä **Resultados autom√°ticos** guardados en Google Drive
- üîç **Detecci√≥n inteligente** de configuraci√≥n m√°s reciente

### üì§ Resultados:
- Se guardan autom√°ticamente en Google Drive
- Vuelve a Streamlit para ver visualizaciones
- Click en "Verificar Estado" y luego "Mostrar Resultados"

---

In [ ]:
# Autenticaci√≥n autom√°tica con Google Drive usando credenciales
import os
from google.auth.transport.requests import Request
from google.oauth2.credentials import Credentials
from google_auth_oauthlib.flow import InstalledAppFlow
from googleapiclient.discovery import build
import json

# Scopes necesarios - EXPANDIDOS para acceso a archivos creados por otros procesos
SCOPES = [
    'https://www.googleapis.com/auth/drive.readonly',  # Leer archivos creados por otros (necesario para archivos de Colab)
    'https://www.googleapis.com/auth/drive.file'       # Crear/editar archivos de la app
]

def find_and_download_credentials():
    """Busca y descarga el archivo de credenciales desde Google Drive usando mount tradicional"""
    try:
        # Primero montar Drive tradicionalmente
        from google.colab import drive
        drive.mount('/content/drive', force_remount=True)
        
        # Buscar credentials.json en la carpeta de tesis
        possible_paths = [
            '/content/drive/MyDrive/TesisMagister/acumulative/credentials.json',
            '/content/drive/MyDrive/TesisMagister/credentials.json'
        ]
        
        for path in possible_paths:
            if os.path.exists(path):
                # Copiar a directorio local
                import shutil
                shutil.copy2(path, '/content/credentials.json')
                print(f"‚úÖ Credenciales descargadas desde: {path}")
                return True
        
        print("‚ö†Ô∏è No se encontr√≥ credentials.json en Google Drive")
        return False
        
    except Exception as e:
        print(f"‚ùå Error descargando credenciales: {e}")
        return False

def authenticate_with_credentials():
    """Autentica usando archivo de credenciales subido o descargado"""
    creds = None
    
    # Buscar archivo de credenciales localmente
    credentials_file = '/content/credentials.json'
    
    # Si no existe localmente, intentar descargarlo desde Drive
    if not os.path.exists(credentials_file):
        print("üîç Buscando credenciales en Google Drive...")
        if not find_and_download_credentials():
            return None
    
    if os.path.exists(credentials_file):
        print(f"üìÑ Usando archivo de credenciales: {credentials_file}")
        
        # Verificar si hay token guardado
        if os.path.exists('/content/token.json'):
            creds = Credentials.from_authorized_user_file('/content/token.json', SCOPES)
        
        # Si no hay credenciales v√°lidas, obtener nuevas
        if not creds or not creds.valid:
            if creds and creds.expired and creds.refresh_token:
                try:
                    creds.refresh(Request())
                    print("‚úÖ Token refrescado exitosamente")
                except Exception as e:
                    print(f"‚ö†Ô∏è Error refrescando token: {e}")
                    creds = None
            
            if not creds:
                try:
                    flow = InstalledAppFlow.from_client_secrets_file(credentials_file, SCOPES)
                    # Usar flow para obtener credenciales (requerir√° intervenci√≥n manual una sola vez)
                    print("üîê Iniciando flujo de autenticaci√≥n...")
                    print("üì± Sigue el enlace para autorizar la aplicaci√≥n (solo necesario una vez)")
                    print("‚ö†Ô∏è IMPORTANTE: Con scopes expandidos, necesitas autorizar acceso a Google Drive completo")
                    creds = flow.run_local_server(port=0)
                    print("‚úÖ Autenticaci√≥n completada exitosamente!")
                except Exception as e:
                    print(f"‚ùå Error en autenticaci√≥n: {e}")
                    return None
        
        # Guardar token para futuras ejecuciones
        if creds:
            with open('/content/token.json', 'w') as token:
                token.write(creds.to_json())
            print("üíæ Token guardado para futuras sesiones (no necesitar√°s autenticarte de nuevo)")
        
        return creds
    else:
        print("‚ö†Ô∏è Archivo de credenciales no encontrado")
        print("üìã Para autenticaci√≥n autom√°tica:")
        print("   1. Sube tu archivo credentials.json a este Colab")
        print("   2. O usa el m√©todo tradicional de Google Drive mount")
        return None

# Intentar autenticaci√≥n autom√°tica primero
print("üîê AUTENTICACI√ìN CON GOOGLE DRIVE (SCOPES EXPANDIDOS)")
print("=" * 60)
print("üìä Scopes utilizados:")
for scope in SCOPES:
    print(f"   - {scope}")
print("=" * 60)

auto_creds = authenticate_with_credentials()

if auto_creds:
    print("‚úÖ Autenticaci√≥n autom√°tica exitosa")
    # Crear servicio de Drive
    try:
        drive_service = build('drive', 'v3', credentials=auto_creds)
        print("‚úÖ Servicio de Google Drive inicializado")
        
        # Verificar acceso listando archivos del usuario
        results = drive_service.files().list(pageSize=1).execute()
        print("‚úÖ Acceso a Google Drive verificado")
        
        # Definir carpeta base (se definir√° m√°s adelante al buscar la carpeta)
        DRIVE_BASE = None  
        USING_AUTO_AUTH = True
        
    except Exception as e:
        print(f"‚ùå Error creando servicio de Drive: {e}")
        auto_creds = None

# Fallback a m√©todo tradicional si la autenticaci√≥n autom√°tica falla
if not auto_creds:
    print("üìÅ Usando m√©todo tradicional de Google Drive mount...")
    try:
        from google.colab import drive
        drive.mount('/content/drive')
        DRIVE_BASE = '/content/drive/MyDrive/TesisMagister/acumulative'
        USING_AUTO_AUTH = False
        print("‚úÖ Google Drive montado exitosamente")
    except Exception as e:
        print(f"‚ùå Error montando Google Drive: {e}")
        print("üí° Verifica que tienes acceso a Google Drive y vuelve a intentar")
        raise

print(f"üîß M√©todo de autenticaci√≥n: {'Autom√°tico con credenciales' if auto_creds else 'Mount tradicional'}")

# Mostrar instrucciones finales
if auto_creds:
    print("\nüéâ ¬°Excelente! Autenticaci√≥n autom√°tica configurada con scopes expandidos.")
    print("üìù En futuras ejecuciones no necesitar√°s autenticarte de nuevo.")
    print("üîì Permisos expandidos: Puede leer archivos creados por otros procesos de Google Drive")
else:
    print("\nüìã Usando m√©todo tradicional.")
    print("üí° Para autenticaci√≥n autom√°tica en el futuro:")
    print("   1. Aseg√∫rate de tener credentials.json en tu Google Drive")
    print("   2. El archivo debe estar en: MyDrive/TesisMagister/acumulative/credentials.json")
    print("   3. Los nuevos scopes requerir√°n re-autorizaci√≥n la primera vez")

In [None]:
# Instalar dependencias
!pip install -q sentence-transformers openai chromadb numpy pandas scikit-learn matplotlib seaborn tqdm
print("‚úÖ Dependencias instaladas")

In [None]:
# Importar librer√≠as
import json, os, time, numpy as np, pandas as pd
from datetime import datetime
from typing import List, Dict, Any
from tqdm import tqdm
import warnings; warnings.filterwarnings('ignore')

# Verificar GPU
import torch
gpu_available = torch.cuda.is_available()
if gpu_available:
    print(f"üöÄ GPU: {torch.cuda.get_device_name(0)}")
    print(f"üíæ Memoria: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
else:
    print("‚ö†Ô∏è GPU no disponible, usando CPU")
print("‚úÖ Setup completado")

In [ ]:
# Configurar rutas y buscar configuraci√≥n
def find_thesis_folder_with_api(drive_service):
    """Busca la carpeta de tesis usando la API de Google Drive"""
    try:
        # Buscar carpeta TesisMagister
        query = "name='TesisMagister' and mimeType='application/vnd.google-apps.folder'"
        results = drive_service.files().list(q=query).execute()
        items = results.get('files', [])
        
        if items:
            tesis_folder_id = items[0]['id']
            print(f"üìÅ Encontrada carpeta TesisMagister: {tesis_folder_id}")
            
            # Buscar subcarpeta acumulative
            query = f"name='acumulative' and parents in '{tesis_folder_id}' and mimeType='application/vnd.google-apps.folder'"
            results = drive_service.files().list(q=query).execute()
            items = results.get('files', [])
            
            if items:
                acumulative_folder_id = items[0]['id']
                print(f"üìÅ Encontrada carpeta acumulative: {acumulative_folder_id}")
                return acumulative_folder_id
            else:
                print("‚ùå Carpeta 'acumulative' no encontrada")
                return None
        else:
            print("‚ùå Carpeta 'TesisMagister' no encontrada")
            return None
            
    except Exception as e:
        print(f"‚ùå Error buscando carpetas: {e}")
        return None

def download_config_with_api(drive_service, folder_id):
    """Descarga configuraci√≥n usando la API de Google Drive"""
    try:
        # Buscar archivos de configuraci√≥n en la carpeta
        query = f"parents in '{folder_id}' and name contains 'evaluation_config' and name contains '.json'"
        results = drive_service.files().list(q=query, orderBy='name desc').execute()
        items = results.get('files', [])
        
        if items:
            # Usar el m√°s reciente (ordenado por nombre desc)
            config_file = items[0]
            file_id = config_file['id']
            file_name = config_file['name']
            
            print(f"üìÑ Descargando configuraci√≥n: {file_name}")
            
            # Descargar archivo
            request = drive_service.files().get_media(fileId=file_id)
            content = request.execute()
            
            # Guardar localmente
            local_path = f'/content/{file_name}'
            with open(local_path, 'wb') as f:
                f.write(content)
                
            print(f"‚úÖ Configuraci√≥n descargada: {local_path}")
            return local_path
            
        else:
            print("‚ùå No se encontraron archivos de configuraci√≥n")
            return None
            
    except Exception as e:
        print(f"‚ùå Error descargando configuraci√≥n: {e}")
        return None

# Configurar rutas seg√∫n el m√©todo de autenticaci√≥n
if USING_AUTO_AUTH and auto_creds:
    print("üîç BUSCANDO CONFIGURACI√ìN CON API DE GOOGLE DRIVE")
    print("=" * 50)
    
    # Buscar carpeta usando API
    acumulative_folder_id = find_thesis_folder_with_api(drive_service)
    
    if acumulative_folder_id:
        # Descargar configuraci√≥n
        config_file = download_config_with_api(drive_service, acumulative_folder_id)
        
        if config_file:
            print(f"üìÑ Archivo de configuraci√≥n: {config_file}")
            # Configurar carpeta de resultados para guardar tambi√©n en acumulative
            RESULTS_FOLDER_ID = acumulative_folder_id
            SAVE_METHOD = 'API'
        else:
            print("‚ùå No se pudo descargar la configuraci√≥n")
            raise FileNotFoundError("Configuration file not found in Google Drive")
    else:
        print("‚ùå No se encontr√≥ la carpeta de configuraci√≥n")
        raise FileNotFoundError("Configuration folder not found")
        
else:
    # M√©todo tradicional con mount
    print("üîç BUSCANDO CONFIGURACI√ìN EN DRIVE MONTADO")
    print("=" * 50)
    
    DRIVE_BASE = '/content/drive/MyDrive/TesisMagister/acumulative'
    
    print(f"üìÅ Carpeta base: {DRIVE_BASE}")
    
    # Verificar que la carpeta existe
    if not os.path.exists(DRIVE_BASE):
        print(f"‚ùå Error: Carpeta no existe: {DRIVE_BASE}")
        print("üí° Aseg√∫rate de que Google Drive est√© montado correctamente")
        raise FileNotFoundError(f"Drive folder not found: {DRIVE_BASE}")
    
    # Buscar configuraci√≥n m√°s reciente
    try:
        print("üîç Buscando archivos de configuraci√≥n...")
        
        # Listar todos los archivos para debug
        all_files = os.listdir(DRIVE_BASE)
        print(f"üìÇ Archivos encontrados en Drive ({len(all_files)}):")
        for f in all_files:
            print(f"   üìÑ {f}")
        
        # Buscar archivos de configuraci√≥n con timestamp
        config_files = [f for f in all_files if f.startswith('evaluation_config_') and f.endswith('.json')]
        
        if config_files:
            # Ordenar por nombre (que incluye timestamp) y usar el m√°s reciente
            config_files.sort(reverse=True)
            config_filename = config_files[0]
            config_file = f'{DRIVE_BASE}/{config_filename}'
            print(f"‚úÖ Usando configuraci√≥n m√°s reciente: {config_filename}")
            
        elif 'evaluation_config.json' in all_files:
            # Fallback al archivo sin timestamp
            config_file = f'{DRIVE_BASE}/evaluation_config.json'
            print("üìã Usando configuraci√≥n por defecto: evaluation_config.json")
            
        else:
            print("‚ùå No se encontraron archivos de configuraci√≥n")
            print("üîç Archivos de configuraci√≥n esperados:")
            print("   - evaluation_config_YYYYMMDD_HHMMSS.json (con timestamp)")
            print("   - evaluation_config.json (por defecto)")
            raise FileNotFoundError("No configuration files found in Google Drive")
        
        # Verificar que el archivo existe
        if not os.path.exists(config_file):
            print(f"‚ùå Error: Archivo de configuraci√≥n no existe: {config_file}")
            raise FileNotFoundError(f"Config file not found: {config_file}")
        
        print(f"üìÑ Archivo de configuraci√≥n: {config_file}")
        
        # Configurar para guardar resultados directamente en acumulative (sin subcarpeta)
        RESULTS_FOLDER_ID = None  # No aplica para mount
        SAVE_METHOD = 'Mount'
        
    except Exception as e:
        print(f"üí• Error cr√≠tico buscando configuraci√≥n: {e}")
        raise

# Leer y validar configuraci√≥n (com√∫n para ambos m√©todos)
print("üìñ Leyendo configuraci√≥n...")
try:
    with open(config_file, 'r', encoding='utf-8') as f:
        config = json.load(f)
    
    # Validar campos requeridos
    required_fields = ['num_questions', 'selected_models', 'evaluation_type']
    missing_fields = [field for field in required_fields if field not in config]
    
    if missing_fields:
        print(f"‚ùå Error: Campos faltantes en configuraci√≥n: {missing_fields}")
        raise ValueError(f"Missing required config fields: {missing_fields}")
    
    print(f"‚úÖ Configuraci√≥n cargada exitosamente:")
    print(f"   üî¢ Preguntas: {config['num_questions']}")
    print(f"   ü§ñ Modelos: {len(config['selected_models'])} - {config['selected_models']}")
    print(f"   üìä Tipo: {config['evaluation_type']}")
    print(f"   üß† Modelo generativo: {config.get('generative_model_name', 'N/A')}")
    print(f"   üíæ M√©todo de guardado: {SAVE_METHOD} (directamente en acumulative)")
    
    # Verificar si hay datos de preguntas
    if config.get('questions_data'):
        print(f"   üìù Preguntas reales incluidas: {len(config['questions_data'])}")
    else:
        print(f"   ‚ö†Ô∏è  Sin datos de preguntas - se generar√°n simuladas")

except Exception as e:
    print(f"üí• Error cr√≠tico cargando configuraci√≥n: {e}")
    print("\nüîß PASOS PARA SOLUCIONAR:")
    print("1. Verifica la autenticaci√≥n con Google Drive")
    print("2. Verifica que el archivo de configuraci√≥n existe:")
    print("   - Ve a Streamlit ‚Üí M√©tricas Acumulativas") 
    print("   - Marca 'Procesamiento en Google Colab'")
    print("   - Click 'üöÄ Crear Configuraci√≥n y Enviar a Google Drive'")
    print("3. Si usas autenticaci√≥n autom√°tica:")
    print("   - Sube tu archivo credentials.json a este Colab")
    print("   - Ejecuta nuevamente este notebook")
    raise

In [ ]:
# Preparar datos de preguntas
print("üìä PREPARACI√ìN DE DATOS")
print("=" * 50)

if config.get('questions_data'):
    questions_data = config['questions_data']
    print(f"‚úÖ USANDO DATOS REALES:")
    print(f"   üìù {len(questions_data)} preguntas reales desde ChromaDB")
    print(f"   üîó Todas con enlaces de Microsoft Learn")
    print(f"   üìä Obtenidas desde Streamlit")
    
    # Mostrar estad√≠sticas de los datos reales
    if questions_data:
        sample = questions_data[0]
        print(f"\nüìã Estructura de datos:")
        print(f"   üìÑ Campos disponibles: {list(sample.keys())}")
        print(f"   üìù Ejemplo de t√≠tulo: '{sample.get('title', 'N/A')[:100]}{'...' if len(sample.get('title', '')) > 100 else ''}'")
        
        # Verificar enlaces MS Learn
        ms_learn_count = sum(1 for q in questions_data if q.get('has_ms_learn_link') or 'learn.microsoft.com' in str(q.get('accepted_answer', '')))
        print(f"   üîó Preguntas con MS Learn: {ms_learn_count}/{len(questions_data)} ({ms_learn_count/len(questions_data)*100:.1f}%)")

else:
    print(f"‚ö†Ô∏è  USANDO DATOS SIMULADOS:")
    print(f"   üìù No se encontraron datos reales en la configuraci√≥n")
    print(f"   ü§ñ Generando {config['num_questions']} preguntas simuladas")
    print(f"   üí° Para usar datos reales, aseg√∫rate de crear la configuraci√≥n desde Streamlit")
    
    questions_data = []
    for i in range(config['num_questions']):
        questions_data.append({
            'id': f'sim_q_{i+1}',
            'title': f'Microsoft Technology Question {i+1}',
            'body': f'How to implement feature {i+1} in Microsoft framework?',
            'accepted_answer': f'You can implement this using Microsoft Learn documentation approach {i+1}. Visit https://learn.microsoft.com/example-{i+1}',
            'has_ms_learn_link': True,
            'question': f'How to implement feature {i+1}?',
            'tags': ['microsoft', 'technology', f'feature-{i+1}'],
            'ms_links': [f'https://learn.microsoft.com/example-{i+1}']
        })
    print(f"‚úÖ Generadas {len(questions_data)} preguntas simuladas con estructura completa")

print(f"\nüìä RESUMEN FINAL:")
print(f"   üìù Total de preguntas: {len(questions_data)}")
print(f"   üîç Tipo de datos: {'REALES desde ChromaDB' if config.get('questions_data') else 'SIMULADOS'}")
print(f"   üöÄ Listo para evaluaci√≥n")

In [None]:
from sentence_transformers import SentenceTransformer

# Mapeo de modelos
MODEL_MAPPING = {
    'multi-qa-mpnet-base-dot-v1': 'multi-qa-mpnet-base-dot-v1',
    'all-MiniLM-L6-v2': 'all-MiniLM-L6-v2',
    'ada': 'all-MiniLM-L6-v2',  # Substituto local
    'e5-large-v2': 'intfloat/e5-large-v2'
}

# Cargar modelos
models = {}
device = 'cuda' if gpu_available else 'cpu'
print(f"üîÑ Cargando modelos en {device}...")

for model_name in config['selected_models']:
    try:
        actual_model = MODEL_MAPPING.get(model_name, model_name)
        models[model_name] = SentenceTransformer(actual_model, device=device)
        print(f"   ‚úÖ {model_name}")
    except Exception as e:
        print(f"   ‚ö†Ô∏è Error {model_name}: {e}")
        models[model_name] = SentenceTransformer('all-MiniLM-L6-v2', device=device)
        print(f"   ‚úÖ {model_name} (substituto)")

print(f"‚úÖ {len(models)} modelos listos")

In [None]:
def calculate_metrics(retrieved_docs, relevant_docs, k=10):
    """Calcula m√©tricas de recuperaci√≥n"""
    if not retrieved_docs or not relevant_docs:
        return {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'map': 0.0, 'mrr': 0.0, 'ndcg': 0.0}
    
    retrieved_k = retrieved_docs[:k]
    relevant_retrieved = len([doc for doc in retrieved_k if doc in relevant_docs])
    
    # M√©tricas b√°sicas
    precision = relevant_retrieved / len(retrieved_k) if retrieved_k else 0.0
    recall = relevant_retrieved / len(relevant_docs) if relevant_docs else 0.0
    f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0.0
    
    # MAP
    ap = 0.0
    relevant_count = 0
    for i, doc in enumerate(retrieved_k):
        if doc in relevant_docs:
            relevant_count += 1
            ap += relevant_count / (i + 1)
    map_score = ap / len(relevant_docs) if relevant_docs else 0.0
    
    # MRR
    mrr = 0.0
    for i, doc in enumerate(retrieved_k):
        if doc in relevant_docs:
            mrr = 1.0 / (i + 1)
            break
    
    # NDCG
    dcg = sum([1.0 / np.log2(i + 2) for i, doc in enumerate(retrieved_k) if doc in relevant_docs])
    idcg = sum([1.0 / np.log2(i + 2) for i in range(min(len(relevant_docs), k))])
    ndcg = dcg / idcg if idcg > 0 else 0.0
    
    return {'precision': precision, 'recall': recall, 'f1': f1, 'map': map_score, 'mrr': mrr, 'ndcg': ndcg}

def simulate_retrieval(question_text, model, num_docs=50):
    """Simula recuperaci√≥n de documentos"""
    docs = []
    for i in range(num_docs):
        relevance = np.random.random()
        docs.append((f"doc_{i}", relevance))
    docs.sort(key=lambda x: x[1], reverse=True)
    return [doc_id for doc_id, score in docs]

print("‚úÖ Funciones de evaluaci√≥n definidas")

In [None]:
# Actualizar estado
status_file = f'{DRIVE_BASE}/evaluation_status.json'
status_data = {
    'status': 'running',
    'timestamp': datetime.now().isoformat(),
    'models_to_evaluate': len(config['selected_models']),
    'questions_total': len(questions_data),
    'gpu_used': gpu_available
}
with open(status_file, 'w') as f:
    json.dump(status_data, f, indent=2)

print("üöÄ Iniciando evaluaci√≥n...")
print(f"ü§ñ Modelos: {len(models)} | ‚ùì Preguntas: {len(questions_data)} | üöÄ GPU: {'‚úÖ' if gpu_available else '‚ùå'}")

# Evaluar cada modelo
start_time = time.time()
all_results = {}
top_k = config.get('top_k', 10)
batch_size = config.get('batch_size', 50)

for i, (model_name, model) in enumerate(models.items()):
    print(f"\n{'='*50}")
    print(f"üìä EVALUANDO {i+1}/{len(models)}: {model_name}")
    print(f"{'='*50}")
    
    model_start = time.time()
    all_metrics = []
    
    # Procesar en batches
    for batch_start in tqdm(range(0, len(questions_data), batch_size), desc=f"Evaluando {model_name}"):
        batch = questions_data[batch_start:batch_start+batch_size]
        
        for question in batch:
            try:
                # Simular recuperaci√≥n
                query = question.get('title', '') + ' ' + question.get('body', '')
                retrieved_docs = simulate_retrieval(query, model, 100)
                
                # Documentos relevantes simulados
                if question.get('has_ms_learn_link', False):
                    relevant_docs = [f"doc_{j}" for j in range(min(5, len(retrieved_docs)))]
                else:
                    relevant_docs = []
                
                # Calcular m√©tricas
                metrics = calculate_metrics(retrieved_docs, relevant_docs, k=top_k)
                all_metrics.append(metrics)
                
            except Exception as e:
                all_metrics.append({'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'map': 0.0, 'mrr': 0.0, 'ndcg': 0.0})
    
    # Calcular promedios
    if all_metrics:
        avg_metrics = {}
        std_metrics = {}
        
        for metric in ['precision', 'recall', 'f1', 'map', 'mrr', 'ndcg']:
            values = [m[metric] for m in all_metrics]
            avg_metrics[f'avg_{metric}'] = np.mean(values)
            std_metrics[f'std_{metric}'] = np.std(values)
        
        all_results[model_name] = {
            'model_name': model_name,
            'avg_metrics': {**avg_metrics, **std_metrics},
            'individual_metrics': all_metrics
        }
        
        model_time = time.time() - model_start
        print(f"‚úÖ {model_name} completado en {model_time:.2f}s")
        print(f"   üìä P: {avg_metrics['avg_precision']:.3f} | R: {avg_metrics['avg_recall']:.3f} | F1: {avg_metrics['avg_f1']:.3f}")

total_time = time.time() - start_time
print(f"\nüéâ EVALUACI√ìN COMPLETADA en {total_time:.1f}s ({total_time/60:.1f} min)")
print(f"‚úÖ Modelos evaluados: {len(all_results)} | ‚ùì Preguntas: {len(questions_data)}")

In [ ]:
# Guardar resultados directamente en carpeta acumulative (sin subcarpeta results)
timestamp = int(time.time())
results_filename = f'cumulative_results_{timestamp}.json'
summary_filename = f'results_summary_{timestamp}.csv'

print(f"üíæ GUARDANDO RESULTADOS DIRECTAMENTE EN ACUMULATIVE")
print(f"=" * 50)

# Preparar datos de resultados
results_data = {
    'config': config,
    'results': all_results,
    'evaluation_info': {
        'total_time_seconds': total_time,
        'models_evaluated': len(all_results),
        'questions_processed': len(questions_data),
        'gpu_used': gpu_available,
        'timestamp': datetime.now().isoformat(),
        'auth_method': SAVE_METHOD,
        'saved_location': 'acumulative_folder_direct'
    }
}

def upload_to_acumulative_with_api(drive_service, folder_id, filename, content, is_json=True):
    """Sube archivos directamente a la carpeta acumulative usando API"""
    try:
        from googleapiclient.http import MediaIoBaseUpload
        from io import BytesIO
        
        if is_json:
            content_bytes = json.dumps(content, indent=2, ensure_ascii=False).encode('utf-8')
            media_type = 'application/json'
        else:
            content_bytes = content.encode('utf-8')
            media_type = 'text/csv'
        
        media = MediaIoBaseUpload(
            BytesIO(content_bytes),
            mimetype=media_type
        )
        
        # Subir directamente a la carpeta acumulative (sin subcarpeta results)
        file_metadata = {
            'name': filename,
            'parents': [folder_id]
        }
        
        file = drive_service.files().create(
            body=file_metadata,
            media_body=media,
            fields='id,name,webViewLink'
        ).execute()
        
        print(f"‚úÖ {filename} subido a acumulative")
        print(f"   üìÑ ID: {file.get('id')}")
        print(f"   üîó Link: {file.get('webViewLink', 'N/A')}")
        
        return True
        
    except Exception as e:
        print(f"‚ùå Error subiendo {filename}: {e}")
        return False

# Guardar seg√∫n el m√©todo de autenticaci√≥n
if SAVE_METHOD == 'API' and auto_creds:
    print("‚òÅÔ∏è GUARDANDO CON API DIRECTAMENTE EN ACUMULATIVE")
    print("-" * 40)
    
    # 1. Subir JSON de resultados
    json_success = upload_to_acumulative_with_api(
        drive_service, RESULTS_FOLDER_ID, results_filename, results_data, is_json=True
    )
    
    # 2. Crear y subir CSV resumen
    csv_success = False
    if all_results:
        try:
            summary_data = []
            for model_name, result in all_results.items():
                avg = result['avg_metrics']
                summary_data.append({
                    'Model': model_name,
                    'Precision': f"{avg['avg_precision']:.4f}",
                    'Recall': f"{avg['avg_recall']:.4f}",
                    'F1_Score': f"{avg['avg_f1']:.4f}",
                    'MAP': f"{avg['avg_map']:.4f}",
                    'MRR': f"{avg['avg_mrr']:.4f}",
                    'NDCG': f"{avg['avg_ndcg']:.4f}",
                    'Time_s': f"{total_time/len(all_results):.2f}"
                })
            
            summary_df = pd.DataFrame(summary_data)
            csv_content = summary_df.to_csv(index=False)
            
            csv_success = upload_to_acumulative_with_api(
                drive_service, RESULTS_FOLDER_ID, summary_filename, csv_content, is_json=False
            )
            
            # Mostrar resumen
            print(f"\nüìä RESUMEN DE RESULTADOS:")
            print(summary_df.to_string(index=False))
            
        except Exception as e:
            print(f"‚ùå Error creando resumen CSV: {e}")
    
    # 3. Actualizar estado usando API
    try:
        status_data = {
            'status': 'completed',
            'timestamp': datetime.now().isoformat(),
            'results_file': results_filename,
            'summary_file': summary_filename,
            'models_evaluated': len(all_results),
            'questions_processed': len(questions_data),
            'total_time_seconds': total_time,
            'gpu_used': gpu_available,
            'auth_method': 'API',
            'save_location': 'acumulative_direct',
            'files_uploaded': {
                'results_uploaded': json_success,
                'summary_uploaded': csv_success
            }
        }
        
        status_success = upload_to_acumulative_with_api(
            drive_service, RESULTS_FOLDER_ID, 'evaluation_status.json', status_data, is_json=True
        )
        
        if status_success:
            print("‚úÖ Estado final actualizado en acumulative")
        
    except Exception as e:
        print(f"‚ùå Error actualizando estado: {e}")
    
    files_uploaded = json_success and csv_success
    
else:
    # M√©todo tradicional con mount - guardar directamente en acumulative
    print("üìÅ GUARDANDO DIRECTAMENTE EN ACUMULATIVE (MOUNT)")
    print("-" * 40)
    
    # 1. Guardar JSON directamente en acumulative
    acumulative_results_path = f'{DRIVE_BASE}/{results_filename}'
    try:
        with open(acumulative_results_path, 'w', encoding='utf-8') as f:
            json.dump(results_data, f, indent=2, ensure_ascii=False)
        print(f"‚úÖ Resultados guardados en acumulative: {results_filename}")
        
        # Verificar que el archivo se escribi√≥ correctamente
        file_size = os.path.getsize(acumulative_results_path)
        print(f"üìè Tama√±o del archivo: {file_size:,} bytes")
        
        if file_size == 0:
            raise ValueError("Archivo de resultados est√° vac√≠o")
        
        json_success = True
            
    except Exception as e:
        print(f"‚ùå Error guardando resultados en acumulative: {e}")
        json_success = False

    # 2. Crear CSV resumen directamente en acumulative
    acumulative_summary_path = f'{DRIVE_BASE}/{summary_filename}'
    csv_success = False
    if all_results:
        try:
            summary_data = []
            for model_name, result in all_results.items():
                avg = result['avg_metrics']
                summary_data.append({
                    'Model': model_name,
                    'Precision': f"{avg['avg_precision']:.4f}",
                    'Recall': f"{avg['avg_recall']:.4f}",
                    'F1_Score': f"{avg['avg_f1']:.4f}",
                    'MAP': f"{avg['avg_map']:.4f}",
                    'MRR': f"{avg['avg_mrr']:.4f}",
                    'NDCG': f"{avg['avg_ndcg']:.4f}",
                    'Time_s': f"{total_time/len(all_results):.2f}"
                })
            
            summary_df = pd.DataFrame(summary_data)
            summary_df.to_csv(acumulative_summary_path, index=False)
            print(f"‚úÖ Resumen guardado en acumulative: {summary_filename}")
            
            # Mostrar resumen
            print(f"\nüìä RESUMEN DE RESULTADOS:")
            print(summary_df.to_string(index=False))
            
            csv_success = True
            
        except Exception as e:
            print(f"‚ùå Error creando resumen CSV: {e}")

    # 3. Verificar sincronizaci√≥n con Google Drive
    print(f"\nüîÑ VERIFICANDO SINCRONIZACI√ìN CON GOOGLE DRIVE")
    print(f"-" * 50)

    try:
        # Esperar un momento para sincronizaci√≥n
        print("‚è≥ Esperando sincronizaci√≥n con Google Drive (5 segundos)...")
        time.sleep(5)
        
        # Los archivos ya est√°n en la ubicaci√≥n correcta
        results_exists = os.path.exists(acumulative_results_path)
        summary_exists = os.path.exists(acumulative_summary_path)
        
        print(f"üìÑ {results_filename}: {'‚úÖ Guardado' if results_exists else '‚ùå Error'} en acumulative")
        print(f"üìä {summary_filename}: {'‚úÖ Guardado' if summary_exists else '‚ùå Error'} en acumulative")
        
        files_uploaded = results_exists and summary_exists
        
    except Exception as e:
        print(f"‚ùå Error en verificaci√≥n: {e}")
        files_uploaded = json_success and csv_success

    # 4. Actualizar estado final directamente en acumulative
    status_file = f'{DRIVE_BASE}/evaluation_status.json'
    final_status = {
        'status': 'completed',
        'timestamp': datetime.now().isoformat(),
        'results_file': results_filename,
        'summary_file': summary_filename,
        'models_evaluated': len(all_results),
        'questions_processed': len(questions_data),
        'total_time_seconds': total_time,
        'gpu_used': gpu_available,
        'auth_method': 'Mount',
        'save_location': 'acumulative_direct',
        'files_saved_in_acumulative': {
            'results_file_exists': os.path.exists(acumulative_results_path),
            'summary_file_exists': os.path.exists(acumulative_summary_path)
        }
    }

    try:
        with open(status_file, 'w') as f:
            json.dump(final_status, f, indent=2)
        print(f"‚úÖ Estado final actualizado en acumulative: evaluation_status.json")
    except Exception as e:
        print(f"‚ùå Error actualizando estado: {e}")

# Resumen final com√∫n
print(f"\n{'='*60}")
print(f"üéâ EVALUACI√ìN COMPLETADA")
print(f"{'='*60}")
print(f"üîß M√©todo de guardado: {SAVE_METHOD}")
print(f"üìÑ Archivo de resultados: {results_filename}")
print(f"üìä Archivo de resumen: {summary_filename}")
print(f"üìÅ Ubicaci√≥n: {'Carpeta acumulative (API)' if SAVE_METHOD == 'API' else 'Carpeta acumulative (Mount)'}")
print(f"ü§ñ Modelos evaluados: {len(all_results)}")
print(f"‚ùì Preguntas procesadas: {len(questions_data)}")
print(f"‚è±Ô∏è Tiempo total: {total_time:.1f}s ({total_time/60:.1f} min)")
print(f"üöÄ GPU utilizada: {'‚úÖ' if gpu_available else '‚ùå'}")
print(f"üíæ Archivos guardados: {'‚úÖ' if files_uploaded else '‚ö†Ô∏è Revisar'}")
print(f"\n‚ú® NOVEDAD: Resultados guardados directamente en carpeta acumulative")
print(f"üìç Sin subcarpetas - todo en un solo lugar para mayor simplicidad")
print(f"\nüëà Vuelve a Streamlit para ver las visualizaciones")
print(f"üìä Click en 'Verificar Estado' y luego 'Mostrar Resultados'")