# Screening de Títulos y Abstracts (TIAB)

Este notebook implementa el proceso de screening de títulos y abstracts siguiendo las guías PRISMA-ScR.

## Objetivos:
- Aplicar criterios de inclusión/exclusión a títulos y abstracts
- Realizar screening independiente por múltiples revisores
- Calcular concordancia entre revisores
- Resolver discrepancias
- Generar lista final para screening de texto completo

In [None]:
import pandas as pd
import numpy as np
from sklearn.metrics import cohen_kappa_score
from udfs_2 import *

# Configuración inicial
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', None)

## 1. Carga de Datos con Abstracts

In [None]:
# Cargar datos con abstracts completos
# df = pd.read_csv('resultados/records_with_abstracts.csv')
# print(f"Total de registros para screening: {len(df)}")

## 2. Definición de Criterios de Inclusión/Exclusión

In [None]:
# Criterios de inclusión
inclusion_criteria = {
    'population': 'ADPKD patients',
    'intervention': 'biomarkers',
    'study_types': ['observational', 'clinical trial', 'cohort', 'case-control'],
    'languages': ['english', 'spanish', 'portuguese']
}

# Criterios de exclusión
exclusion_criteria = {
    'study_types': ['review', 'editorial', 'letter', 'case report'],
    'populations': ['animals only', 'in vitro only'],
    'other': ['no biomarker data', 'no ADPKD focus']
}

print("Criterios de inclusión/exclusión definidos")

## 3. Screening Automatizado (Pre-screening)

In [None]:
# Aplicar pre-screening automatizado basado en palabras clave
# prescreened_df = automated_prescreening(df, inclusion_criteria, exclusion_criteria)
# print(f"Registros después de pre-screening: {len(prescreened_df)}")
# print(f"Registros excluidos en pre-screening: {len(df) - len(prescreened_df)}")

## 4. Screening Manual por Revisores

In [None]:
# Preparar datos para screening manual
# screening_data = prepare_screening_data(prescreened_df)
# print(f"Datos preparados para {len(screening_data)} revisores")

## 5. Análisis de Concordancia

In [None]:
# Cargar resultados de screening de múltiples revisores
# reviewer1_results = load_screening_results('reviewer1_screening.csv')
# reviewer2_results = load_screening_results('reviewer2_screening.csv')

# Calcular concordancia entre revisores
# kappa = calculate_inter_rater_agreement(reviewer1_results, reviewer2_results)
# print(f"Coeficiente Kappa de Cohen: {kappa:.3f}")

## 6. Resolución de Discrepancias

In [None]:
# Identificar discrepancias entre revisores
# discrepancies = identify_discrepancies(reviewer1_results, reviewer2_results)
# print(f"Discrepancias encontradas: {len(discrepancies)}")

# Resolver discrepancias (requiere revisión manual o tercer revisor)
# resolved_discrepancies = resolve_discrepancies(discrepancies)
# print(f"Discrepancias resueltas: {len(resolved_discrepancies)}")

## 7. Resultados Finales del TIAB Screening

In [None]:
# Combinar resultados finales
# final_tiab_results = combine_screening_results(reviewer1_results, reviewer2_results, resolved_discrepancies)
# included_records = final_tiab_results[final_tiab_results['decision'] == 'include']

# print(f"Registros incluidos para full-text screening: {len(included_records)}")
# print(f"Registros excluidos en TIAB screening: {len(final_tiab_results) - len(included_records)}")

## 8. Guardado de Resultados

In [None]:
# Guardar resultados del TIAB screening
# included_records.to_csv('resultados/tiab_included_records.csv', index=False)
# final_tiab_results.to_csv('resultados/tiab_all_decisions.csv', index=False)

# print("Resultados guardados:")
# print("  - resultados/tiab_included_records.csv")
# print("  - resultados/tiab_all_decisions.csv")

## 9. Reporte de TIAB Screening

In [None]:
# Generar reporte detallado del proceso de screening
# screening_report = generate_tiab_screening_report(df, prescreened_df, final_tiab_results, kappa)
# print(screening_report)