# Ejercicio 1: Introducción a Recuperación de Información

## Objetivo de la práctica
- Entender el problema de **buscar información** en colecciones de texto.
- Comprender por qué se necesita un **índice invertido** en recuperación de información.
- Programar una primera solución manual y luego optimizarla con un índice.
- Evaluar la mejora en tiempos de búsqueda cuando usamos estructuras adecuadas.

## Parte 1: Búsqueda lineal en documentos

### Actividad
1. Se te proporcionará un conjunto de documentos de texto.
2. Escribe una función que:
   - Lea todos los documentos.
   - Busque una palabra ingresada por el usuario.
   - Muestre en qué documentos aparece la palabra.

In [None]:
# Función para realizar búsqueda lineal en documentos
def busqueda_lineal(ruta_documentos, palabra_buscar):
    resultados = []
    try:
        with open(ruta_documentos, 'r', encoding='utf-8') as file:
            lineas = file.readlines()

        print(f"\nBuscando la palabra '{palabra_buscar}' en el corpus...\n")

        # Buscar en cada línea
        for num_linea, linea in enumerate(lineas, 1):
            if palabra_buscar.lower() in linea.lower():  # Ignorar mayúsculas/minúsculas
                resultados.append((num_linea, linea.strip()))

        if resultados:
            for num_linea, contenido in resultados:
                print(f"Línea {num_linea}: {contenido}")
        else:
            print(f"La palabra '{palabra_buscar}' no se encontró en el corpus.")

    except FileNotFoundError:
        print(f"Error: No se encontró el archivo en la ruta '{ruta_documentos}'.")
    except Exception as e:
        print(f"Error inesperado: {e}")

    return resultados


# Ejemplo de uso
ruta = 'ir25a/data/01_corpus_turismo.txt'
palabra = input("Ingrese la palabra a buscar: ")
busqueda_lineal(ruta, palabra)

Error: No se encontró el archivo en la ruta 'ir25a/data/01_corpus_turismo.txt'.


[]

## Parte 2: Construcción de un índice invertido

### Actividad
1. Escribe un programa que:
   - Recorra todos los documentos.
   - Construya un **índice invertido**, es decir, un diccionario donde:
     - Cada palabra clave apunta a una lista de documentos donde aparece.

2. Escribe una nueva función de búsqueda que:
   - Consulte directamente el índice para encontrar los documentos relevantes.
   - Sea mucho más rápida que la búsqueda lineal.

## Parte 3: Evaluación de tiempos de búsqueda
### Actividad

1. Realiza la búsqueda de varias palabras usando:
      -  Corpus pequeño: 16 documentos (turismo en Ecuador).
      -  Corpus grande: 500 documentos (versión ampliada).
2. Mide el tiempo de ejecución:
      -  Para búsqueda lineal.
      -  Para búsqueda usando índice invertido.
      -  Grafica o presenta los resultados en una tabla comparativa.

### Ejemplo de palabras para buscar
- quito
- montañita
- feriado
- playas
- aventura
- galápagos

## Parte 4:
### Actividad
1. Modifica el índice para que ignore mayúsculas/minúsculas (por ejemplo, "Playa" y "playa" deben considerarse iguales).
2. Permite consultas de múltiples términos (ejemplo: buscar documentos que contengan "playa" y "turismo").
3. Calcula el _speedup_