# "Búsqueda de Texto Personalizada con Azure Search API"

### Importamos las librerías básicas necesarias

In [None]:
from azure.core.credentials import AzureKeyCredential
from azure.search.documents import SearchClient
from dotenv import load_dotenv
import os

### Cargamos las credenciales desde el archivo .env


In [None]:
# Load secrets and config from .env file
load_dotenv("../.env")

# Azure Search API
search_service_name = os.getenv("SEARCH_SERVICE_NAME")
search_service_key = os.getenv("SEARCH_SERVICE_KEY")
search_index_name = os.getenv("SEARCH_INDEX_NAME")
search_endpoint = "https://{}.search.windows.net/".format(search_service_name)

### Configuración del servicio de búsqueda de Azure

In [None]:
class CreateClient(object):
    def __init__(self, endpoint, key, index_name):
        self.endpoint = endpoint
        self.index_name = index_name
        self.key = key
        self.credentials = AzureKeyCredential(key)

    # Create a SearchClient
    def create_search_client(self):
        return SearchClient(
            endpoint=self.endpoint,
            index_name=self.index_name,
            credential=self.credentials,
        )

### Definimos una clase para crear el cliente de búsqueda de Azure


In [None]:
base_client = CreateClient(search_endpoint, search_service_key, search_index_name)
search_client = base_client.create_search_client()

### Instanciamos la clase y creamos el cliente de búsqueda


In [None]:
search_client = base_client.create_search_client()
results = search_client.search(search_text="SEN", include_total_count=True)
print('Total Documents Matching Query:', results.get_count())
for result in results:
    print("{}: {}".format(result["id"], result["filename"]))


### Consulta 1: Buscar por el texto "Av. Parque Isidora" en el campo 'content'


In [None]:
results = search_client.search(search_text="Av. Parque Isidora", search_fields=["content"], include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 2: Buscar documentos creados después del 01 de julio de 2023


In [None]:
results = search_client.search(search_text="*", filter="created_date gt 2023-07-01T00:00:00Z", include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 3: Buscar por el autor "David Rivas"


In [None]:
results = search_client.search(search_text="David Rivas", search_fields=["author"], include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 4: Buscar por documentos con el texto "DE03234" en el nombre del archivo


In [None]:
results = search_client.search(search_text="DE03234", search_fields=["filename"], include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 5: Buscar por documentos modificados antes del 28 de julio de 2023


In [None]:
results = search_client.search(search_text="*", filter="last_modified_date lt 2023-07-28T00:00:00Z", include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 6: Buscar por documentos con más de 2 páginas


In [None]:
results = search_client.search(search_text="*", filter="total_pages gt 2", include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 7: Buscar por el texto "Ernesto Huber J ." en el campo 'content'


In [None]:
results = search_client.search(search_text="Ernesto Huber J .", search_fields=["content"], include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 8: Buscar todos los documentos e imprimir su fecha de creación


In [None]:
results = search_client.search(search_text="*", include_total_count=True)
print('Total de documentos:', results.get_count())
for result in results:
    print("Id del documento: {}, Fecha de creación: {}".format(result["id"], result["created_date"]))

### Consulta 9: Buscar todos los documentos y mostrar su autor



In [None]:
results = search_client.search(search_text="*", include_total_count=True)
print('Total de documentos:', results.get_count())
for result in results:
    print("Id del documento: {}, Autor: {}".format(result["id"], result["author"]))

### Consulta 10: Buscar por el texto "Norma Técnica de Coordinación" en el campo 'content'


In [None]:
results = search_client.search(search_text="Norma Técnica de Coordinación", search_fields=["content"], include_total_count=True)
print('Total de documentos que coinciden con la consulta:', results.get_count())

### Consulta 11: Buscar documentos que contengan un texto especifico y que sean de un autor en particular

In [None]:
    results = search_client.search(search_text="Norma Técnica de Coordinación", filter="author eq 'David Rivas'", include_total_count=True)
    print('Total de documentos que coinciden con la consulta:', results.get_count())
    for result in results:
        print("Id del documento: {}, Autor: {}".format(result["id"], result["author"]))

### Consulta 12: Buscar documentos creados después de cierta fecha y que contengan un texto en específico


In [None]:
    results = search_client.search(search_text="Av. Parque Isidora", filter="created_date gt 2023-07-01T00:00:00Z", include_total_count=True)
    print('Total de documentos que coinciden con la consulta:', results.get_count())
    for result in results:
        print("Id del documento: {}, Fecha de creación: {}".format(result["id"], result["created_date"]))

### Consulta 13: Buscar documentos que contengan un texto específico en su contenido y que tengan más de 2 páginas:

In [None]:
    results = search_client.search(search_text="Artículo 3", filter="total_pages gt 2", include_total_count=True)
    print('Total de documentos que coinciden con la consulta:', results.get_count())
    for result in results:
        print("Id del documento: {}, Número total de páginas: {}".format(result["id"], result["total_pages"]))

### Consulta 14: Buscar la palabra "coordinador" en todo el índice


In [None]:
search_text = "coordinador"
results = search_client.search(search_text)

print('Total de documentos que coinciden con la consulta:', results.get_count())


for result in results:
    print("Document ID: {}".format(result["id"])) 
    print("Filename: {}".format(result["filename"])) 
    print("Content: {}".format(result["content"])) 
    print("-"*30) 