# Advanced Search Techniques with Azure AI Search: Keyword, Vector, and Hybrid Methods

This notebook demonstrates how to perform different types of searches using Azure AI Search, including keyword search, vector search, hybrid search, semantic ranking, and query rewriting.

## Prerequisites

Before running the notebook, ensure you have the following: 

- [Clone](https://github.com/abbhakan/rag-time) the repository to your local machine by following the script below:

    ```bash
    git clone git@github.com:abbhakan/rag-time.git
    cd rag-time
    ```

- Journey 2!!
- Endre .env.sample til -> .env og plugg inn admin_key fra teams
- Install Python 3.8 or later from [python.org](https://python.org).

## Steps to Use the Notebook

### 1. Install Required Libraries

Run the first code cell to install the required Python libraries:

In [None]:
#windows
%pip install azure-search-documents==11.6.0b9 azure-identity python-dotenv pandas jinja2 --quiet

In [3]:
#mac
!python3 -m pip install azure-search-documents==11.6.0b9 azure-identity python-dotenv pandas jinja2 --quiet

### 2. Set Up Environment Variables

To store credentials securely, rename `.env.sample` file to `.env` in the same directory as the notebook and update the following variables:

In [None]:
AZURE_SEARCH_SERVICE_ENDPOINT="<your_search_service_endpoint>"
AZURE_SEARCH_INDEX="<your_search_index_name>"
AZURE_SEARCH_ADMIN_KEY="<your_search_admin_key>"

After setting up, the notebook will automatically load these values using dotenv.

### 3. Load Environment Variables

Run the following command to load environment variables from the .env file:

In [18]:
import os
from azure.core.credentials import AzureKeyCredential
from azure.identity import DefaultAzureCredential
from dotenv import load_dotenv

load_dotenv(override=True) # take environment variables from .env.

endpoint = os.environ["AZURE_SEARCH_SERVICE_ENDPOINT"]
index_name = os.environ["AZURE_SEARCH_INDEX"]
credential = AzureKeyCredential(os.getenv("AZURE_SEARCH_ADMIN_KEY"))

This will ensure all necessary credentials are available before setting up the API client.

### 4. Set Up API Client and Define the Display Function

Initialize the Azure AI Search Client for interacting with the Azure Search service and make the search results easier to read by defining a function that formats and displays results:

In [19]:
from azure.search.documents import SearchClient
import pandas as pd

search_client = SearchClient(endpoint, index_name, credential)

def display_results(results):
    df = pd.json_normalize(list(results)).dropna(axis=1, how='all')
    df["chunk"] = df["chunk"].apply(lambda c: c[:300] + '...' if len(c) > 300 else c)
    first_cols = ['title', 'chunk', '@search.score']
    df = df[first_cols + [col for col in df.columns if col not in first_cols]]

    df = df.style.set_properties(**{
        'max-width': '500px',
        'text-align': 'left',
        'white-space': 'normal',
        'word-wrap': 'break-word'
    }).hide(axis="index")


    return df


### 5. Perform Different Search Methods

#### Keyword Search

Execute a traditional keyword-based search:

In [20]:
results = search_client.search(search_text="mobiltelefon goder", top=5, select=["title", "chunk"])

display_results(results)


title,chunk,@search.score
11. Goder.pdf,"11. Goder  Publiseringshonorar  Foredragshonorar  Rekrutteringsbonus  Sertifiseringsbonus  Databrille/synstest  Studielån  Mobiltelefon og bredbånd  Utstyr til hjemmekontoret Publiseringshonorar Artikler skrevet av ansatte og som blir publisert, honoreres med kr 10.000,-. Honoraret er s...",2.589928
11. Goder.pdf,"https://steria.sharepoint.com/:w:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/S%C3%B8knad%20om%20studiel%C3%A5n.doc?d=w1c2b1c45fe7845a1be4dd563e84ba02c&csf=1&web=1&e=WwW6bW Dersom du følger undervisning av mer omfattende art, kan du søke om studielån. Lånet kan dekke hele eller deler a...",2.469802
11. Goder.pdf,"behov, og kun hos norske profesjonelle leverandører. Videre dekker Sopra Steira mobilabonnement i henhold til vårt til en hver tid gjeldende mobilabonnement. Ved å følge linken finner du ytterligere opplysninger om mobiltelefoni. Bredbånd Sopra Steria dekker inntil kr 4 200,- per år i utgifter ...",1.813518
11. Goder.pdf,"ikke. Viktig informasjon ved kjøp av utstyr til hjemmekontor: Du får dekket kjøp opp til NOK 3 000,- inkludert mva og frakt. Kostnaden belastes din BU. Du kan kjøpe så kostbart utstyr du vil. Selskapet dekker det utstyret koster inntil summen som beskrevet over. Siden det er et kjøp du gjør på v...",1.718958
14. Foreldrepermisjon.pdf,"i permisjon. Goder under foreldrepermisjon Du beholder dine goder som forsikringer, mobilabonnement og pensjon som vanlig mens du er i foreldrepermisjon. Sopra Steria dager tjenes ikke opp mens du er i permisjon. 4/23/25, 9:11 AM 14. Foreldrepermisjon https://steria.sharepoint.com/sites/Persona...",1.624854


#### Vector Search

Retrieve documents using vector similarity search:

In [21]:
from azure.search.documents.models import VectorizableTextQuery

results = search_client.search(
    None,
    top=5,
    vector_queries=[VectorizableTextQuery(text="Mobiltelefon", k_nearest_neighbors=50, fields="text_vector")],
    select=["title", "chunk"]
)

display_results(results)

title,chunk,@search.score
11. Goder.pdf,"https://steria.sharepoint.com/:w:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/S%C3%B8knad%20om%20studiel%C3%A5n.doc?d=w1c2b1c45fe7845a1be4dd563e84ba02c&csf=1&web=1&e=WwW6bW Dersom du følger undervisning av mer omfattende art, kan du søke om studielån. Lånet kan dekke hele eller deler a...",0.59496
11. Goder.pdf,"behov, og kun hos norske profesjonelle leverandører. Videre dekker Sopra Steira mobilabonnement i henhold til vårt til en hver tid gjeldende mobilabonnement. Ved å følge linken finner du ytterligere opplysninger om mobiltelefoni. Bredbånd Sopra Steria dekker inntil kr 4 200,- per år i utgifter ...",0.586248
10. Fleksibel arbeidsplass.pdf,"10. Fleksibel arbeidsplass  Hjemmekontor  Jobbe hjemmefra Vi tror på den fleksible arbeidsplassen. I en fleksibel arbeidsplass vil vi kombinere vår tid mellom ulike arbeidslokasjoner, enten det er hos kunde, hjemme eller på kontoret. Kundene styrer arbeidstid og sted, og deretter prosjektleder/p...",0.571012
16. Pensjon og forsikring.pdf,https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Pensjon%20og%20forsikring/Sopra%20Steria%20forsikringsbevis%20reise.pdf?csf=1&web=1&e=bXgSOF https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/Medlemsbevis%20Storebrand%20engelsk.pdf?...,0.570474
10. Fleksibel arbeidsplass.pdf,innebærer at bedriften har en infrastruktur som gjør det mulig for medarbeidere å koble seg opp mot interne systemer hjemmefra. Bedriften stiller nødvendig utstyr til disposisjon for å utføre arbeid hjemmefra. Arbeid som utføres utenom normal arbeidstid Alle medarbeidere kan i prinsippet utføre ar...,0.568984


#### Hybrid Search (Keyword + Vector Search)

Combine keyword and vector searches for better accuracy:

In [22]:
results = search_client.search(
    search_text="Mobiltelefon",
    vector_queries=[VectorizableTextQuery(text="Mobiltelefon", k_nearest_neighbors=50, fields="text_vector")],
    top=5,
    select=["title", "chunk"]
)

display_results(results)

title,chunk,@search.score
11. Goder.pdf,"https://steria.sharepoint.com/:w:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/S%C3%B8knad%20om%20studiel%C3%A5n.doc?d=w1c2b1c45fe7845a1be4dd563e84ba02c&csf=1&web=1&e=WwW6bW Dersom du følger undervisning av mer omfattende art, kan du søke om studielån. Lånet kan dekke hele eller deler a...",0.033333
11. Goder.pdf,"11. Goder  Publiseringshonorar  Foredragshonorar  Rekrutteringsbonus  Sertifiseringsbonus  Databrille/synstest  Studielån  Mobiltelefon og bredbånd  Utstyr til hjemmekontoret Publiseringshonorar Artikler skrevet av ansatte og som blir publisert, honoreres med kr 10.000,-. Honoraret er s...",0.031545
11. Goder.pdf,"behov, og kun hos norske profesjonelle leverandører. Videre dekker Sopra Steira mobilabonnement i henhold til vårt til en hver tid gjeldende mobilabonnement. Ved å følge linken finner du ytterligere opplysninger om mobiltelefoni. Bredbånd Sopra Steria dekker inntil kr 4 200,- per år i utgifter ...",0.016393
10. Fleksibel arbeidsplass.pdf,"10. Fleksibel arbeidsplass  Hjemmekontor  Jobbe hjemmefra Vi tror på den fleksible arbeidsplassen. I en fleksibel arbeidsplass vil vi kombinere vår tid mellom ulike arbeidslokasjoner, enten det er hos kunde, hjemme eller på kontoret. Kundene styrer arbeidstid og sted, og deretter prosjektleder/p...",0.016129
16. Pensjon og forsikring.pdf,https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Pensjon%20og%20forsikring/Sopra%20Steria%20forsikringsbevis%20reise.pdf?csf=1&web=1&e=bXgSOF https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/Medlemsbevis%20Storebrand%20engelsk.pdf?...,0.015873


#### Hybrid Search + Semantic Ranker

Enhance search results using a semantic ranker:

In [24]:
results = search_client.search(
    search_text="Mobiltelefon",
    vector_queries=[VectorizableTextQuery(text="Mobiltelefon", k_nearest_neighbors=50, fields="text_vector")],
    top=5,
    select=["title", "chunk"],
    query_type="semantic",
    semantic_configuration_name="sopravector2-semantic-configuration"
)

display_results(results)

title,chunk,@search.score,@search.reranker_score
11. Goder.pdf,"https://steria.sharepoint.com/:w:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/S%C3%B8knad%20om%20studiel%C3%A5n.doc?d=w1c2b1c45fe7845a1be4dd563e84ba02c&csf=1&web=1&e=WwW6bW Dersom du følger undervisning av mer omfattende art, kan du søke om studielån. Lånet kan dekke hele eller deler a...",0.033333,2.431921
11. Goder.pdf,"behov, og kun hos norske profesjonelle leverandører. Videre dekker Sopra Steira mobilabonnement i henhold til vårt til en hver tid gjeldende mobilabonnement. Ved å følge linken finner du ytterligere opplysninger om mobiltelefoni. Bredbånd Sopra Steria dekker inntil kr 4 200,- per år i utgifter ...",0.016393,2.248306
16. Pensjon og forsikring.pdf,https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Pensjon%20og%20forsikring/Sopra%20Steria%20forsikringsbevis%20reise.pdf?csf=1&web=1&e=bXgSOF https://steria.sharepoint.com/:b:/r/sites/Personalhndbok/Dokumentbibliotek%20Personhndbok/Medlemsbevis%20Storebrand%20engelsk.pdf?...,0.015873,2.133192
11. Goder.pdf,"11. Goder  Publiseringshonorar  Foredragshonorar  Rekrutteringsbonus  Sertifiseringsbonus  Databrille/synstest  Studielån  Mobiltelefon og bredbånd  Utstyr til hjemmekontoret Publiseringshonorar Artikler skrevet av ansatte og som blir publisert, honoreres med kr 10.000,-. Honoraret er s...",0.031545,2.098853
14. Foreldrepermisjon.pdf,"i permisjon. Goder under foreldrepermisjon Du beholder dine goder som forsikringer, mobilabonnement og pensjon som vanlig mens du er i foreldrepermisjon. Sopra Steria dager tjenes ikke opp mens du er i permisjon. 4/23/25, 9:11 AM 14. Foreldrepermisjon https://steria.sharepoint.com/sites/Persona...",0.012987,1.863352


## Troubleshooting

- **Environment Variables Not Loaded:** Ensure you have correctly set the .env file or manually export them in your terminal before running the notebook.
- **Authentication Issues:** If using Managed Identity, make sure your Azure identity has proper role assignments.
- **Search Results Are Empty:** Ensure your Azure AI Search index contains vectorized data.
- **Query Rewriting Issues:** Ensure your search service supports semantic configurations and generative query rewrites.

## Summary

This notebook demonstrates different search techniques using Azure AI Search, including keyword search, vector search, hybrid search, semantic ranking, and query rewriting. The approach enhances search accuracy by leveraging vector embeddings and semantic understanding to retrieve the most relevant documents.

