# Web Search APIs

[![Index](https://img.shields.io/badge/Index-blue)](../index.ipynb)
[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/digillia/Digillia-Colab/blob/main/tools/web_search.ipynb)

Various web search APIs to use with AI agents.

## Installation des SDKs

In [1]:
import os
import sys

# Supprimer les commentaires pour installer
# !pip3 install -qU -r ../requirements.txt

# À installer dans tous les cas pour Google Colab et Github
if ('google.colab' in sys.modules) or ('CI' in os.environ):
    !pip3 install -qU duckduckgo-search
    !pip3 install -qU llama-index
    !pip3 install -qU tavily-python

## Chargement des clés API

In [5]:
if 'google.colab' in sys.modules:
  from google.colab import userdata
  brave_api_key = userdata.get('BRAVE_API_KEY')
  openai_api_key = userdata.get('OPENAI_API_KEY')
  serper_api_key = userdata.get('SERPER_API_KEY')
  tavily_api_key = userdata.get('TAVILY_API_KEY')
else:
  from dotenv import load_dotenv, find_dotenv
  _ = load_dotenv(find_dotenv()) # lire le fichier .env local
  brave_api_key = os.environ['BRAVE_API_KEY']
  openai_api_key = os.environ['OPENAI_API_KEY']
  serper_api_key  = os.environ['SERPER_API_KEY']
  tavily_api_key  = os.environ['TAVILY_API_KEY']

In [6]:
import pandas as pd

question = 'Qui est Napoléon Bonaparte ?'

## Brave

Docs:
- https://brave.com/search/api/
- https://python.langchain.com/docs/integrations/tools/brave_search/
- https://docs.llamaindex.ai/en/stable/api_reference/tools/brave_search/

In [10]:
import requests

url = "https://api.search.brave.com/res/v1/web/search"
headers = {
    "Accept": "application/json",
    "Accept-Encoding": "gzip",
    "X-Subscription-Token": brave_api_key,
}
params = { "q": question, "count": 5}
response = requests.get(url, headers=headers, params=params)
results = response.json().get("web", {}).get("results", [])
df = pd.DataFrame(results)
df

Unnamed: 0,title,url,is_source_local,is_source_both,description,page_age,profile,language,family_friendly,type,subtype,is_live,meta_url,age,thumbnail
0,Napoléon Ier — Wikipédia,https://fr.wikipedia.org/wiki/Napol%C3%A9on_Ier,False,False,"Ondoyé à domicile, il a pour nom de baptême Na...",2025-03-12T15:06:38,"{'name': 'Wikipedia', 'url': 'https://fr.wikip...",fr,True,search_result,generic,False,"{'scheme': 'https', 'netloc': 'fr.wikipedia.or...",1 week ago,
1,Qui est Napoléon Bonaparte,https://www.lemonde.fr/memorable/blog/napoleon,False,False,Qui était <strong>Napoléon</strong> <strong>Bo...,,"{'name': 'Le Monde', 'url': 'https://www.lemon...",fr,True,search_result,generic,False,"{'scheme': 'https', 'netloc': 'lemonde.fr', 'h...",,
2,"Biographie de Napoléon Bonaparte, du général à...",https://www.napoleon.org/enseignants/documents...,False,False,Le général Bonaparte au pont ... n’est pas qu’...,2024-08-22T09:26:57,"{'name': 'Napoleon', 'url': 'https://www.napol...",fr,True,search_result,article,False,"{'scheme': 'https', 'netloc': 'napoleon.org', ...","August 22, 2024",{'src': 'https://imgs.search.brave.com/fC86crJ...
3,"C’est qui, Napoléon Bonaparte ? - 1jour1actu.com",https://www.1jour1actu.com/culture/cest-qui-na...,False,False,Mercredi 22 novembre un film sur <strong>Napol...,2023-11-29T07:47:21,"{'name': '1jour1actu', 'url': 'https://www.1jo...",fr,True,search_result,article,False,"{'scheme': 'https', 'netloc': '1jour1actu.com'...","November 29, 2023",{'src': 'https://imgs.search.brave.com/XKsZer6...
4,Napoléon Ier | Château de Versailles,https://www.chateauversailles.fr/decouvrir/his...,False,False,"Officier d’artillerie en 1785, général en 1793...",2021-09-07T08:56:08,"{'name': 'Chateauversailles', 'url': 'https://...",fr,True,search_result,generic,False,"{'scheme': 'https', 'netloc': 'chateauversaill...","September 7, 2021",{'src': 'https://imgs.search.brave.com/G6Frkcu...


## DuckDuckGo

Docs:
- https://github.com/deedy5/duckduckgo_search
- https://python.langchain.com/docs/integrations/providers/duckduckgo_search/
- https://docs.llamaindex.ai/en/stable/api_reference/tools/duckduckgo/

In [None]:
from duckduckgo_search import DDGS

results = DDGS().text(question, max_results=5)
df = pd.DataFrame(results)
df

Unnamed: 0,title,href,body
0,Napoléon Ier — Wikipédia,https://fr.wikipedia.org/wiki/Napoléon_Ier,"Napoléon Bonaparte, né le 15 août 1769 à Ajacc..."
1,Napoléon : la biographie de l'empereur - L'Int...,https://www.linternaute.fr/actualite/biographi...,Biographie courte de Napoléon Bonaparte - Né l...
2,"Biographie de Napoléon Bonaparte, du général à...",https://www.napoleon.org/enseignants/documents...,"Devenu général en 1793, Napoléon Bonaparte est..."
3,"Napoléon Bonaparte, général et empereur des fr...",https://www.histoire-pour-tous.fr/histoire-de-...,Napoléon Bonaparte (1769-1821) a été un généra...
4,Napoléon Bonaparte - Encyclopédie de l'Histoir...,https://www.worldhistory.org/trans/fr/1-21844/...,Napoléon Bonaparte (1769-1821) était un généra...


## Serper

Docs:
- https://serper.dev/
- https://python.langchain.com/docs/integrations/providers/serpapi/

In [None]:
import requests
import json

url = "https://google.serper.dev/search"
headers = {
  "X-API-KEY": serper_api_key,
  "Content-Type": "application/json"
}
params = { "q": question, "num": 5 }
response = requests.request("POST", url, headers=headers, data=json.dumps(params))
df = pd.DataFrame(response.json()["organic"])
df


Unnamed: 0,title,link,snippet,sitelinks,position
0,Napoléon Ier - Wikipédia,https://fr.wikipedia.org/wiki/Napol%C3%A9on_Ier,"Napoléon Bonaparte, né le 15 août 1769 à Ajacc...","[{'title': 'Napoléon II', 'link': 'https://fr....",1
1,"Biographie de Napoléon Bonaparte, du général à...",https://www.napoleon.org/enseignants/documents...,Napoléon Bonaparte ? Un général toujours victo...,,2
2,Napoleon - Wikipedia,https://en.wikipedia.org/wiki/Napoleon,Napoleon Bonaparte later known by his regnal n...,"[{'title': 'Military career of Napoleon', 'lin...",3
3,"Napoléon, père de l'Empire - Le Monde",https://www.lemonde.fr/memorable/blog/napoleon,"Il est le fils d'un des frères de l'empereur, ...",,4


## Tavily

Docs:
- https://tavily.com/
- https://docs.tavily.com/documentation/
- https://python.langchain.com/docs/integrations/providers/tavily/
- https://docs.llamaindex.ai/en/stable/api_reference/tools/tavily_research/

In [None]:
from tavily import TavilyClient

response = TavilyClient(api_key=tavily_api_key).search(question)
df = pd.DataFrame(response['results'])
df

Unnamed: 0,title,url,content,score,raw_content
0,Napoléon Bonaparte - Encyclopédie de l'Histoir...,https://www.worldhistory.org/trans/fr/1-21844/...,Napoléon Bonaparte (1769-1821) était un généra...,0.944633,
1,"C'est qui, Napoléon Bonaparte - 1jour1actu.com",https://www.1jour1actu.com/culture/cest-qui-na...,Mercredi 22 novembre un film sur Napoléon est ...,0.910426,
2,1804-1815 > l'Empereur des Français Napoléon I...,https://www.napoleon.org/enseignants/documents...,"Napoléon Bonaparte est né en Corse, à Ajaccio,...",0.801641,
3,Napoléon : la biographie de l'empereur - L'Int...,https://www.linternaute.fr/actualite/biographi...,"A 35 ans, le premier Consul, le général Napolé...",0.790029,
4,Napoléon Ier — Wikipédia,https://fr.wikipedia.org/wiki/Napoléon_Ier,Bonaparte est alors contraint de quitter l'ass...,0.375112,


## Utilisation avec LlamaIndex

In [None]:
from tavily import AsyncTavilyClient

async def search_web(query: str) -> str:
    """Un outil de recherche internet pour répondre aux questions."""
    client = AsyncTavilyClient(api_key=tavily_api_key)
    return str(await client.search(query))

In [None]:
from llama_index.core.agent.workflow import AgentWorkflow
from llama_index.llms.openai import OpenAI

workflow = AgentWorkflow.from_tools_or_functions(
    [search_web],
    llm=OpenAI(model='gpt-4o-mini', api_key=openai_api_key),
    system_prompt='Tu es un assistant virtuel qui aide à répondre aux questions à partir de recherches sur internet.',
)

response = await workflow.run(user_msg=question)
print(str(response))

Napoléon Bonaparte, né le 15 août 1769 à Ajaccio en Corse et mort le 5 mai 1821 sur l'île de Sainte-Hélène, était un militaire et homme d'État français. Il est surtout connu pour avoir été l'empereur des Français et pour son rôle central dans les guerres napoléoniennes.

Voici quelques points clés sur sa vie et son impact :

1. **Ascension au pouvoir** : Napoléon a commencé sa carrière militaire pendant la Révolution française. Il a rapidement gravi les échelons grâce à ses talents stratégiques et à ses succès sur le champ de bataille.

2. **Coup d'État** : En 1799, il a réalisé un coup d'État qui lui a permis de prendre le pouvoir en tant que Premier Consul, puis il s'est couronné empereur en 1804.

3. **Réformes** : Napoléon a introduit de nombreuses réformes en France, notamment le Code civil (ou Code Napoléon), qui a influencé les systèmes juridiques de nombreux pays.

4. **Guerres napoléoniennes** : Il a mené plusieurs campagnes militaires à travers l'Europe, étendant l'influence 