### Installation of dependency not built-in Google Colab

Byaldi==0.0.7

In [None]:
!pip install Byaldi

In [None]:
!apt-get install -y poppler-utils

In [None]:
from openai import OpenAI
import base64

# Initialiser le client OpenAI
client = OpenAI(
    api_key="JpQAceF80Htu21tCbZx8eZGHwye2UP2V",
    base_url="https://llm.intellisphere.fr:9081/v1"
)

model_name = client.models.list().data[0].id
print(f"[image_query] Modèle utilisé : {model_name}")

def query_image_base64(img_base64: str, question: str) -> str:
    try:
        # Construire le message
        messages = [
            {
                "role": "user",
                "content": [
                    {"type": "text", "text": question},
                    {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{img_base64}"}}
                ]
            }
        ]

        # Faire la requête
        response = client.chat.completions.create(
            model=model_name,
            messages=messages,
            max_tokens=200
        )

        return response.choices[0].message.content

    except Exception as e:
        return f"Erreur lors de la requête image+texte : {e}"

In [None]:
import os
from pathlib import Path
from byaldi import RAGMultiModalModel
from pdf2image import convert_from_path

# Définir les chemins
model_name = "vidore/colqwen2-v0.1"
local_model_dir = Path("./models") / model_name.replace("/", "_")
index_name = "onisr_index"

pdf_path = Path("./content/pdf_folder/repport2024.pdf")
images_dir = Path("./content/images")

# Créer les répertoires si nécessaire
local_model_dir.mkdir(parents=True, exist_ok=True)
images_dir.mkdir(parents=True, exist_ok=True)


# 1. Charger ou télécharger le modèle
if local_model_dir.exists() and any(local_model_dir.iterdir()):
    print(f"Chargement du modèle local depuis {local_model_dir}")
    model = RAGMultiModalModel.from_pretrained(str(local_model_dir))
else:
    print(f"Téléchargement du modèle {model_name}")
    model = RAGMultiModalModel.from_pretrained(model_name)
    print(dir(model))

# 2. Vérifier si l'index existe déjà
index_path = Path(f"./{index_name}")
if index_path.exists():
    print(f"Chargement de l'index existant depuis {index_path}")
    model.load_index(index_name=index_name, index_path=str(index_path))
else:
    print(f"Création d'un nouvel index pour {pdf_path}")
    model.index(input_path=pdf_path,
                index_name=index_name,
                store_collection_with_index=True,
                overwrite=True)

# 3. Convertir le PDF en images une seule fois
if not any(images_dir.iterdir()):
    print(f"Conversion du PDF en images et sauvegarde dans {images_dir}")
    images = convert_from_path(pdf_path)
    for i, image in enumerate(images):
        image.save(images_dir / f"page_{i+1}.png", "PNG")
else:
    print(f"Images déjà présentes dans {images_dir}, chargement direct")

# Requête de recherche
query = "Quelle est le sexe qui fait le plus d'accident ?"
results = model.search(query, k=1)

print(f"Résultats de la recherche pour '{query}':")
for result in results:
    print(f"Doc ID: {result.doc_id}, Page: {result.page_num}, Score: {result.score}")

# Charger l'image de la page retournée
page_num = model.search(query, k=1)[0].page_num
image_path = images_dir / f"page_{page_num}.png"

# Lire l'image en base64
with open(image_path, "rb") as image_file:
    import base64
    returned_page = base64.b64encode(image_file.read()).decode('utf-8')

response = query_image_base64(returned_page, query)
print("Réponse image + texte :")
print(response)

### Push request sur GitHub

In [None]:
# 📌 Informations :
GITHUB_TOKEN = "###"  # 🔐 GitHub Token
GITHUB_USERNAME = "SullyvanCOULON"             # GitHub Username
REPO_NAME = "ProjectE4"                        # Nom du repo
BRANCH_NAME = "main"                           # Branche cible
TARGET_PATH = "RAG/ColabRAG.ipynb"             # Chemin souhaité dans le repo
COMMIT_MESSAGE = "Créé à l'aide de Colab — Modification pour intégrer 'AccesLLM', erreur Request timed out"

# 📁 Nom du fichier local (le notebook actuel)
import os
local_nb = "ColabRAG.ipynb"
from IPython.display import display, Javascript

# 🔄 Sauvegarde le notebook actuel localement
display(Javascript('IPython.notebook.save_checkpoint();'))

# ⏳ Attente que la sauvegarde soit faite
import time
time.sleep(3)

# 📥 Installer Git si besoin
!apt-get install git -y

# 🛠️ Configurer Git
!git config --global user.email "sullyvancoulon@icloud.com"
!git config --global user.name "{GITHUB_USERNAME}"

# 📦 Cloner le dépôt avec authentification
repo_url = f"https://{GITHUB_USERNAME}:{GITHUB_TOKEN}@github.com/{GITHUB_USERNAME}/{REPO_NAME}.git"
!rm -rf {REPO_NAME}
!git clone --branch {BRANCH_NAME} {repo_url}

# 📤 Copier le notebook dans le dossier cible
import shutil
shutil.copy(local_nb, f"{REPO_NAME}/{TARGET_PATH}")

# 💾 Commit et push
%cd {REPO_NAME}
!git add {TARGET_PATH}
!git commit -m "{COMMIT_MESSAGE}"
!git push origin {BRANCH_NAME}