In [2]:
!curl -fsSL https://ollama.com/install.sh | sh

>>> Downloading ollama...
############################################################################################# 100.0%
>>> Installing ollama to /usr/local/bin...
>>> Adding ollama user to video group...
>>> Adding current user to ollama group...
>>> Creating ollama systemd service...
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.


In [3]:
!pip install langchain-community

Collecting langchain-community
  Downloading langchain_community-0.0.36-py3-none-any.whl (2.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.0/2.0 MB[0m [31m12.1 MB/s[0m eta [36m0:00:00[0m
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community)
  Downloading dataclasses_json-0.6.5-py3-none-any.whl (28 kB)
Collecting langchain-core<0.2.0,>=0.1.48 (from langchain-community)
  Downloading langchain_core-0.1.50-py3-none-any.whl (302 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m302.8/302.8 kB[0m [31m20.4 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langsmith<0.2.0,>=0.1.0 (from langchain-community)
  Downloading langsmith-0.1.54-py3-none-any.whl (116 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m116.7/116.7 kB[0m [31m16.1 MB/s[0m eta [36m0:00:00[0m
Collecting marshmallow<4.0.0,>=3.18.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading marshmallow-3.21.2-py3-none-any.whl (49 kB)


In [4]:
!pip install langchain_text_splitters

Collecting langchain_text_splitters
  Downloading langchain_text_splitters-0.0.1-py3-none-any.whl (21 kB)
Installing collected packages: langchain_text_splitters
Successfully installed langchain_text_splitters-0.0.1


In [5]:
!pip install pypdf

Collecting pypdf
  Downloading pypdf-4.2.0-py3-none-any.whl (290 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/290.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m [32m286.7/290.4 kB[0m [31m9.7 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m290.4/290.4 kB[0m [31m7.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: pypdf
Successfully installed pypdf-4.2.0


In [6]:
!pip install faiss-gpu

Collecting faiss-gpu
  Downloading faiss_gpu-1.7.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (85.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m85.5/85.5 MB[0m [31m9.8 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faiss-gpu
Successfully installed faiss-gpu-1.7.2


In [7]:
from langchain_community.chat_models import ChatOllama
from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

In [12]:
loader = PyPDFLoader("/content/GUIDE D’ASSURANCE DE LA PME.pdf")
documents = loader.load()
print("Le fichier a été uploadé")
text_splitter = CharacterTextSplitter(chunk_size=200, chunk_overlap=20)
texts = text_splitter.split_documents(documents)
print("Le fichier divisé en plusieurs sous documents")

Le fichier a été uploadé
Le fichier divisé en plusieurs sous documents


In [13]:
# Generate embeddings and initialize a retriever
embeddings = OllamaEmbeddings(model="znbang/bge:large-en-v1.5-f16", show_progress=True)
db = FAISS.from_documents(texts, embeddings)
retriever = db.as_retriever()

OllamaEmbeddings: 100%|██████████| 34/34 [00:07<00:00,  4.34it/s]


In [14]:
# Create a prompt template
template = """Répondez à la question uniquement sur la base du contexte suivant:

    {context}

    Question: {question}
    """
prompt = ChatPromptTemplate.from_template(template)

In [15]:
# Define the LLM and the full chain
model = ChatOllama(model="phi3", num_predict=2000)

def format_docs(docs):
    return "\n\n".join([d.page_content for d in docs])

chain = (
    {
        "context": retriever | format_docs,
        "question": RunnablePassthrough()
    }
    | prompt
    | model
    | StrOutputParser()
)


In [17]:
question= " De quoi parle ce livre ?  ? "
chain.invoke({"question": question})

OllamaEmbeddings: 100%|██████████| 1/1 [00:01<00:00,  1.88s/it]


"Ce guide d'assurance de la PME au Maroc, avec le concours de la Conférence des Nations Unies sur le Commerce et le Développement (UNCTAD), parle de l’ensemble des assurances obligatoires pour une entreprise en Maroc, notamment l'Assurance Maladie Obligatoire, l'Assurance Accidents du Travail et l'assurance automobile. Il fournit également un aperçu plus large sur les types d'assurances qui sont utiles aux entreprises, à côté des assurances obligatoires, pour couvrir différents risques spécifiques liés à leur activité."

In [18]:
question= " quels sont les produits assurance pour PME ?  ? "
chain.invoke({"question": question})

OllamaEmbeddings: 100%|██████████| 1/1 [00:02<00:00,  2.04s/it]


"Les produits d'assurance obligatoires pour une entreprise en France incluent l'Assurance Maladie Obligatoire (AMO) au profit des salariés, l'Assurance Accidents du Travail et l'Assurance Responsabilité Civile liée à la possession de véhicules terrestres à moteur. Pour les produits d'assurance pour PME qui ne sont pas obligatoires mais considérés comme utiles, il est conseillé de consulter le guide d'assurance de la PME au Maroc et autres ressources disponibles pour évaluer les risques spécifiques à votre entreprise."