In [None]:
!pip -q install -U \
  langgraph langchain langchain-core langchain-community langchain-text-splitters \ langchain_openai \ langchain-ollama \
  pypdf chromadb tiktoken python-multipart \
  huggingface-hub

In [None]:
import os
key = os.environ['OPENAI_API_KEY'] = ''

In [None]:
from google.colab import drive
drive.mount("/content/drive")

In [None]:
!nvidia-smi

In [None]:
import time
import subprocess
import shutil
import json
import re

!curl -fsSL https://ollama.com/install.sh | sh

p = subprocess.Popen(["ollama", "serve"], stdout=subprocess.DEVNULL, stderr=subprocess.STDOUT)
time.sleep(8)
print("Ollama server PID:", p.pid)

OLLAMA_HOST = "http://localhost:11434"

In [None]:
from huggingface_hub import hf_hub_download
import httpx
from pathlib import Path
from string import Template
from typing import Any, Dict, List, Tuple, Optional

MODEL_DIR = Path("/content/models/bielik26")
MODEL_DIR.mkdir(parents=True, exist_ok=True)

REPO_ID = "speakleash/Bielik-11B-v2.6-Instruct-GGUF"
GGUF_NAME = "Bielik-11B-v2.6-Instruct.Q4_K_M.gguf"

gguf_path = hf_hub_download(
    repo_id=REPO_ID,
    filename=GGUF_NAME,
    local_dir=str(MODEL_DIR),
)
print("Downloaded GGUF:", gguf_path)

modelfile_path = MODEL_DIR / "Bielik-tools.Modelfile"

modelfile_tpl = Template(r'''FROM ./$GGUF

TEMPLATE """<s>{{- if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{- end }}
{{- if .Tools }}<|start_header_id|>system<|end_header_id|>

You have access to the following tools:
{{ .Tools }}

When you need to call a tool, you MUST respond with ONLY this exact format:
<tool_call>
{"name": "function_name", "arguments": {"param": "value"}}
</tool_call>

Do not add any other text when calling a tool. After receiving tool results, provide your final answer.<|eot_id|>{{- end }}
{{- range .Messages }}
{{- if eq .Role "user" }}<|start_header_id|>user<|end_header_id|>

{{ .Content }}<|eot_id|>
{{- else if eq .Role "assistant" }}<|start_header_id|>assistant<|end_header_id|>

{{- if .ToolCalls }}
<tool_call>
{{- range .ToolCalls }}
{"name": "{{ .Function.Name }}", "arguments": {{ .Function.Arguments }}}
{{- end }}
</tool_call>
{{- else }}
{{ .Content }}
{{- end }}<|eot_id|>
{{- else if eq .Role "tool" }}<|start_header_id|>tool<|end_header_id|>

<tool_response>
{{ .Content }}
</tool_response><|eot_id|>
{{- end }}
{{- end }}<|start_header_id|>assistant<|end_header_id|>

"""

PARAMETER stop <|start_header_id|>
PARAMETER stop <|end_header_id|>
PARAMETER stop <|eot_id|>
PARAMETER temperature 0
''')

modelfile_path.write_text(modelfile_tpl.substitute(GGUF=GGUF_NAME), encoding="utf-8")
print("Wrote Modelfile:", str(modelfile_path))

!ls -lh /content/models/bielik26 | sed -n '1,60p'

# Create model
!cd /content/models/bielik26 && ollama create bielik-tools -f Bielik-tools.Modelfile

!ollama list
!ollama show bielik-tools | sed -n '1,220p'

model = "bielik-tools"

In [None]:
import shutil
from langchain_openai import OpenAIEmbeddings
from langchain_community.document_loaders import PyPDFLoader
from langchain_community.vectorstores import Chroma
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.tools import tool

emb = OpenAIEmbeddings()

BASE = "/content/drive/MyDrive"

CHROMA_BASE = "/content/chroma_fado"

REBUILD_INDEX = True
if REBUILD_INDEX:
    shutil.rmtree(CHROMA_BASE, ignore_errors=True)
os.makedirs(CHROMA_BASE, exist_ok=True)

def _build_retriever(
    pdf_path: str,
    collection_name: str,
    persist_dir: str,
    chunk_size: int = 1000,
    chunk_overlap: int = 40,
    k: int = 4,
    lambda_mult: float = 0.5,
    fetch_k: int = 10,
):
    loader = PyPDFLoader(pdf_path, extraction_mode="layout", extract_images=False)
    data = loader.load()
    splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
    docs = splitter.split_documents(data)

    vs = Chroma.from_documents(
        documents=docs,
        embedding=emb,
        collection_name=collection_name,
        persist_directory=persist_dir,
    )
    return vs.as_retriever(
        search_type="mmr",
        search_kwargs={"k": k, "lambda_mult": lambda_mult, "fetch_k": fetch_k},
    )

general_retriever = _build_retriever(
    f"{BASE}/Case_PRO_1.pdf",
    "fado_general",
    f"{CHROMA_BASE}/general",
    chunk_size=1000, chunk_overlap=40,
    k=2, lambda_mult=0.5, fetch_k=5,
)

operational_retriever = _build_retriever(
    f"{BASE}/Case_PRO_1.pdf",
    "fado_operational",
    f"{CHROMA_BASE}/operational",
    chunk_size=1000, chunk_overlap=40,
    k=2, lambda_mult=0.5, fetch_k=5,
)

financial_retriever = _build_retriever(
    f"{BASE}/9_Baby_AGI/Dane_finansowe.pdf",
    "fado_financial",
    f"{CHROMA_BASE}/financial",
    chunk_size=1000, chunk_overlap=40,
    k=5, lambda_mult=0.0, fetch_k=5,
)

marketing_retriever = _build_retriever(
    f"{BASE}/9_Baby_AGI/Dane_sprzedażowe_i_marketingowe.pdf",
    "fado_marketing",
    f"{CHROMA_BASE}/marketing",
    chunk_size=1000, chunk_overlap=100,
    k=5, lambda_mult=0.5, fetch_k=10,
)

@tool("general_retriever")
def general_retriever_tool(query: str) -> str:
    """Use this tool whenever someone asks for FADO in general."""
    docs = general_retriever.invoke(query)
    return "\n\n".join(
        f"[{d.metadata.get('source')} | p{d.metadata.get('page')}]\n{d.page_content}"
        for d in docs
    )

@tool("operational_retriever")
def operational_retriever_tool(query: str) -> str:
    """Use this tool whenever someone asks for FADO business processes."""
    docs = operational_retriever.invoke(query)
    return "\n\n".join(
        f"[{d.metadata.get('source')} | p{d.metadata.get('page')}]\n{d.page_content}"
        for d in docs
    )

@tool("financial_retriever")
def financial_retriever_tool(query: str) -> str:
    """Use this tool whenever someone asks for FADO financial situation (including statements)."""
    docs = financial_retriever.invoke(query)
    return "\n\n".join(
        f"[{d.metadata.get('source')} | p{d.metadata.get('page')}]\n{d.page_content}"
        for d in docs
    )

@tool("marketing_retriever")
def marketing_retriever_tool(query: str) -> str:
    """Use this tool whenever someone asks for FADO products, sales, marketing and margins."""
    docs = marketing_retriever.invoke(query)
    return "\n\n".join(
        f"[{d.metadata.get('source')} | p{d.metadata.get('page')}]\n{d.page_content}"
        for d in docs
    )

In [None]:
from langchain_ollama import ChatOllama
from langchain.agents import create_agent
from langgraph.checkpoint.memory import InMemorySaver

OLLAMA_HOST = "http://localhost:11434"
MODEL_NAME = "bielik-tools"

llm = ChatOllama(
    model=MODEL_NAME,
    base_url=OLLAMA_HOST,
    temperature=0,
)

SYSTEM_PROMPT = """Jesteś asystentem pracującym na dokumentach firmy FADO.

Cel:
- Odpowiadaj po polsku, rzeczowo i na temat.
- Opieraj się na informacjach z narzędzi (retrieverów) i treści rozmowy.
- Jeśli brakuje danych w kontekście: NAJPIERW użyj narzędzia, dopiero potem odpowiadaj.

Dobór narzędzia:
- general_retriever: ogólne informacje o FADO / przekrojowe pytania
- operational_retriever: procesy, operacje, sposób działania
- financial_retriever: finanse, wyniki, wskaźniki, rachunki
- marketing_retriever: produkty, sprzedaż, marketing, marże

Zasady jakości:
- Nie zgaduj liczb ani faktów. Jeśli nie ma ich w wynikach narzędzi, powiedz wprost czego brakuje.
- Gdy wyniki są niejednoznaczne, podaj 2–3 możliwe interpretacje i wskaż co trzeba doprecyzować.
- Preferuj krótkie punkty + krótkie podsumowanie.
- Nie ujawniaj rozumowania krok-po-kroku ani “przemyśleń”. Pokaż tylko wynik.

Źródła:
- Zawsze podwaj źródło informacji na podstwiw którego formuujesz odpowidz (1. odpowiedzi na bazie contekstu narzędza lub 2. odwpowiedzna bazie wiedzy moelu) !!!

Proces przygotowania odpowiedzi (WEWNĘTRZNY – nie wypisuj kroków):
1) Wygeneruj wstępny szkic odpowiedzi.
2) Zrób krótką refleksję: czy odpowiedź jest kompletna i czy każde zdanie wynika z wyników narzędzi lub kontekstu rozmowy?
   - Jeśli coś jest domysłem albo nie wynika z danych: usuń to lub jasno powiedz „brak danych”.
3) Jeśli można poprawić precyzję: doprecyzuj, ale wyłącznie na podstawie wyników narzędzi i kontekstu rozmowy.
4) Zredaguj odpowiedź końcową.
5) Wypisz WYŁĄCZNIE odpowiedź końcową (bez kroków, bez metakomentarzy, bez „myślenia na głos”).
"""


checkpointer = InMemorySaver()

tools = [
    general_retriever_tool,
    operational_retriever_tool,
    financial_retriever_tool,
    marketing_retriever_tool,
]

agent = create_agent(
    model=llm,
    tools=tools,
    system_prompt=SYSTEM_PROMPT,
    checkpointer=checkpointer,
)

In [None]:
config = {"configurable": {"thread_id": "fado-session-1"}}

result = agent.invoke({"messages": [("user", "Jak działa FADO?")]}, config)
print(result["messages"])
print(result["messages"][-1].content)

In [None]:
config = {"configurable": {"thread_id": "fado-session-2"}}

r1 = agent.invoke({"messages": [{"role": "user", "content": "Na jakich rynkach działa FADO?"}]}, config)
print(r1["messages"][-1].content)

r2 = agent.invoke({"messages": [{"role": "user", "content": "Przyponij o co pyatłem poprzednio?"}]}, config)
print(r2["messages"][-1].content)

In [None]:
from typing import List, Any
from pydantic import BaseModel, Field
from langchain_core.messages import SystemMessage, HumanMessage, ToolMessage

class ProcessGroup(BaseModel):
    kategoria: str = Field(description="Np. Sprzedaż, Operacje, Obsługa klienta, Finanse, IT")
    procesy: List[str] = Field(description="Lista procesów w tej kategorii")

class FadoProcesses(BaseModel):
    grupy: List[ProcessGroup]
    braki_danych: List[str] = Field(default_factory=list, description="Co jest nieznane / czego brakuje w dokumentach")

tools = [
    general_retriever_tool,
    operational_retriever_tool,
    financial_retriever_tool,
    marketing_retriever_tool,
]

llm_with_tools = llm.bind_tools(tools)

tool_map = {getattr(t, "name", t.__class__.__name__): t for t in tools}

def _stringify_tool_output(out: Any) -> str:
    """Zamienia różne typy zwrotek (Documents/list/dict/str) na czytelny tekst."""
    if out is None:
        return ""
    if isinstance(out, list):
        parts = []
        for x in out:
            page = getattr(x, "page_content", None)
            if page is not None:
                parts.append(str(page))
            else:
                parts.append(str(x))
        return "\n\n".join([p for p in parts if p.strip()]).strip()
    return str(out).strip()

EXTRACTION_SYSTEM = """Jesteś asystentem pracującym na dokumentach firmy FADO.

Zasady:
- Jeśli brakuje danych w rozmowie, użyj narzędzi (retrieverów).
- Wykonaj ekstrakcję informacji o procesach biznesowych FADO.
- NIE twórz listy procesów z wiedzy ogólnej. Jeśli czegoś nie ma w wynikach narzędzi, to tego nie dopisuj.
- Możesz użyć wielu narzędzi, jeśli potrzeba.
- Na tym etapie Twoim celem jest ZEBRANIE materiału z narzędzi (tool calls), nie format końcowy.
"""

EXTRACTION_USER = (
    "Zbierz z dokumentów FADO informacje o procesach biznesowych i ich podziale na kategorie "
    "(np. Sprzedaż, Operacje, Obsługa klienta, Finanse, IT). "
    "Jeśli nie masz danych w kontekście rozmowy, wywołaj odpowiednie narzędzia."
)

messages = [
    SystemMessage(content=EXTRACTION_SYSTEM),
    HumanMessage(content=EXTRACTION_USER),
]

for _ in range(3):
    ai = llm_with_tools.invoke(messages)
    messages.append(ai)

    tool_calls = getattr(ai, "tool_calls", None) or []
    if not tool_calls:
        break

    for tc in tool_calls:
        name = tc.get("name")
        args = tc.get("args") or tc.get("arguments") or {}
        tc_id = tc.get("id")

        tool = tool_map.get(name)
        if tool is None:
            messages.append(
                ToolMessage(content=f"Nieznane narzędzie: {name}", tool_call_id=tc_id)
            )
            continue

        try:
            out = tool.invoke(args)
            out_text = _stringify_tool_output(out)
        except Exception as e:
            out_text = f"Błąd wywołania narzędzia {name}: {e}"

        messages.append(ToolMessage(content=out_text, tool_call_id=tc_id))


tool_context = "\n\n".join(
    [m.content for m in messages if isinstance(m, ToolMessage) and m.content.strip()]
).strip()
print("DEBUG - content z narzędzia", tool_context)

structured_llm = llm.with_structured_output(
    FadoProcesses,
    method="json_schema",
    include_raw=True,
)

STRUCTURE_SYSTEM = """Jesteś asystentem pracującym na dokumentach firmy FADO.

Zasady (twarde):
- Używaj WYŁĄCZNIE informacji z KONTEKSTU (wyniki narzędzi) oraz treści pytania.
- Nie dopowiadaj procesów ani faktów z wiedzy ogólnej.
- Jeśli w kontekście brakuje danych do pogrupowania procesów, wpisz to do braki_danych.
- Zwróć WYŁĄCZNIE JSON zgodny ze schematem (bez komentarzy).
"""

STRUCTURE_USER = f"""Pogrupuj procesy biznesowe FADO na kategorie i zwróć wynik zgodny ze schematem.
Jeśli nie masz danych w kontekście, wpisz je w braki_danych.

KONTEKST (wyniki narzędzi):
{tool_context if tool_context else "BRAK WYNIKÓW Z NARZĘDZI – nie ma danych do ekstrakcji."}
"""

response = structured_llm.invoke([
    SystemMessage(content=STRUCTURE_SYSTEM),
    HumanMessage(content=STRUCTURE_USER),
])

print("\nPARSED:\n", response["parsed"])
print("\nRAW:\n", response["raw"].content)