## Un'introduzione operativa agli LLM
### Con accesso a un LLM locale attraverso un server di API

Luca Mari, febbraio 2024

[i file di questa attività: [base.ipynb](base.ipynb), [utils.py](utils.py)]

**Obiettivi**: comprendere la logica dell'accesso a un LLM attraverso una API.  
**Precompetenze**: basi di Python.

Al momento un sistema semplice per eseguire sul proprio computer un LLM e accedere a esso attraverso una API è LM Studio:
* scaricare da https://lmstudio.ai e installare LM Studio
* eseguire LM Studio e seguendo le indicazioni nel programma:
    * scaricare dalla rete un LLM (per esempio **TheBloke mistral openorca 7B Q4_0 gguf**)
    * caricare il LLM
    * mettere in esecuzione il server

Occorre ora creare un ambiente di lavoro Python, supponiamo con VSCode:
* installare un interprete Python
* scaricare da https://code.visualstudio.com/download e installare VSCode
* eseguire VSCode e attivare le estensioni per Python e Jupyter
* ancora in VSCode:
    * creare una cartella di lavoro e renderla la cartella corrente:  
    * copiare nella cartella questo notebook e il file `utils.py` e aprire il notebook
    * creare un ambiente virtuale locale Python (Select Kernel | Python Environments | Create Python Environment | Venv, e scegliere un interprete Python):  
    * installare il modulo Python richiesto, eseguendo dal terminale:  
        `pip install openai`

Per prima cosa, importiamo il modulo che contiene le funzioni per consentire un accesso "di alto livello" al LLM in esecuzione in LM Studio e quindi attiviamo la connessione al LLM.

In [1]:
from utils import llm
llm = llm()

A questo punto siamo già pronti per fare una domanda al LLM, ricevere e visualizzare la risposta.

In [2]:
prompt = "What are the main features of the Bayesian interpretation of probability? Please answer in one or two sentences."
answer = llm.request(prompt)
print(answer)

ChatCompletion(id='chatcmpl-xebugmlb63jbvn6udr8emc', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="The main features of the Bayesian interpretation of probability include its subjective nature, where personal beliefs and experiences affect judgments; it updates probabilities based on new information through Bayes' theorem; and it focuses on personal degrees of belief rather than frequentist occurrences in an infinite population or sample space.", role='assistant', function_call=None, tool_calls=None))], created=1707748761, model='/home/lucamari/.local/share/nomic.ai/GPT4All/TheBloke/mistral-7b-openorca.Q4_0/mistral-7b-openorca.Q4_0.gguf', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=62, prompt_tokens=62, total_tokens=124))


La risposta non è molto leggibile, perché è un oggetto Python. Per curiosità, ne possiamo visualizzare il contenuto come un oggetto JSON.

In [3]:
from utils import jprint
jprint(answer)

{
  "id": "chatcmpl-xebugmlb63jbvn6udr8emc",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "The main features of the Bayesian interpretation of probability include its subjective nature, where personal beliefs and experiences affect judgments; it updates probabilities based on new information through Bayes' theorem; and it focuses on personal degrees of belief rather than frequentist occurrences in an infinite population or sample space.",
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      }
    }
  ],
  "created": 1707748761,
  "model": "/home/lucamari/.local/share/nomic.ai/GPT4All/TheBloke/mistral-7b-openorca.Q4_0/mistral-7b-openorca.Q4_0.gguf",
  "object": "chat.completion",
  "system_fingerprint": null,
  "usage": {
    "completion_tokens": 62,
    "prompt_tokens": 62,
    "total_tokens": 124
  }
}


Per visualizzare solo il testo della risposta, usiamo la funzione `bprint` dal modulo `utils`.

In [4]:
from utils import bprint
bprint(answer)

The main features of the Bayesian interpretation of probability include its subjective nature, where
personal beliefs and experiences affect judgments; it updates probabilities based on new information
through Bayes' theorem; and it focuses on personal degrees of belief rather than frequentist
occurrences in an infinite population or sample space.


Ancora meglio, possiamo attivare la funzione per visualizzare i token progressivamente, mano a mano che vengono generati.

In [5]:
from utils import aprint
aprint(llm.request(prompt, stream=True))

The Bayesian interpretation of probability is a framework for updating beliefs about uncertain events
 using Bayes' theorem, allowing individuals to incorporate new information and evidence into their existing
 beliefs while accounting for the degree of confidence in those beliefs.