## Un'introduzione operativa agli LLM
### Con accesso a un LLM locale attraverso un server di API

(Luca, febbraio 2024; ambiente virtuale locale; installato `openai`)

Al momento il sistema più semplice per eseguire sul proprio computer un LLM e accedere a esso attraverso una API è **LM Studio**:
* scaricare da https://lmstudio.ai e installare LM Studio
* eseguire LM Studio e seguendo le indicazioni nel programma:
    * scaricare dalla rete un LLM (per esempio **TheBloke mistral openorca 7B Q4_0 gguf**)
    * caricare il LLM
    * mettere in esecuzione il server

Occorre ora creare un ambiente di lavoro Python, supponiamo con **VSCode**:
* installare un interprete Python
* scaricare da https://code.visualstudio.com/download e installare VSCode
* eseguire VSCode e attivare le estensioni per Python e Jupyter
* ancora in VSCode:
    * creare una cartella di lavoro (per esempio chiamandola `intro`) e renderla la cartella corrente:  
    * creare un ambiente virtuale locale Python (Select Kernel | Python Environments | Create Python Environment):  
    * installare il modulo Python richiesto, eseguendo dal terminale:  
        `pip install openai`
    * copiare nella cartella questo notebook e il file `utils.py` e aprire il notebook

Per prima cosa, importiamo il modulo che contiene le funzioni per consentire un accesso "di alto livello" al LLM in esecuzione in LM Studio e quindi attiviamo la connessione al LLM.

In [1]:
from utils import llm
llm = llm()

A questo punto siamo già pronti per fare una domanda al LLM, ricevere e visualizzare la risposta.

In [2]:
prompt = "What are the main features of the Bayesian interpretation of probability? Please answer in one or two sentences."
answer = llm.request(prompt)
print(answer)

ChatCompletion(id='chatcmpl-xqyiemyz84k9ira6zjp2su', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="The main features of the Bayesian interpretation of probability include updating beliefs based on new evidence using Bayes' theorem, considering personal subjective probabilities, and representing uncertainty through the use of probability distributions for uncertain variables.", role='assistant', function_call=None, tool_calls=None))], created=1707581132, model='/home/lucamari/.local/share/nomic.ai/GPT4All/TheBloke/mistral-7b-openorca.Q4_0/mistral-7b-openorca.Q4_0.gguf', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=43, prompt_tokens=412, total_tokens=455))


La risposta non è molto leggibile, perché è un oggetto Python. Per curiosità, ne possiamo visualizzare il contenuto come un oggetto JSON.

In [6]:
from utils import jprint
jprint(answer)

{
  "id": "chatcmpl-xqyiemyz84k9ira6zjp2su",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "The main features of the Bayesian interpretation of probability include updating beliefs based on new evidence using Bayes' theorem, considering personal subjective probabilities, and representing uncertainty through the use of probability distributions for uncertain variables.",
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      }
    }
  ],
  "created": 1707581132,
  "model": "/home/lucamari/.local/share/nomic.ai/GPT4All/TheBloke/mistral-7b-openorca.Q4_0/mistral-7b-openorca.Q4_0.gguf",
  "object": "chat.completion",
  "system_fingerprint": null,
  "usage": {
    "completion_tokens": 43,
    "prompt_tokens": 412,
    "total_tokens": 455
  }
}


Per visualizzare solo il testo della risposta, usiamo la funzione `bprint` dal modulo `utils`.

In [7]:
from utils import bprint
bprint(answer)

The main features of the Bayesian interpretation of probability include updating beliefs based on
new evidence using Bayes' theorem, considering personal subjective probabilities, and representing
uncertainty through the use of probability distributions for uncertain variables.


Ancora meglio, possiamo attivare la funzione per visualizzare i token progressivamente, mano a mano che vengono generati.

In [8]:
from utils import aprint
aprint(llm.request(prompt, stream=True))

The main features of the Bayesian interpretation of probability involve updating beliefs about unknown
 quantities based on new evidence, representing subjective knowledge using a prior distribution, and incorpor
ating any information available to revise these beliefs through Bayes' theorem, leading to a posterior
 distribution that reflects updated knowledge.