In [75]:
from langchain.callbacks.manager import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain_community.llms import LlamaCpp

llama2_70b="/Users/macpro/.cache/lm-studio/models/TheBloke/Llama-2-70B-Chat-GGUF/llama-2-70b-chat.Q5_K_M.gguf"
sqlcoder_mistral="/Users/macpro/.cache/lm-studio/models/MaziyarPanahi/sqlcoder-7b-Mistral-7B-Instruct-v0.2-slerp-GGUF/sqlcoder-7b-Mistral-7B-Instruct-v0.2-slerp.Q8_0.gguf"
sqlcoder2="/Users/macpro/.cache/lm-studio/models/MaziyarPanahi/sqlcoder-7b-2-GGUF/sqlcoder-7b-2.Q8_0.gguf"
codellama_7b="/Users/macpro/.cache/lm-studio/models/TheBloke/CodeLlama-7B-Instruct-GGUF/codellama-7b-instruct.Q4_K_M.gguf"
codellama_70b="/Users/macpro/.cache/lm-studio/models/TheBloke/CodeLlama-70B-Instruct-GGUF/codellama-70b-instruct.Q5_K_M.gguf"

llm = LlamaCpp(
    model_path=sqlcoder_mistral,
    n_gpu_layers=-1,
    n_batch=512,
    n_ctx=10000,
    f16_kv=True,
    callback_manager=CallbackManager([StreamingStdOutCallbackHandler()]),
    verbose=False,
    #stop=[".\n\nQuestion"], # Stop generating just before the model would generate a new question
    repeat_penalty=1.3,
    temperature=0.0,
    max_tokens = 512
)

In [1]:
from accelerate import Accelerator
from langchain.llms import CTransformers

accelerator = Accelerator()

config = {'max_new_tokens': 512, 'repetition_penalty': 1.18, 'context_length': 5000, 'temperature':0, 'gpu_layers':50}
llm = CTransformers(
                    model="/Users/macpro/.cache/lm-studio/models/TheBloke/CodeLlama-70B-Instruct-GGUF/codellama-70b-instruct.Q5_K_M.gguf",
                    #model_file="codellama-7b-instruct.Q4_K_M.gguf",
                    gpu_layers=50,
                    config=config
                    )

llm, config = accelerator.prepare(llm, config)

In [76]:
import langchain

from langchain.utilities import SQLDatabase
from langchain_experimental.sql import SQLDatabaseChain

langchain.verbose = True 

pg_uri = f"clickhouse+http://tirocinio:#Tirocinio!2024@192.168.89.8:8123/chpv"

db = SQLDatabase.from_uri( pg_uri,
                           include_tables=['view_pv_tabellone'],
                           sample_rows_in_table_info=0
                         )

In [3]:
print(db.table_info)


CREATE TABLE view_pv_tabellone (
	cod_cli_for Int32, 
	data_doc Int32, 
	data_format_date Date, 
	cod_prod String, 
	fornitore Int32, 
	buyer String, 
	tipologia_prod String, 
	cat_sta String, 
	cod_prom_cdap String, 
	val_off Float64, 
	val_non_off Float64, 
	qta_offerta Float64, 
	qta_non_offerta Float64, 
	qta_volantino Float64, 
	val_volantino Float64, 
	val_tot_t_a_tca Float64, 
	val_tot_s_s_tca Float64, 
	val_tot_li_co_t_li Float64, 
	importo_cessione_off Float64, 
	importo_cessione_no_off Float64, 
	costo_commerciale_off Float64, 
	costo_commerciale_no_off Float64, 
	costo_nettissimo_off Float64, 
	costo_nettissimo_no_off Float64, 
	prezzo_al_pubblico_off Float64, 
	prezzo_al_pubblico_no_off Float64, 
	importo_pfa_off Float64, 
	importo_pfa_no_off Float64, 
	importo_ribaltato_off Float64, 
	importo_ribaltato_no_off Float64, 
	costo05_off Float64, 
	costo05_no_off Float64, 
	costo06_off Float64, 
	costo06_no_off Float64, 
	costo07_off Float64, 
	costo07_no_off Float64, 
	costo08

In [53]:
db.run("SELECT COUNT(*) from view_pv_tabellone where cod_prod = '000249036' and rag_soc = 'SUPERSTORE 05'")

'[(327,)]'

# *CUSTOM PROMPT*

In [22]:
custom_table_info='''
CREATE TABLE view_pv_tabellone (
    cod_cli_for Int32,
    rag_soc String,
    cat_cli String,
    descr_cat String,    
    data_doc Int32,
    data_format_date DATE,
    cod_prod String,
    descr_prod String,
    liv1 String,
    descr_liv1 String,
    tipologia_prod String,
    qta_offerta Float64,
    qta_non_offerta Float64,
    val_off Float64,
    val_non_off Float64,
    costo_nettissimo_off Float64,
    costo_nettissimo_no_off Float64
) ENGINE = MergeTree()
 PARTITION BY anno
 ORDER BY (data_format_date, cod_cli_for, cod_prod)
 PRIMARY KEY (data_format_date, cod_cli_for, cod_prod)


/*
3 rows from view_pv_tabellone table:
cod_cli_for	rag_soc cat_cli     descr_cat   data_doc  data_format_date cod_prod descr_prod   liv1 descr_liv1 tipologia_prod qta_offerta qta_non_offerta val_off val_non_off costo_nettissimo_off costo_nettissimo_no_off
99300	SUPERSTORE 01	SSDE	SUPERSTORE	20200102	2020-01-02	000249036	630942000   PARMAREG.L'ABC MERENDA IVA 10%	03	Fresh	NO	0.0	4.0	0.0	2.5090909090909093	0.0	0.0
99300	SUPERSTORE 01	SSDE	SUPERSTORE	20200102	2020-01-02	000249037	730942000   PARMAREG.L'ABC MERENDA IVA 22%	03	Fresh	NO	0.0	4.0	0.0	1.3442622950819672	0.0	0.0
99300	SUPERSTORE 01	SSDE	SUPERSTORE	20200102	2020-01-02	005068383	383860500   CALZ.TREND SPORT BICOLORE 2NNN	B1	Textile and Clothing	NO	0.0	1.0	0.0	2.8688524590163933	0.0	1.5017385
*/
'''

In [69]:
cda_prompt='''

You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most {top_k} results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which column is in which table.

The table you will run SQL queries on is a table that contains stores, store products, categories, departments, quantity sold, sales value, etc. 
The various elements (stores, categories, products, departments) have both a code and a description. The user will often refer to the description, in some cases he may refer to the code; in both cases their value will be enclosed in single quotes (') or in double quotes ('').
When the user refers to the description of an element (so there will be a string in double quotes or quotes) pay attention to use the ILIKE operator for a case-insensitive search.

I soli campi che dovrai usare sono:
cod_cli_for (codice punto vendita)
rag_soc (descrizione punto vendita)
cat_cli (codice categoria cliente)
descr_cat (descrizione categoria cliente)
data_doc (data in formato YYYYMMDD)
data_format_date (data in formato Date)
cod_prod (codice prodotto)
descr_prod   (descrizione prodotto)
liv1 (codice reparto)
descr_liv1 (descrizione reparto)
tipologia_prod (tipologia prodotto)
qta_offerta (quantità venduta in offerta)
qta_non_offerta (quantità venduta non in offerta)
val_off (valore venduto in offerta)
val_non_off (valore venduto non in offerta)
costo_nettissimo_off (costo del venduto in offerta)
costo_nettissimo_no_off (costo del venduto non in offerta)



Use the following format:

Question: "Question here"
SQLQuery: "SQL Query to run"
SQLResult: "Result of the SQLQuery"
Answer: "Final answer here"

Only use the following tables:
{table_info}

Question: {input}
'''

In [94]:
#PROVA PROMPT TUTTO IN ITALIANO

cda_ita_prompt='''

Sei un esperto di ClickHouse. Data una domanda in input, crea prima una query ClickHouse sintatticamente corretta da eseguire, quindi guarda i risultati della query e restituisci la risposta in lingua italiana alla domanda in input.
A meno che l'utente non specifichi nella domanda un numero specifico di esempi da ottenere, cerca al massimo {top_k} risultati utilizzando la clausola LIMIT come da ClickHouse. È possibile ordinare i risultati in modo che restituiscano i dati più informativi nel database.
Non eseguire mai query su tutte le colonne di una tabella. È necessario interrogare solo le colonne necessarie per rispondere alla domanda. Racchiudi ogni nome di colonna tra virgolette doppie (") per indicarli come identificatori delimitati.
Fai attenzione a utilizzare solo i nomi delle colonne che puoi vedere nelle tabelle seguenti. Fare attenzione a non eseguire query su colonne che non esistono. Inoltre, presta attenzione a quale colonna si trova in quale tabella.

La tabella su cui eseguirai le query SQL è una tabella che contiene i prodotti venduti da vari punti vendita, con le varie categorie, reparti, quantità venduta, valore delle vendite, ecc.
I vari elementi (punti vendita, categorie, prodotti, reparti) hanno sia un codice che una descrizione. L'utente farà spesso riferimento alla descrizione, in alcuni casi potrà fare riferimento al codice; in entrambi i casi il loro valore sarà racchiuso tra virgolette singole (') o tra virgolette doppie ('').

Quando la domanda contiene la frase 'punto vendita', assicurati di utilizzare esclusivamente il campo 'rag_soc' per la generazione della query usando l'operatore ILIKE con il simbolo '%' (rag_soc ILIKE '%nome_punto_vendita%').

Quando la domanda contiene parole racchiuse tra virgolette singole ('), utilizzare l'operatore ILIKE con il simbolo '%' per trovare corrispondenze senza distinzione tra maiuscole e minuscole.
Quando devi fare una COUNT di un qualche prodotto, fai attenzione a usare la DISTINCT perchè in ogni punto vendita ci sono più prodotti con lo stesso codice prodotto (cod_prod); questo perchè la tabella tiene conto dello storico dei prodotti venduti di tutti i giorni.Quindi usare COUNT(DISTINCT cod_prod).
Per esempio se la domanda è "Quanti prodotti ha venduto il punto vendita 'superstore 01' nel mese di Gennaio 2021?" , la corrispondente query SQL è "SELECT COUNT(DISTINCT cod_prod) AS quantita_prodotti_venduti FROM view_pv_tabellone WHERE rag_soc ILIKE '%superstore 01%' AND data_doc >= 20210101 AND data_doc <= 20210131".

I soli campi che dovrai usare sono:
cod_cli_for (codice punto vendita)
rag_soc (punto vendita)
cat_cli (codice categoria punto vendita)
descr_cat (descrizione categoria punto vendita)
data_doc (data in formato AAAAMMGG)
data_format_date (data in formato Date)
cod_prod (codice prodotto)
descr_prod   (descrizione prodotto)
liv1 (codice reparto)
descr_liv1 (descrizione reparto)
tipologia_prod (tipologia prodotto)
qta_offerta (quantità venduta in offerta)
qta_non_offerta (quantità venduta non in offerta)
val_off (valore venduto in offerta)
val_non_off (valore venduto non in offerta)
costo_nettissimo_off (costo del venduto in offerta)
costo_nettissimo_no_off (costo del venduto non in offerta)



Utilizza il seguente formato:

Domanda: "Domanda qui"
SQLQuery: "Query SQL da eseguire"
SQLResult: "Risultato della SQLQuery"
Risposta: "Risposta finale qui"

Utilizzare solo le seguenti tabelle:
{table_info}

Domanda: {input}
'''

In [95]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate(template=cda_ita_prompt, input_variables=["input","table_info","top_k"])

In [92]:
custom_chain = SQLDatabaseChain.from_llm(llm, db, prompt=prompt, use_query_checker=False,
                                        verbose=True, return_sql=False,)

# *TEST SQLCODER/MISTRAL INSTRUCT*

# *ZERO-SHOT PROMPT*

In [15]:
custom_chain.invoke("Quanti sono i prodotti con cod_prod='000249036' e rag_soc = 'SUPERSTORE 05'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti sono i prodotti con cod_prod='000249036' e rag_soc = 'SUPERSTORE 05'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m

You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': "Quanti sono i prodotti con cod_prod='000249036' e rag_soc = 'SUPERSTORE 05'?",
 'result': "Il numero di prodotti con cod_prod='000249036' e rag_soc = 'SUPERSTORE 05' è di 327."}

In [49]:
custom_chain.invoke("Quanti prodotti ci sono con cod_prod='000249036', rag_soc = 'SUPERSTORE 05' e data_doc=20211201?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ci sono con cod_prod='000249036', rag_soc = 'SUPERSTORE 05' e data_doc=20211201?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m

You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns

{'query': "Quanti prodotti ci sono con cod_prod='000249036', rag_soc = 'SUPERSTORE 05' e data_doc=20211201?",
 'result': "Il numero di prodotti che ci sono con cod_prod='000249036', rag_soc = 'SUPERSTORE 05' e data_doc=20211201 è pariamente uno (1)."}

# *ZEROSHOT PROMPT IN ITALIANO*

In [56]:
custom_chain.invoke("Quanti prodotti ci sono con codice prodotto '000249036', descrizione punto vendita 'SUPERSTORE 05' e data '20211201'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ci sono con codice prodotto '000249036', descrizione punto vendita 'SUPERSTORE 05' e data '20211201'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m

Sei un esperto di ClickHouse. Data una domanda in input, crea prima una query ClickHouse sintatticamente corretta da eseguire, quindi guarda i risultati della query e restituisci la risposta in lingua italiana alla domanda in input.
A meno che l'utente non specifichi nella domanda un numero specifico di esempi da ottenere, cerca al massimo 5 risultati utilizzando la clausola LIMIT come da ClickHouse. È possibile ordinare i risultati in modo che restituiscano i dati più informativi nel database.
Non eseguire mai query su tutte le colonne di una tabella. È necessario interrogare solo le colonne necessarie per rispondere alla domanda. Racchiudi ogni nome di colonna tra virgolette doppie (") per indicarli come identificatori delimita

{'query': "Quanti prodotti ci sono con codice prodotto '000249036', descrizione punto vendita 'SUPERSTORE 05' e data '20211201'?",
 'result': 'Il numero di prodotti che soddisfano le condizioni richieste è uno.'}

In [96]:
custom_chain.invoke("Quanti prodotti ha venduto il punto vendita 'superstore 01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ha venduto il punto vendita 'superstore 01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m

Sei un esperto di ClickHouse. Data una domanda in input, crea prima una query ClickHouse sintatticamente corretta da eseguire, quindi guarda i risultati della query e restituisci la risposta in lingua italiana alla domanda in input.
A meno che l'utente non specifichi nella domanda un numero specifico di esempi da ottenere, cerca al massimo 5 risultati utilizzando la clausola LIMIT come da ClickHouse. È possibile ordinare i risultati in modo che restituiscano i dati più informativi nel database.
Non eseguire mai query su tutte le colonne di una tabella. È necessario interrogare solo le colonne necessarie per rispondere alla domanda. Racchiudi ogni nome di colonna tra virgolette doppie (") per indicarli come identificatori delimitati.
Fai attenzione a utilizzare solo i nomi delle colonne

{'query': "Quanti prodotti ha venduto il punto vendita 'superstore 01'?",
 'result': "Il punto vendita 'SUPERSTORE 01' ha venduto 4490779 prodotti."}

# *FEW-SHOT-PROMPT*

In [5]:
cda_fewshot_prompt_ita='''
Sei un esperto di PostgreSQL. Data una domanda in input, crea prima una query PostgreSQL sintatticamente corretta da eseguire, quindi guarda i risultati della query e restituisci la risposta in lingua italiana alla domanda in input.
A meno che l'utente non specifichi nella domanda un numero specifico di esempi da ottenere, cerca al massimo {top_k} risultati utilizzando la clausola LIMIT come da PostgreSQL. È possibile ordinare i risultati in modo che restituiscano i dati più informativi nel database.
Non eseguire mai query su tutte le colonne di una tabella. È necessario interrogare solo le colonne necessarie per rispondere alla domanda. Racchiudi ogni nome di colonna tra virgolette doppie (") per indicarli come identificatori delimitati.
Fai attenzione a utilizzare solo i nomi delle colonne che puoi vedere nelle tabelle seguenti. Fare attenzione a non eseguire query su colonne che non esistono. Inoltre, presta attenzione a quale colonna si trova in quale tabella. Quando nella domanda c'è una stringa tra apici (') fai attenzione a usare ILIKE.

Quando la domanda si riferisce a un punto vendita racchiuso tra virgolette singole (' '), utilizzare il campo 'rag_soc' e l'operatore ILIKE con il simbolo '%' per una ricerca case-insensitive nella query SQL generata.

La tabella su cui eseguirai le query SQL è una tabella che contiene i prodotti venduti da vari punti vendita, con le varie categorie, reparti, quantità venduta, valore delle vendite, ecc.
I vari elementi (punti vendita, categorie, prodotti, reparti) hanno sia un codice che una descrizione. L'utente farà spesso riferimento alla descrizione, in alcuni casi potrà fare riferimento al codice; in entrambi i casi il loro valore sarà racchiuso tra virgolette singole (') o tra virgolette doppie ('').

Quando la domanda contiene la frase 'punto vendita', assicurati di utilizzare esclusivamente il campo 'rag_soc' per la generazione della query e l'operatore LIKE con il simbolo '%' (rag_soc LIKE '%nome_punto_vendita%').

Quando devi fare una COUNT di un qualche prodotto, fai attenzione a usare la DISTINCT perchè in ogni punto vendita ci sono più prodotti con lo stesso codice prodotto (cod_prod); questo perchè la tabella tiene conto dello storico dei prodotti venduti di tutti i giorni. QUINDI USA COUNT(DISTINCT cod_prod).

I soli campi che dovrai usare sono:
cod_cli_for (codice punto vendita)
rag_soc (punto vendita)
cat_cli (codice categoria punto vendita)
descr_cat (descrizione categoria punto vendita)
data_doc (data in formato AAAAMMGG)
data_format_date (data in formato Date)
cod_prod (codice prodotto)
descr_prod   (descrizione prodotto)
liv1 (codice reparto)
descr_liv1 (descrizione reparto)
tipologia_prod (tipologia prodotto)
qta_offerta (quantità venduta in offerta)
qta_non_offerta (quantità venduta non in offerta)
val_off (valore venduto in offerta)
val_non_off (valore venduto non in offerta)
costo_nettissimo_off (costo del venduto in offerta)
costo_nettissimo_no_off (costo del venduto non in offerta)



Utilizza il seguente formato:

Domanda: "Domanda qui"
SQLQuery: "Query SQL da eseguire"
SQLResult: "Risultato della SQLQuery"
Risposta: "Risposta finale qui"

Di seguito sono riportati alcuni esempi di domande, le corrispondenti query SQL e la risposta finale.
'''

In [103]:
CUSTOM_SUFFIX ='''

Only use the following tables:
CREATE TABLE view_pv_tabellone (
    cod_cli_for Int32,
    rag_soc String,
    cat_cli String,
    descr_cat String,    
    data_doc Int32,
    data_format_date DATE,
    cod_prod String,
    descr_prod String,
    liv1 String,
    descr_liv1 String,
    tipologia_prod String,
    qta_offerta Float64,
    qta_non_offerta Float64,
    val_off Float64,
    val_non_off Float64,
    costo_nettissimo_off Float64,
    costo_nettissimo_no_off Float64
) ENGINE = MergeTree()

Question: {input}

'''

In [77]:
cda_fewshot_prompt='''
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most {top_k} results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which column is in which table.
The table on which you will run SQL queries is a table that contains the products sold by various outlets, with the various categories, departments, quantity sold, sales value, etc.
The various elements (stores, categories, products, departments) have both a code and a description. The user will often refer to the description, in some cases he may refer to the code; in both cases their value will be enclosed in single quotes (') or double quotes ('').

Preserve strings, numbers, and spaces in quotes in the question as they are in the generated SQL query; please pay attention to this.
(For example if question contains "punto vendita 'SUPERSTORE 01'" you have to write "rag_soc LIKE '%SUPERSTORE 01%' in the SQL query").

IGNORE "mese" field when generating the SQL query.

When the generated query doesn't provide any result, reply "Non ho trovato nessun prodotto con tale corrispondenza." as the final answer. So PAY ATTENTION to provide the final answer based on the SQL query result without inventing anything.

When assigning aliases to columns in SQL queries, write the name without enclose it in quotes and without spaces. For example, instead of writing 'column_name' AS 'alias name', use 'column_name' AS alias_name.

When the question involves searching or calculating a result based on a specific field such as sale point, department, or brand, ensure to include a GROUP BY clause to group the results by that field. This is necessary to aggregate the data correctly and obtain the desired outcome.

When the question refers to the quantity sold, be careful to calculate it with the formula "SUM(qta_offerta + qta_non_offerta)" in the generated SQL query ("qta_offerta" and "qta_non_offerta" are two fields of the table).
When the question refers to the sold value, be careful to calculate it with the formula "SUM(val_off + val_non_off)" in the generated SQL query ("val_off" and "val_non_off" are two fields in the table).
When the question refers to cost of goods sold, be careful to calculate it with the formula "SUM(costo_nettissimo_off + costo_nettissimo_no_off)" in the generated SQL query ("costo_nettissimo_off" and "costo_nettissimo_no_off" are two fields in the table).

When the question contains the word "margine", be careful to calculate its numeric value with the formula "SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off)", and its value in percentage (%) with the formula "SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off)" in the generated SQL query ("val_off" , "val_non_off", "costo_nettissimo_off" and "costo_nettissimo_no_off" are fields on the table).
When the question asks for margin, always calculate both its actual value and its percentage value using the formula provided.

When the question contains the phrase 'incidenza delle offerte', be careful to calculate it with the formula "SUM(val_off) / SUM(val_off + val_non_off)" in the generated SQL query ("val_off" and "val_non_off" are two fields in the table).

BE EXTREMELY CAREFUL TO USE ONE OF THE GIVEN FORMULAS TO CALCULATE THE VARIOUS VALUES WITHOUT INVENTING ONE.

When you use the "rag_soc" field ALWAYS use the LIKE operator in the generated SQL query. 
When you use the "descr_cat" field ALWAYS use the LIKE operator in the generated SQL query.

NEVER use 'data_doc' field and 'data_format_date' field with LIKE operator.

When the question refers to a sale point sign, use the 'descr_cat' field and the LIKE operator with the '%' symbol to match similar patterns in the generated SQL query.
When the question refers to the department of a sale point, use the 'descr_liv1' field and the LIKE operator with the '%' symbol to match similar patterns in the generated SQL query.
When the question refers to a sale point enclosed in single quotes (' '), use the 'rag_soc' field and the LIKE operator with the '%' symbol to match similar patterns in the generated SQL query to filter by name point of sale.

When the question refers to a date , use the data_doc field in YYYYMMDD format (data_doc= YYYYMMDD). For example data_doc = 20210215. Put the date in the generated query ONLY if specified.

When you have to do a COUNT of some product, be careful to use the DISTINCT operator because in each store there are multiple products with the same product code (cod_prod); this is because the table takes into account the history of products sold every day. Then use COUNT(DISTINCT cod_prod) for example.

When the question contains the word 'insegna', make sure to exclusively utilize the 'descr_cat' field for the query generation with the LIKE operator.

The only fields you will need to use are (there is a brief description in Italian in brackets):
cod_cli_for (codice punto vendita)
rag_soc (punto vendita)  ---> use LIKE operator for this field
cat_cli (codice categoria punto vendita)
descr_cat (insegna)
data_doc (data in formato AAAAMMGG)
data_format_date (data in formato Date)
cod_prod (codice prodotto)
descr_prod   (descrizione prodotto)
liv1 (codice reparto)
descr_liv1 (descrizione reparto)
tipologia_prod (tipologia prodotto)
qta_offerta (quantità venduta in offerta)
qta_non_offerta (quantità venduta non in offerta)
val_off (valore venduto in offerta)
val_non_off (valore venduto non in offerta)
costo_nettissimo_off (costo del venduto in offerta)
costo_nettissimo_no_off (costo del venduto non in offerta)

Use the following format:

Question: Question here
SQLQuery: SQL Query to run
SQLResult: Result of the SQLQuery
Answer: Final answer here

Below are a number of examples of questions, their corresponding SQL queries and the final answer.
'''

In [78]:
from langchain.prompts.prompt import PromptTemplate


examples = [

   {
        "input": "Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01' nel mese di Gennaio 2021?",
        "sql_cmd": "SELECT COUNT(DISTINCT cod_prod) AS quantita_prodotti_venduti FROM view_pv_tabellone WHERE rag_soc LIKE '%SUPERSTORE 01%' AND data_doc >= '20210101' AND data_doc <= '20210131';",
        "result": "[(15171, )]",
        "answer": '''Il punto vendita 'SUPERSTORE 01' ha venduto nel mese di Gennaio 2021 15.171 prodotti.'''
    },
   {
        "input": "Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 02'?",
        "sql_cmd": "SELECT COUNT(DISTINCT cod_prod) AS prodotti_venduti FROM view_pv_tabellone WHERE rag_soc LIKE '%SUPERSTORE 02%';",
        "result": "[(23227, )]",
        "answer": '''Il punto vendita 'superstore 02' ha venduto 23.227 prodotti.'''
    },
    {
        "input": "Quale punto vendita ha la maggior quantità venduta per punto vendita?",
        "sql_cmd": "SELECT rag_soc, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone GROUP BY rag_soc ORDER BY quantita_venduta DESC LIMIT 1;",
        "result": "[('SUPERSTORE 01', '20149100.846999988')]",
        "answer": '''Il punto vendita con la maggior quantità venduta è 'SUPERSTORE 01' e la quantità venduta è 20149100.846999988.'''
    },
    {
        "input": "Quale è la quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020?",
        "sql_cmd": "SELECT SUM(qta_offerta+qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE rag_soc LIKE '%SUPERMARKET 01%' AND data_doc = '20201231';",
        "result": "[('7627.214', )]",
        "answer": '''La quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020 è 7627.214.'''
    },
    {
        "input": "Elenca i primi 2 punti vendita con la minor quantità venduta per punto vendita",
        "sql_cmd": "SELECT rag_soc AS punto_vendita, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone GROUP BY rag_soc ORDER BY quantita_venduta ASC LIMIT 2;",
        "result": "[('SUPERMARKET 07', '1628323.6799999978'),('SUPERMARKET 13', '1876560.0540000023')]",
        "answer": '''Ecco i primi 2 punti vendita con la minor quantità venduta per punto vendita:
                     1)Punto vendita:SUPERMARKET 07 , Quantità venduta:1628323.6799999978.
                     2)Punto vendita:SUPERMARKET 13 , Quantità venduta:1876560.0540000023.'''
    },
    {
        "input": "Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel mese di Gennaio 2021",
        "sql_cmd": "SELECT rag_soc , SUM(val_off + val_non_off) as valore_venduto FROM view_pv_tabellone WHERE data_doc >= 20210101 AND data_doc <= 20210131 GROUP BY rag_soc ORDER BY valore_venduto DESC LIMIT 2;",
        "result": "[('SUPERSTORE 01', '1682122.2177758007'),('SUPERSTORE 04', '1617361.7323211778')]",
        "answer": '''Ecco i primi 2 punti vendita con il maggior valore venduto per punto vendita:
                     1)Punto vendita:SUPERSTORE 01 , Quantità venduta:1682122.2177758007.
                     2)Punto vendita:SUPERSTORE 04 , Quantità venduta:1617361.7323211778.'''
    },
    {
        "input": "Quale è il valore venduto del punto vendita 'IPERSTORE 01' nel mese di Gennaio 2020?",
        "sql_cmd": "SELECT SUM(val_off + val_non_off) as valore_venduto FROM view_pv_tabellone WHERE rag_soc LIKE '%IPERSTORE 01%' AND data_doc >= 20200101 AND data_doc <= 20200131;",
        "result": "[('1210787.3670404728', )]",
        "answer": '''Il valore venduto del punto vendita 'IPERSTORE 01' nel mese di Gennaio 2020 è 1210787.3670404728.'''
    },
    {
        "input": "Quale è il punto vendita con il maggior valore venduto per punto vendita in data 30 Gennaio 2021?",
        "sql_cmd": "SELECT rag_soc, SUM(val_off + val_non_off) as valore_venduto FROM view_pv_tabellone WHERE data_doc = 20210130 GROUP BY rag_soc ORDER BY valore_venduto DESC LIMIT 1;",
        "result": "[('IPERSTORE 03', '42854.56832975754')]",
        "answer": '''Il punto vendita con il maggior valore venduto in data 30 Gennaio 2021 è 'IPERSTORE 03' con un valore venduto di 42854.56832975754.'''
    },
    {
        "input": "Quale punto vendita ha il maggior costo del venduto per punto vendita nel 2021?",
        "sql_cmd": "SELECT rag_soc , sum(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE data_doc >= 20210101 AND data_doc <= 20211231 GROUP BY rag_soc ORDER BY costo_venduto DESC LIMIT 1;",
        "result": "[('SUPERSTORE 01', '14267935.810414173')]",
        "answer": '''Il punto vendita con il maggior costo del venduto nel 2021 è il punto vendita 'SUPERSTORE 01' e il costo del venduto è di 4267935.810414173.'''
    },
    {
        "input": "Quale punto vendita ha il minor costo del venduto per punto vendita nel 2020?",
        "sql_cmd": "SELECT rag_soc , sum(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20201231 GROUP BY rag_soc ORDER BY costo_venduto ASC LIMIT 1;",
        "result": "[('SUPERSTORE 01', '14267935.810414173')]",
        "answer": '''Il punto vendita con il minor costo del venduto nel 2021 è il punto vendita 'SUPERSTORE 01' e il costo del venduto è di 4267935.810414173.'''
    },
    {
        "input": "Quale insegna ha il minor costo del venduto per insegna nel 2020?",
        "sql_cmd": "SELECT descr_cat , SUM(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20201231 GROUP BY descr_cat ORDER BY costo_venduto ASC;",
        "result": "[('SUPERMARKET', '30400033.030205924')]",
        "answer": '''L'insegna con il minor costo del venduto per insegna nel 2020 è 'SUPERMARKET' e il costo del venduto è di 30400033.030205924.'''
    },
    {
        "input": "Elenca il costo del venduto per insegna nel mese di Gennaio 2020",
        "sql_cmd": "SELECT descr_cat AS insegna , SUM(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20200131 GROUP BY descr_cat ORDER BY costo_venduto DESC;",
        "result": "[('SUPERSTORE', '122716576.59607387'), ('IPERSTORE', '37516208.06436576'), ('SUPERMARKET', '30400033.030205924')]",
        "answer": '''Ecco i costi del venduto per insegna nel 2020:
                     1)Insegna:SUPERSTORE , Costo del venduto:122716576.59607387.
                     2)Insegna:IPERSTORE , Costo del venduto:37516208.06436576.
                     3)Insegna:SUPERMARKET , Costo del venduto:30400033.030205924.'''
    },
    {
        "input": "Elenca la quantità venduta per insegna nel mese di Gennaio 2020",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20200131 GROUP BY descr_cat ORDER BY quantita_venduta DESC;",
        "result": "[('SUPERSTORE', '122716576.59607387'), ('IPERSTORE', '37516208.06436576'), ('SUPERMARKET', '30400033.030205924')]",
        "answer": '''Ecco la quantità venduta per insegna:
                     1)Insegna:SUPERSTORE , Quantità venduta:122716576.59607387.
                     2)Insegna:IPERSTORE , Quantità venduta:37516208.06436576.
                     3)Insegna:SUPERMARKET , Quantità venduta:30400033.030205924.'''
    },
    {
        "input": "Quale insegna ha la maggior quantità venduta nel mese di Gennaio 2020?",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20200131 GROUP BY descr_cat ORDER BY quantita_venduta DESC;",
        "result": "[('SUPERSTORE', '122716576.59607387'), ('IPERSTORE', '37516208.06436576'), ('SUPERMARKET', '30400033.030205924')]",
        "answer": '''L'insegna 'SUPERSTORE' ha la maggior quantità venduta nel mese di Gennaio 2020 con una quantità venduta di 122716576.59607387.'''
    },
    {
        "input": "Elenca il valore venduto per insegna nel mese di Gennaio 2020",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE data_doc >= 20200101 AND data_doc <= 20200131 GROUP BY descr_cat ORDER BY valore_venduto DESC;",
        "result": "[('SUPERSTORE', '122716576.59607387'), ('IPERSTORE', '37516208.06436576'), ('SUPERMARKET', '30400033.030205924')]",
        "answer": '''Ecco il valore venduto per insegna nel mese di Gennaio 2020:
                     1)Insegna:SUPERSTORE , Valore venduto:122716576.59607387.
                     2)Insegna:IPERSTORE , Valore venduto:37516208.06436576.
                     3)Insegna:SUPERMARKET , Valore venduto:30400033.030205924.'''
    },
    {
        "input": "Quale insegna ha il maggior costo del venduto nel mese di Marzo 2020?",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE data_doc >= 20200301 AND data_doc <= 20200331 GROUP BY descr_cat ORDER BY costo_venduto DESC;",
        "result": "[('SUPERSTORE', '122716576.59607387'), ('IPERSTORE', '37516208.06436576'), ('SUPERMARKET', '30400033.030205924')]",
        "answer": '''L'insegna 'SUPERSTORE' ha il maggior costo del venduto nel mese di Marzo 2020 con una quantità venduta di 122716576.59607387.'''
    },
    {
        "input": "Quale insegna ha il minor valore venduto in data 11 Aprile 2021?",
        "sql_cmd": "SELECT descr_cat AS insegna , SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE data_doc = 20210411 GROUP BY descr_cat ORDER BY valore_venduto ASC LIMIT 1;",
        "result": "[('SUPERMARKET', '16427.257306218355')]",
        "answer": '''L'insegna 'SUPERMARKET' ha il minor valore venduto in data 11 Aprile 2021 con una valore venduto di 16427.257306218355.'''
    },
    {
        "input": "Quale è il valore venduto dell'insegna 'SUPERMARKET' in data 11 Dicembre 2021?",
        "sql_cmd": "SELECT SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE descr_cat LIKE '%SUPERMARKET%' AND data_doc = 20211211;",
        "result": "[('169254.83145215438')]",
        "answer": '''Il valore venduto dell'insegna 'SUPERMARKET' in data 11 Dicembre 2021 è di 169254.83145215438.'''
    },
    {
        "input": "Quale è l'insegna con la minor quantità venduta in data 2 Maggio 2020?",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE data_doc = 20200502 GROUP BY descr_cat ORDER BY quantita_venduta ASC LIMIT 1;",
        "result": "[('IPERSTORE', '82756.12499999994')]",
        "answer": '''L'insegna con la minor quantità venduta in data 2 Maggio 2020 è 'IPERSTORE' e la quantità venduta è di 82756.12499999994.'''
    },
    {
        "input": "Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020",
        "sql_cmd": "SELECT descr_liv1 AS reparto, SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE data_doc = 20201112 AND rag_soc LIKE '%SUPERSTORE 01%' GROUP BY descr_liv1 ORDER BY quantita_venduta DESC LIMIT 3;",
        "result": "[('Grocery', '6485.0'), ('Fresh', '4775.590000000006'), ('Beverages', '2836.0')]",
        "answer": '''Ecco  la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020:
                     1)Reparto:Grocery , Quantità venduta:6485.0.
                     2)Reparto:Fresh , Quantità venduta:4775.59.
                     3)Reparto:Beverages , Quantità venduta:2836.0.'''
    },
    {
        "input": "Quale è il reparto con la minor quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021?",
        "sql_cmd": "SELECT descr_liv1 AS reparto , SUM(qta_offerta + qta_non_offerta) AS quantita_venduta FROM view_pv_tabellone WHERE rag_soc LIKE '%IPERSTORE 02%' AND data_doc >= 20210601 AND data_doc <= 20210631 GROUP BY descr_liv1 ORDER BY quantita_venduta ASC LIMIT 1;",
        "result": "[('Others', '166.0')]",
        "answer": '''Il reparto con la minor quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021 è 'Others' e la quantità venduta è 166.'''
    },
    {
        "input": "Quale è il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02' in data 13 Gennaio 2021?",
        "sql_cmd": "SELECT SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE rag_soc LIKE '%SUPERSTORE 02%' AND data_doc = 20210113 AND descr_liv1 LIKE '%Grocery%';",
        "result": "[('10985.448747836863')]",
        "answer": '''Il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02' in data 13 Gennaio 2021.'''
    },
    {
        "input": "Quale è il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021?",
        "sql_cmd": "SELECT descr_liv1 AS reparto , SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE rag_soc LIKE '%IPERSTORE 02%' AND data_doc >= 20210601 AND data_doc <= 20210631 GROUP BY descr_liv1 ORDER BY valore_venduto DESC LIMIT 1;",
        "result": "[('Grocery', '288196.1625415588')]",
        "answer": '''Il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021 è 'Grocery' e il valore venduto è di '288196.1625415588'.'''
    },
    {
        "input": "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 01' in data 4 Gennaio 2020",
        "sql_cmd": "SELECT descr_liv1 AS reparto , SUM(val_off + val_non_off) AS valore_venduto FROM view_pv_tabellone WHERE rag_soc LIKE '%SUPERMARKET%01%' AND data_doc = 20200104 GROUP BY descr_liv1 ORDER BY valore_venduto DESC LIMIT 3;",
        "result": " [('Fresh', '12097.424661813593'), ('Grocery', '10945.976865484232'), ('Fruit and Vegetables', '4246.007757133577')]",
        "answer": '''Ecco il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 4 Gennaio 2020:
                     1)Reparto:Fresh , Valore venduto:12097.424661813593.
                     2)Reparto:Grocery , Valore venduto:10945.976865484232.
                     3)Reparto:Fruit and Vegetables , Valore venduto:4246.007757133577.'''
    },
    {
        "input": "Quale è il costo del venduto del reparto 'Fresh' del punto vendita 'IPERSTORE 03' in data 4 Luglio 2021?",
        "sql_cmd": "SELECT SUM(costo_nettissimo_off+costo_nettissimo_no_off) AS costo_venduto FROM view_pv_tabellone WHERE rag_soc LIKE '%IPERSTORE 03%' AND data_doc = 20210704 AND descr_liv1 LIKE '%Fresh%';",
        "result": "[('5692.604330378268')]",
        "answer": '''Il costo del venduto del reparto 'Fresh' del punto vendita 'IPERSTORE 03' in data 4 Luglio 2021 è 5692.604330378268.'''
    },
    {
        "input": "Elenca il margine per punto vendita dei primi 3 punti vendita nel mese di Dicembre 2021",
        "sql_cmd": "SELECT rag_soc , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc >= 20211201 AND data_doc <= 20211231 GROUP BY rag_soc ORDER BY margine DESC LIMIT 3;",
        "result": "[('SUPERSTORE 01', '797047.4521092057', '0.31549309135079445'), ('SUPERSTORE 04' '622730.7819912424', '0.32284551927512095'), ('IPERSTORE 01', '537157.895063902', '0.2825562576572131')]",
        "answer": '''Ecco il margine per punto vendita dei primi 3 punti vendita nel mese di Dicembre 2021:
                     1)Punto vendita:SUPERSTORE 01, Margine:797047.4521092057, Margine in percentuale:31,54%.
                     2)Punto vendita:SUPERSTORE 04, Margine:622730.7819912424, Margine in percentuale:32,28%.
                     3)Punto vendita:IPERSTORE 01, Margine:537157.895063902, Margine in percentuale:28,25%.'''
    },
    {
        "input": "Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020",
        "sql_cmd": "SELECT rag_soc , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc = 20200907 GROUP BY rag_soc ORDER BY margine DESC LIMIT 2;",
        "result": "[('SUPERSTORE 01', '15400.038950255586', '0.3381113508077541'), ('IPERSTORE 03' '12468.405150869175', '0.3409703844561733')]",
        "answer": '''Ecco il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020:
                     1)Punto vendita:SUPERSTORE 01, Margine:15400.038950255586, Margine in percentuale:33,81%.
                     2)Punto vendita:IPERSTORE 03, Margine:12468.405150869175, Margine in percentuale:34,09%.'''
    },
    {
        "input": "Quale è il punto vendita con il maggior margine per punto vendita in data 7 Settembre 2021?",
        "sql_cmd": "SELECT rag_soc , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc = 20210907 GROUP BY rag_soc ORDER BY margine DESC LIMIT 1;",
        "result": "[('SUPERSTORE 01', '19706.46311606039', '0.35928738793859044')]",
        "answer": '''Il punto vendita con il maggior margine per punto vendita in data 7 Settembre 2021 è il punto vendita 'SUPERSTORE 01', con margine 19706.46311606039 e margine in percentuale 35,92%.'''
    },
    {
        "input": "Quale è il margine del punto vendita 'IPERSTORE 03' in data 7 Settembre 2021?",
        "sql_cmd": "SELECT SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc = 20210907 AND rag_soc LIKE '%IPERSTORE 03%';",
        "result": "[('11537.523151947957', '0.3507536478832071')]",
        "answer": '''Il margine del punto vendita 'IPERSTORE 03' in data 7 Settembre 2021 è 11537.523151947957 e il margine in percentuale è 35,07%'''
    },
    {
        "input": "Elenca il margine per insegna di tutte le insegne in data 30 Gennaio 2020",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc = 20200130 GROUP BY insegna ORDER BY margine DESC;",
        "result": "[('SUPERSTORE', '112462.12621075862', '0.28479469300958865'), ('IPERSTORE' '33738.902300438946', '0.2929215850328978'), ('SUPERMARKET', '32943.536555229024', '0.2910049926241966')]",
        "answer": '''Ecco il margine per punto vendita dei primi 3 punti vendita in data 30 Gennaio 2020:
                     1)Insegna:SUPERSTORE, Margine:112462.12621075862, Margine in percentuale:28,47%.
                     2)Insegna:IPERSTORE, Margine:33738.902300438946, Margine in percentuale:29,29%.
                     3)Insegna:SUPERMARKET, Margine:32943.536555229024, Margine in percentuale:29,10%.'''
    },
    {
        "input": "Quale insegna ha il minor margine per insegna in data 30 Maggio 2020?",
        "sql_cmd": "SELECT descr_cat AS insegna, SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc = 20200530 GROUP BY insegna ORDER BY margine ASC LIMIT 1;",
        "result": "[('11537.523151947957', '0.3507536478832071')]",
        "answer": '''Il margine del punto vendita 'IPERSTORE 03' in data 7 Settembre 2021 è 11537.523151947957 e il margine in percentuale è 35,07%'''
    },
    {
        "input": "Elenca il margine per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 03' nel mese di Luglio 2020",
        "sql_cmd": "SELECT descr_liv1 AS reparto , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine, SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc >= 20200701 AND data_doc <= 20200731 AND rag_soc LIKE '%IPERSTORE 03%' GROUP BY descr_liv1 ORDER BY margine DESC LIMIT 3;",
        "result": "[('Fresh', '73068.36458870037', '0.33733753651831366'), ('Grocery' '69796.45618823804', '0.30222769568799535'), ('Fish', '38032.61325545446', '0.6374601009621605')]",
        "answer": '''Ecco il margine per reparto , dei primi 3 reparti , del punto vendita 'IPERSTORE 03' nel mese di Luglio 2020:
                     1)Reparto:Fresh, Margine:73068.36458870037, Margine in percentuale:33,73%.
                     2)Reparto:Grocery, Margine:69796.45618823804, Margine in percentuale:30,22%.
                     3)Reparto:Fish, Margine:38032.61325545446, Margine in percentuale:63,74%.'''
    },
    {
        "input": "Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021",
        "sql_cmd": "SELECT rag_soc AS punto_vendita , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210322 GROUP BY rag_soc ORDER BY incidenza_offerte DESC LIMIT 3;",
        "result": "[('SUPERMARKET 09', '0.42819371496018116'), ('SUPERMARKET 10' '0.4056609388324042'), ('SUPERMARKET 07', '0.3858596708109372')]",
        "answer": '''Ecco l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021:
                     1)Punto vendita:SUPERMARKET 09, Incidenza offerte:42,81%.
                     2)Punto vendita:SUPERMARKET 10, Incidenza offerte:40,56%.
                     3)Punto vendita:SUPERMARKET 07, Incidenza offerte:38,58%.'''
    },
    {
        "input": "Quale è l'incidenza delle offerte del punto vendita 'SUPERSTORE 11' in data 29 Aprile 2020?",
        "sql_cmd": "SELECT SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20200429 AND rag_soc LIKE '%SUPERSTORE 11%';",
        "result": "[('0.3491785193853042')]",
        "answer": '''L'incidenza delle offerte del punto vendita 'SUPERSTORE 11' in data 29 Aprile 2020 è del 34,91%'''
    },
    {
        "input": "Quale punto vendita ha la maggior incidenza delle offerte in data 3 Febbraio 2021",
        "sql_cmd": "SELECT rag_soc AS punto_vendita , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210203 GROUP BY rag_soc ORDER BY incidenza_offerte DESC LIMIT 1;",
        "result": "[('SUPERMARKET 09', '0.37855651084082753')]",
        "answer": '''Il punto vendita con la maggior incidenza delle offerte in data 3 Febbraio 2021 è il punto vendita 'SUPERMARKET 09' e l'incidenza delle offerte è 37,85%.'''
    },
    {
        "input": "Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 17 Settembre 2020?",
        "sql_cmd": "SELECT SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20200917 AND descr_cat LIKE '%SUPERSTORE%';",
        "result": "[(0.19891156626795162')]",
        "answer": '''L'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 17 Settembre 2020 è del 19,89%'''
    },
    {
        "input": "Elenca l'incidenza delle offerte per insegna di tutte le insegne in data 6 Dicembre 2020",
        "sql_cmd": "SELECT descr_cat , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20201206 GROUP BY descr_cat ORDER BY incidenza_offerte DESC;",
        "result": "[('SUPERSTORE', '0.33559998948799796'), ('IPERSTORE', '0.2827295970557721'), ('SUPERMARKET', '0.2761885210734631')]",
        "answer": '''Ecco il valore venduto per insegna nel mese di Gennaio 2020:
                     1)Insegna:SUPERSTORE , Incidenza offerte:33,55%.
                     2)Insegna:IPERSTORE , Incidenza offerte:28,27%.
                     3)Insegna:SUPERMARKET , Incidenza offerte:27,61%.'''
    },
    {
        "input": "Quale insegna ha la maggior incidenza delle offerte in data 14 Giugno 2021",
        "sql_cmd": "SELECT descr_cat AS insegna , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210614 GROUP BY descr_cat ORDER BY incidenza_offerte DESC LIMIT 1;",
        "result": "[('SUPERMARKET', '0.3097916534984438')]",
        "answer": '''L'insegna con la maggior incidenza delle offerte in data 14 Giugno 2021 è l'insegna 'SUPERMARKET' e l'incidenza delle offerte è 30,97%.'''
    },
    {
        "input": "Elenca  per insegna in data 6 Dicembre 2020",
        "sql_cmd": "SELECT descr_cat , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20201206 GROUP BY descr_cat ORDER BY incidenza_offerte DESC;",
        "result": "[('SUPERSTORE', '0.33559998948799796'), ('IPERSTORE', '0.2827295970557721'), ('SUPERMARKET', '0.2761885210734631')]",
        "answer": '''Ecco il valore venduto per insegna nel mese di Gennaio 2020:
                     1)Insegna:SUPERSTORE , Incidenza offerte:33,55%.
                     2)Insegna:IPERSTORE , Incidenza offerte:28,27%.
                     3)Insegna:SUPERMARKET , Incidenza offerte:27,61%.'''
    },

]


example_prompt = PromptTemplate(
    input_variables=["input", "sql_cmd", "result", "answer",],
    template="\nQuestion: {input}\nSQLQuery: {sql_cmd}\nSQLResult: {result}\nAnswer: {answer}",
)


# *NGRAM SELECTOR*

In [79]:
#NGRAM SELECTOR (seleziona gli esempi con che condividono sequenze di parole comuni (n-grammi) con l'input)

from langchain.prompts.example_selector import NGramOverlapExampleSelector

example_selector1 = NGramOverlapExampleSelector(
    # The examples it has available to choose from.
    examples=examples,
    # The PromptTemplate being used to format the examples.
    example_prompt=example_prompt,
    # The threshold, at which selector stops.
    # It is set to -1.0 by default.
    threshold=0.05,
)

# *SEMANTIC SIMILARITY*

In [154]:
#SEMANTIC SIMILARITY EXAMPLE SELECTOR

from langchain.prompts.example_selector import SemanticSimilarityExampleSelector
from langchain_community.vectorstores import Chroma
from langchain.embeddings import HuggingFaceEmbeddings

model_name="nickprock/sentence-bert-base-italian-xxl-uncased"

example_selector = SemanticSimilarityExampleSelector.from_examples(
    # This is the list of examples available to select from.
    examples,
    # This is the embedding class used to produce embeddings which are used to measure semantic similarity.
    HuggingFaceEmbeddings(model_name=model_name),
    # This is the VectorStore class that is used to store the embeddings and do a similarity search over.
    Chroma,
    # This is the number of examples to produce.
    k=4,
)

In [152]:
example_selector.vectorstore.delete_collection()

# *INIZIALIZZAZIONE FEW SHOT CHAIN*

In [8]:
ITALIAN_SUFFIX='''
Utilizzare solo la seguente tabella:
{table_info}

Domanda: {input}
'''

In [80]:
from langchain.prompts import FewShotPromptTemplate
from langchain.chains.sql_database.prompt import PROMPT_SUFFIX

#print(PROMPT_SUFFIX)
#example_selector1 NGRAM ,  example_selector SemanticSimilarity

few_shot_prompt = FewShotPromptTemplate(
    #examples=examples,
    example_selector=example_selector1,
    example_prompt=example_prompt,
    prefix=cda_fewshot_prompt,
    suffix=PROMPT_SUFFIX,
    input_variables=["input", "table_info", "top_k"], #These variables are used in the prefix and suffix
)

In [None]:
#PER TESTARE QUALI ESEMPI SCEGLIE IL SELETTORE

print(few_shot_prompt.format(input="Quale insegna ha la maggior incidenza delle offerte nel mese di Ottobre 2020?",top_k="5",table_info=str(db.table_info)))

In [59]:
example_selector1.threshold=0.07

In [158]:
example_selector.k=5

In [81]:
fewshot_chain = SQLDatabaseChain.from_llm(llm, db, prompt=few_shot_prompt, use_query_checker=False,
                                        verbose=True, return_sql=False,)

# *TEST CON FEWSHOT PROMPT*

# *TEST PUNTO VENDITA LIKE*

In [104]:
fewshot_chain.invoke("Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? ")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? 
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attent

{'query': "Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? ",
 'result': "Il punto vendita 'SUPERSTORE 01' ha venduto 24215 prodotti diversi."}

In [17]:
fewshot_chain.invoke("Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? ") #PROVA PROMPT IN ITALIANO --non usa like o ilike



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? 
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
Sei un esperto di PostgreSQL. Data una domanda in input, crea prima una query PostgreSQL sintatticamente corretta da eseguire, quindi guarda i risultati della query e restituisci la risposta in lingua italiana alla domanda in input.
A meno che l'utente non specifichi nella domanda un numero specifico di esempi da ottenere, cerca al massimo 5 risultati utilizzando la clausola LIMIT come da PostgreSQL. È possibile ordinare i risultati in modo che restituiscano i dati più informativi nel database.
Non eseguire mai query su tutte le colonne di una tabella. È necessario interrogare solo le colonne necessarie per rispondere alla domanda. Racchiudi ogni nome di colonna tra virgolette doppie (") per indicarli come identificatori delimitati.
Fai attenzione a utilizzare solo i nomi delle colonne

{'query': "Quanti prodotti ha venduto il punto vendita 'SUPERSTORE 01'? ",
 'result': "Il punto vendita 'SUPERSTORE 01' ha venduto 24215 prodotti diversi."}

In [29]:
fewshot_chain.invoke("Quanti prodotti ha venduto il punto vendita 'IPERSTORE 01'? ")



[1m> Entering new SQLDatabaseChain chain...[0m
Quanti prodotti ha venduto il punto vendita 'IPERSTORE 01'? 
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attenti

{'query': "Quanti prodotti ha venduto il punto vendita 'IPERSTORE 01'? ",
 'result': "Il punto vendita 'IPERSTORE 01' ha venduto 32901 prodotti diversi."}

# *TEST QUANTITA' VENDUTA - PUNTI VENDITA*

In [55]:
fewshot_chain.invoke("Quale è la quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020?") #NON USA LIKE



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è la quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do 

{'query': "Quale è la quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020?",
 'result': "La quantità venduta del punto vendita 'SUPERMARKET 01' in data 31 Dicembre 2020 è pariamente uguale a 7627.214 unità di merce."}

In [14]:
fewshot_chain.invoke("Quale è la quantità venduta del punto vendita 'SUPERMARKET 02' in data 30 Novembre 2021?") #FORMULA OK , USO DI LIKE OK, DATA OK



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è la quantità venduta del punto vendita 'SUPERMARKET 02' in data 30 Novembre 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do 

{'query': "Quale è la quantità venduta del punto vendita 'SUPERMARKET 02' in data 30 Novembre 2021?",
 'result': "La quantità venduta del punto vendita 'SUPERMARKET 02' il giorno 30 Novembre 2021 è di circa 6353 unità."}

In [22]:
fewshot_chain.invoke("Quale punto vendita ha la maggior quantità di venduto?") #NGRAM THRESHOLD 0.1



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la maggior quantità di venduto?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to 

{'query': 'Quale punto vendita ha la maggior quantità di venduto?',
 'result': "Il punto vendita con la maggior quantità di venduto è 'SUPERSTORE 01' con una quantità di venduto di circa '20149100'."}

In [13]:
fewshot_chain.invoke("Quale punto vendita ha la maggior quantità venduta raggruppato per punto vendita?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la maggior quantità venduta raggruppato per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exi

{'query': 'Quale punto vendita ha la maggior quantità venduta raggruppato per punto vendita?',
 'result': "Il punto vendita con la maggior quantità venduta raggruppato per punto vendita è 'SUPERSTORE 01' con una quantità venduta totale di 20149100.847000025 unità vendute."}

In [21]:
fewshot_chain.invoke("Quale punto vendita ha la maggior quantità venduta per punto vendita?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la maggior quantità venduta per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': 'Quale punto vendita ha la maggior quantità venduta per punto vendita?',
 'result': "Il punto vendita con la maggior quantità venduta per punto vendita è 'SUPERSTORE 01' con una quantità venduta totale di 20149100.847000036 unità vendute."}

In [22]:
fewshot_chain.invoke("Quale punto vendita ha la minor quantità venduta per punto vendita?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la minor quantità venduta per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay 

{'query': 'Quale punto vendita ha la minor quantità venduta per punto vendita?',
 'result': "Il punto vendita con la minor quantità venduta per punto vendita è 'SUPERMARKET 07' con una quantità venduta di 1628323.679999997 unità."}

In [40]:
fewshot_chain.invoke("Quali sono i primi 2 punto vendita con la minor quantità venduta per punto vendita?") #senza le righe di esempio



[1m> Entering new SQLDatabaseChain chain...[0m
Quali sono i primi 2 punto vendita con la minor quantità venduta per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not e

{'query': 'Quali sono i primi 2 punto vendita con la minor quantità venduta per punto vendita?',
 'result': "I primi due punti vendita con la minor quantità venduta per punto vendita sono: 'SUPERMARKET 07' con quantità venduta totale di 1628323.6799999964 e 'SUPERMARKET 13' con quantità venduta totale di 1876560.0540000037."}

In [42]:
fewshot_chain.invoke("Quali sono i primi 2 punti vendita con la maggior quantità venduta per punto vendita?") #senza le righe di esempio



[1m> Entering new SQLDatabaseChain chain...[0m
Quali sono i primi 2 punti vendita con la maggior quantità venduta per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not

{'query': 'Quali sono i primi 2 punti vendita con la maggior quantità venduta per punto vendita?',
 'result': "I primi due punti vendita con la maggior quantità venduta per punto vendita sono: 'SUPERSTORE 01' con quantità venduta di 20149100.847000036 e 'IPERSTORE 01' con quantità venduta di 19274632.7259999."}

In [13]:
fewshot_chain.invoke("Elenca la quantità venduta per punto vendita di tutti i punti vendita") #NGRAM THESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per punto vendita di tutti i punti vendita
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': 'Elenca la quantità venduta per punto vendita di tutti i punti vendita',
 'result': 'La quantità venduta per punto vendita di tutti i punti vendita sono elencati nella seguente tabella: punto_vendita | quantita_venduta_totale IPERSTORE 04 | 1872124.8880000024 SUPERSTORE 15 | 2572962.3759999983 SUPERSTORE 08 | 3963928.682000003 SUPERSTORE 04 | 2814808.5709999977 IPERSTORE 01 | 5811919.99499999 SUPERSTORE 07 | 1183536.8880000017 SUPERMARKET 13 | 671402.5949999997 SUPERMARKET 08 | 869674.8230000013 SUPERMARKET 11 | 1020450.464000001 SUPERMARKET 10 | 1151861.9770000002 SUPERMARKET 09 | 1512382.312999998 SUPERSTORE 10 | 2742706.8389999964 IPERSTORE 03 | 2131479.83 SUPERMARKET 12 | 525468.097 SUPERSTORE 01 | 4656624.014000018 SUPERMARKET 14 | 1289141.9490000003 SUPERSTORE 02 | 2795910.8349999986 SUPERSTORE 13 | 4563047.2660'}

In [150]:
fewshot_chain.invoke("Elenca la quantità venduta per punto vendita nel mese di Gennaio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per punto vendita nel mese di Gennaio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': 'Elenca la quantità venduta per punto vendita nel mese di Gennaio 2020',
 'result': 'La quantità venduta per punto vendita nel mese di Gennaio 2020 è stata di 804076.7979999997 euro.'}

In [151]:
fewshot_chain.invoke("Elenca la quantità venduta per punto vendita dei primi 3 punti vendita nel mese di Marzo 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per punto vendita dei primi 3 punti vendita nel mese di Marzo 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns tha

{'query': 'Elenca la quantità venduta per punto vendita dei primi 3 punti vendita nel mese di Marzo 2020',
 'result': 'Ecco i primi 3 punti vendita nel mese di Marzo 2020 con la maggior quantità venduta:\n                     1)Punto vendita:SUPERSTORE 01 , Quantità venduta:847785.9980000011.\n                     2)Punto vendita:IPERSTORE 01 , Quantità venduta:823525.5899999993.\n                     3)Punto vendita:SUPERSTORE 04 , Quantità venduta:713194.3850000001.'}

In [153]:
fewshot_chain.invoke("Elenca la quantità venduta per punto vendita dei primi 3 punti vendita in data 14 Luglio 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per punto vendita dei primi 3 punti vendita in data 14 Luglio 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns tha

{'query': 'Elenca la quantità venduta per punto vendita dei primi 3 punti vendita in data 14 Luglio 2021',
 'result': 'Ecco i primi 3 punti vendita con la quantità venduta maggiore per data 14 Luglio 2021:\n                     1)Punto vendita:SUPERSTORE 01 , Quantità venduta:25859.234000000022.\n                     2)Punto vendita:SUPERSTORE 13 , Quantità venduta:24103.350000000017.\n                     3)Punto vendita:SUPERSTORE 14 , Quantità venduta:23448.21199999998.'}

# *TEST QUANTITA' VENDUTA - INSEGNA*

In [45]:
fewshot_chain.invoke("Elenca la quantità venduta per insegna nel mese di Febbraio 2021") #NGRAM THESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per insegna nel mese di Febbraio 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay att

{'query': 'Elenca la quantità venduta per insegna nel mese di Febbraio 2021',
 'result': 'Ecco la quantità venduta per insegna:\n                     1)Insegna:SUPERSTORE , Quantità venduta:2043859.9199999922.\n                     2)Insegna:IPERSTORE , Quantità venduta:686806.9550000033.\n                     3)Insegna:SUPERMARKET , Quantità venduta:552577.4160000007.'}

In [46]:
fewshot_chain.invoke("Elenca la quantità venduta per insegna nel 2021") #NGRAM THESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per insegna nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which c

{'query': 'Elenca la quantità venduta per insegna nel 2021',
 'result': 'Ecco la quantità venduta per insegna nel 2021:\n                     1)Insegna:SUPERSTORE , Quantità venduta:99520580.8959988.\n                     2)Insegna:IPERSTORE , Quantità venduta:32195702.38500014.\n                     3)Insegna:SUPERMARKET , Quantità venduta:22270217.936999917.'}

In [47]:
fewshot_chain.invoke("Elenca la quantità venduta per insegna") #NGRAM THESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per insegna
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which column is 

{'query': 'Elenca la quantità venduta per insegna',
 'result': 'Ecco la quantità venduta per insegna:\n                     1)Insegna:SUPERSTORE , Quantità venduta:195796523.56401512.\n                     2)Insegna:IPERSTORE , Quantità venduta:62491916.620000154.\n                     3)Insegna:SUPERMARKET , Quantità venduta:48198594.2809989.'}

In [121]:
fewshot_chain.invoke("Elenca la quantità venduta per insegna di tutte le insegne in data 7 Giugno 2020") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per insegna di tutte le insegne in data 7 Giugno 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exis

{'query': 'Elenca la quantità venduta per insegna di tutte le insegne in data 7 Giugno 2020',
 'result': "La quantità venduta per la insegna 'SUPERSTORE' è di 102689.88399999987 unità; per la insegna 'IPERSTORE' è di 36052.86799999997 unità; per la insegna 'SUPERMARKET' è di 10227.306999999983 unità."}

In [53]:
fewshot_chain.invoke("Quale è l'insegna con la maggior quantità venduta per insegna nel mese di Febbraio 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'insegna con la maggior quantità venduta per insegna nel mese di Febbraio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do 

{'query': "Quale è l'insegna con la maggior quantità venduta per insegna nel mese di Febbraio 2021?",
 'result': "L'insegna 'SUPERSTORE' ha la maggior quantità venduta per insegna nel mese di Febbraio 2021 con una quantità venduta di 6930295.9409999885."}

In [122]:
fewshot_chain.invoke("Quale è l'insegna con la minor quantità venduta per insegna nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'insegna con la minor quantità venduta per insegna nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': "Quale è l'insegna con la minor quantità venduta per insegna nel 2021?",
 'result': "L'insegna con la minor quantità venduta per insegna nel 2021 è: SUPERMARKET , Quantità venduta:22270217.937000006 ."}

In [133]:
fewshot_chain.invoke("Quale è l'insegna con la minor quantità venduta per insegna in data 4 Maggio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'insegna con la minor quantità venduta per insegna in data 4 Maggio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': "Quale è l'insegna con la minor quantità venduta per insegna in data 4 Maggio 2020?",
 'result': "L'insegna con la minor quantità venduta per insegna in data 4 Maggio 2020 è 'SUPERMARKET' e la quantità venduta è di 73924.55499999993."}

In [145]:
fewshot_chain.invoke("Quale è l'insegna con la minor quantità venduta per insegna in data 3 Maggio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'insegna con la minor quantità venduta per insegna in data 3 Maggio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': "Quale è l'insegna con la minor quantità venduta per insegna in data 3 Maggio 2020?",
 'result': "L'insegna con la minor quantità venduta per insegna in data 3 Maggio 2020 è 'INSEGNA_MINOR_QUANTITA_VENDUTA_IN_DATA_3_MAGGIO_2020'."}

In [147]:
fewshot_chain.invoke("Quale è la quantità venduta dell'insegna 'IPERSTORE' nel mese di Agosto 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è la quantità venduta dell'insegna 'IPERSTORE' nel mese di Agosto 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': "Quale è la quantità venduta dell'insegna 'IPERSTORE' nel mese di Agosto 2021?",
 'result': "La quantità venduta dell'insegna 'IPERSTORE' nel mese di Agosto 2021 è di circa 2997801,87 kg."}

# *TEST QUANTITA' VENDUTA - REPARTO*

In [159]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to n

{'query': "Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020",
 'result': "Ecco la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 12 Novembre 2020:\n                     1)Reparto:Grocery , Quantità venduta:6485.0.\n                     2)Reparto:Fresh , Quantità venduta:4775.590000000006.\n                     3)Reparto:Beverages , Quantità venduta:2836.0."}

In [161]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 23 Maggio 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 23 Maggio 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not 

{'query': "Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 23 Maggio 2021",
 'result': "La quantità venduta per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 23 Maggio 2021 è:\n                     1)Reparto:Grocery , Quantità venduta:17996.0.\n                     2)Reparto:Beverages , Quantità venduta:13954.0.\n                     3)Reparto:Fresh , Quantità venduta:10155.347000000018."}

In [167]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 04' nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 04' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for co

{'query': "Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 04' nel 2021",
 'result': "Ecco la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 04' nel 2021:\n                     1)Reparto:Grocery , Quantità venduta:641479.781.\n                     2)Reparto:Beverages , Quantità venduta:582749.632.\n                     3)Reparto:Fresh , Quantità venduta:341534.9989999997."}

In [168]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 2 reparti del punto vendita 'SUPERMARKET 04' nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 2 reparti del punto vendita 'SUPERMARKET 04' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for co

{'query': "Elenca la quantità venduta per reparto dei primi 2 reparti del punto vendita 'SUPERMARKET 04' nel 2021",
 'result': "Ecco la quantità venduta per reparto dei primi 2 reparti del punto vendita 'SUPERMARKET 04' nel 2021:\n                     1)Reparto:Grocery , Quantità venduta:641479.781.\n                     2)Reparto:Beverages , Quantità venduta:582749.632."}

In [14]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 5 reparti del punto vendita 'SUPERSTORE 01' nel mese di Giugno 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 5 reparti del punto vendita 'SUPERSTORE 01' nel mese di Giugno 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to no

{'query': "Elenca la quantità venduta per reparto dei primi 5 reparti del punto vendita 'SUPERSTORE 01' nel mese di Giugno 2021",
 'result': "La quantità venduta per reparto dei primi 5 reparti del punto vendita 'SUPERSTORE 01' nel mese di Giugno 2021 è:\n                     1) Reparto:Grocery , Quantità venduta:191133.00300000003.\n                     2) Reparto:Beverages , Quantità venduta:167964.489.\n                     3) Reparto:Fresh , Quantità venduta:152731.2429999999.\n                     4) Reparto:Fruit and Vegetables , Quantità venduta:91819.66500000001.\n                     5) Reparto:Home Care , Quantità venduta:53484.19300000001."}

In [185]:
fewshot_chain.invoke("Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 04' nel mese di Luglio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 04' nel mese di Luglio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to no

{'query': "Elenca la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 04' nel mese di Luglio 2020",
 'result': "Ecco la quantità venduta per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 04' nel mese di Luglio 2020:\n                     1)Reparto:Grocery , Quantità venduta:175928.423.\n                     2)Reparto:Beverages , Quantità venduta:122837.21800000001.\n                     3)Reparto:Fresh , Quantità venduta:104458.55499999977."}

In [16]:
fewshot_chain.invoke("Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query 

{'query': "Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021?",
 'result': "Il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 02' nel mese di Giugno 2021 è 'Grocery' e la quantità venduta è di 638442.6610000001 unità."}

In [22]:
fewshot_chain.invoke("Quale è il reparto con la maggior quantità venduta del punto vendita 'SUPERSTORE 02' nel 2020?") # NGRAM THRESHOLD 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con la maggior quantità venduta del punto vendita 'SUPERSTORE 02' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': "Quale è il reparto con la maggior quantità venduta del punto vendita 'SUPERSTORE 02' nel 2020?",
 'result': "Il reparto con la maggior quantità venduta del punto vendita 'SUPERSTORE 02' nel 2020 è 'Grocery' e la quantità venduta è 29170969.673999995."}

In [23]:
fewshot_chain.invoke("Quale è il reparto con la minor quantità venduta del punto vendita 'SUPERMARKET 02' nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con la minor quantità venduta del punto vendita 'SUPERMARKET 02' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns tha

{'query': "Quale è il reparto con la minor quantità venduta del punto vendita 'SUPERMARKET 02' nel 2020?",
 'result': "Il reparto con la minor quantità venduta del punto vendita 'SUPERMARKET 02' nel 2020 è 'Unknown' e la quantità venduta è 0.0."}

In [25]:
fewshot_chain.invoke("Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 03' in data 15 Gennaio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 03' in data 15 Gennaio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query 

{'query': "Quale è il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 03' in data 15 Gennaio 2020?",
 'result': "Il reparto con la maggior quantità venduta del punto vendita 'IPERSTORE 03' in data 15 Gennaio 2020 è 'Grocery'."}

In [26]:
fewshot_chain.invoke("Quale è la quantità venduta del reparto 'Fresh' del punto vendita 'IPERSTORE 03' nel mese di Marzo 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è la quantità venduta del reparto 'Fresh' del punto vendita 'IPERSTORE 03' nel mese di Marzo 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for 

{'query': "Quale è la quantità venduta del reparto 'Fresh' del punto vendita 'IPERSTORE 03' nel mese di Marzo 2020?",
 'result': "La quantità venduta del reparto 'Fresh' del punto vendita 'IPERSTORE 03' nel mese di Marzo 2020 è 0.0 (zero)."}

In [27]:
fewshot_chain.invoke("Quale è la quantità venduta del reparto 'Grocery' del punto vendita 'IPERSTORE 01' nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è la quantità venduta del reparto 'Grocery' del punto vendita 'IPERSTORE 01' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that

{'query': "Quale è la quantità venduta del reparto 'Grocery' del punto vendita 'IPERSTORE 01' nel 2020?",
 'result': "La quantità venduta del reparto 'Grocery' del punto vendita 'IPERSTORE 01' nel 2020 è di circa 9039271.809000002 unità."}

# *TEST VALORE VENDUTO - PUNTI VENDITA*

In [48]:
fewshot_chain.invoke("Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel mese di Gennaio 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel mese di Gennaio 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for c

{'query': 'Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel mese di Gennaio 2021',
 'result': "I primi due punti vendita con il maggior valore venduto per punto vendita nel mese di Gennaio 2021 sono i seguenti: il punto vendita 'SUPERSTORE 01' ha venduto nel mese di Gennaio 2021 un valore di vendita di 1682122.217775803 e il punto vendita 'SUPERSTORE 04' ha venduto nel mese di Gennaio 2021 un valore di vendita di 1617361.7323211764."}

In [50]:
fewshot_chain.invoke("Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. A

{'query': 'Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita',
 'result': "I primi 3 punti vendita con il minor valore venduto per punto vendita sono: il punto vendita 'SUPERMARKET 07' con il valore venduto totale di '2483273.7671361472', il punto vendita 'SUPERMARKET 13' con il valore venduto totale di '3298733.5279516894', il punto vendita 'SUPERMARKET 12' con il valore venduto totale di '3329109.529010822'."}

In [55]:
fewshot_chain.invoke("Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do n

{'query': 'Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2021',
 'result': "I primi due punti vendita del superstore con il maggior valore venduto nel 2021 sono: 'SUPERSTORE 01' con un valore venduto totale di €21754204.219052903 e 'SUPERSTORE 04' con un valore venduto totale di €17961838.458294906."}

In [56]:
fewshot_chain.invoke("Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do n

{'query': 'Elenca i primi 2 punti vendita con il maggior valore venduto per punto vendita nel 2020',
 'result': "I primi due punti vendita del supermarket 'SUPERSTORE 01' e 'IPERSTORE 01' con il maggior valore venduto nel 2020 sono: 'SUPERSTORE 01' con il valore venduto totale di €17938797.718636114 e 'IPERSTORE 01' con il valore venduto totale di €15830153.659402985."}

In [59]:
fewshot_chain.invoke("Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. A

{'query': 'Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita',
 'result': "I primi 4 punti vendita con il minor valore venduto per punto vendita sono: 'SUPERMARKET 07' con valore venduto totale di '2483273.7671361123', 'SUPERMARKET 13' con valore venduto totale di '3298733.5279516415', 'SUPERMARKET 12' con valore venduto totale di '3329109.529010727', e 'SUPERMARKET 01' con valore venduto totale di '4041381.129614027'."}

In [60]:
fewshot_chain.invoke("Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita nel mese di Marzo 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita nel mese di Marzo 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colum

{'query': 'Elenca i primi 4 punti vendita con il minor valore venduto per punto vendita nel mese di Marzo 2020',
 'result': "I primi 4 punti vendita con il minor valore venduto per punto vendita nel mese di Marzo 2020 sono: il punto vendita 'SUPERMARKET 07' con un valore venduto totale di 135151.9932765867; il punto vendita 'SUPERMARKET 12' con un valore venduto totale di 177289.9646393484; il punto vendita 'SUPERMARKET 03' con un valore venduto totale di 192112.2385849385; il punto vendita 'SUPERMARKET 13' con un valore venduto totale di 202651.3523997307."}

In [70]:
fewshot_chain.invoke("Quale è il valore venduto del punto vendita 'SUPERSTORE 02' nel mese di Agosto 2021?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto del punto vendita 'SUPERSTORE 02' nel mese di Agosto 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not 

{'query': "Quale è il valore venduto del punto vendita 'SUPERSTORE 02' nel mese di Agosto 2021?",
 'result': "Il valore venduto del punto vendita 'SUPERSTORE 02' nel mese di Agosto 2021 è 768836.1638754687."}

In [71]:
fewshot_chain.invoke("Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita nel mese di Aprile 2021") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita nel mese di Aprile 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

{'query': 'Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita nel mese di Aprile 2021',
 'result': 'I primi 3 punti vendita con il minor valore venduto per punto vendita nel mese di Aprile 2021 sono:\n                     1)Punto vendita:SUPERMARKET 07 , Valore venduto:95047.42932900431.\n                     2)Punto vendita:SUPERMARKET 13 , Valore venduto:118063.21661232194.\n                     3)Punto vendita:SUPERMARKET 12 , Valore venduto:129458.45362844778.'}

In [72]:
fewshot_chain.invoke("Quale è il valore venduto del punto vendita 'SUPERMARKET 01' nel 2020?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto del punto vendita 'SUPERMARKET 01' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, p

{'query': "Quale è il valore venduto del punto vendita 'SUPERMARKET 01' nel 2020?",
 'result': "Il valore venduto del punto vendita 'SUPERMARKET 01' nel 2020 è 3817150.1720226994."}

In [77]:
fewshot_chain.invoke("Elenca il valore venduto per punto vendita dei primi 3 punti vendita giorno 30/01/2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per punto vendita dei primi 3 punti vendita giorno 30/01/2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do no

{'query': 'Elenca il valore venduto per punto vendita dei primi 3 punti vendita giorno 30/01/2021',
 'result': 'Ecco il valore venduto per punto vendita dei primi 3 punti vendita giorno 30/01/2021:\n                     1)Punto vendita:SUPERSTORE 01 , Valore venduto:90601.88573775953.\n                     2)Punto vendita:SUPERSTORE 04 , Valore venduto:86304.2252135026.\n                     3)Punto vendita:IPERSTORE 01 , Valore venduto:76895.75615704.'}

In [92]:
fewshot_chain.invoke("Quale è il punto vendita con il maggior valore venduto?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior valore venduto?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to

{'query': 'Quale è il punto vendita con il maggior valore venduto?',
 'result': "Il punto vendita con il maggior valore venduto è il punto vendita 'SUPERSTORE 01' con un valore venduto di 39693001.93769417."}

In [96]:
fewshot_chain.invoke("Quale è il punto vendita con il maggior valore venduto per punto vendita nel mese di Marzo 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior valore venduto per punto vendita nel mese di Marzo 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns 

{'query': 'Quale è il punto vendita con il maggior valore venduto per punto vendita nel mese di Marzo 2021?',
 'result': "Il punto vendita con il maggior valore venduto per punto vendita nel mese di Marzo 2021 è il punto vendita 'SUPERSTORE 01' con un valore venduto totale di 1893872.301593219."}

In [22]:
fewshot_chain.invoke("Quale è il punto vendita con il maggior valore venduto nel mese di Gennaio 2021 giorno 30?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior valore venduto nel mese di Gennaio 2021 giorno 30?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that d

{'query': 'Quale è il punto vendita con il maggior valore venduto nel mese di Gennaio 2021 giorno 30?',
 'result': "Il punto vendita con il maggior valore venduto nel mese di Gennaio 2021 giorno 30 è il punto vendita 'SUPERSTORE 01' con un valore venduto di 90601.88573775953."}

In [21]:
fewshot_chain.invoke("Quale è il punto vendita con il maggior valore venduto per punto vendita in data 30 Gennaio 2020?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior valore venduto per punto vendita in data 30 Gennaio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns

{'query': 'Quale è il punto vendita con il maggior valore venduto per punto vendita in data 30 Gennaio 2020?',
 'result': "Il punto vendita con il maggior valore venduto per punto vendita il giorno 30 Gennaio 2020 è il punto vendita 'SUPERSTORE 01' e il valore venduto è di 44786.49859664919."}

In [22]:
fewshot_chain.invoke("Quale è il punto vendita con il maggior valore venduto per punto vendita in data 15 Agosto 2020?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior valore venduto per punto vendita in data 15 Agosto 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns 

{'query': 'Quale è il punto vendita con il maggior valore venduto per punto vendita in data 15 Agosto 2020?',
 'result': "Il punto vendita con il maggior valore venduto per punto vendita il giorno 15 Agosto 2020 è il punto vendita 'SUPERSTORE 13' con un valore venduto di 43904.57834283198."}

In [72]:
fewshot_chain.invoke("Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita in data 16 Novembre 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita in data 16 Novembre 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for col

{'query': 'Elenca i primi 3 punti vendita con il minor valore venduto per punto vendita in data 16 Novembre 2021',
 'result': 'Ecco i primi 3 punti vendita con il minor valore venduto per punto vendita il data 16 Novembre 2021:\n                     1)Punto vendita:SUPERMARKET 07 , Quantità venduta:2563.5363583138196.\n                     2)Punto vendita:SUPERMARKET 13 , Quantità venduta:3355.3691151744383.\n                     3)Punto vendita:SUPERMARKET 12 , Quantità venduta:3966.454915030328.'}

In [73]:
fewshot_chain.invoke("Quale è il valore venduto del punto vendita 'SUPERMARKET 07' nel mese di Dicembre 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto del punto vendita 'SUPERMARKET 07' nel mese di Dicembre 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do n

{'query': "Quale è il valore venduto del punto vendita 'SUPERMARKET 07' nel mese di Dicembre 2020?",
 'result': "Il valore venduto del punto vendita 'SUPERMARKET 07' nel mese di Dicembre 2020 è 110521.51437139368."}

# *TEST VALORE VENDUTO - INSEGNA*

In [66]:
fewshot_chain.invoke("Elenca il valore venduto per insegna nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per insegna nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which col

{'query': 'Elenca il valore venduto per insegna nel 2020',
 'result': 'Ecco i valori venduti per insegna nel 2020:\n                     1)Insegna:SUPERSTORE , Valore venduto:173705873.10332742.\n                     2)Insegna:IPERSTORE , Valore venduto:53048937.443658136.\n                     3)Insegna:SUPERMARKET , Valore venduto:43178795.76504758.'}

In [65]:
fewshot_chain.invoke("Elenca il valore venduto per insegna nel mese di Marzo 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per insegna nel mese di Marzo 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attentio

{'query': 'Elenca il valore venduto per insegna nel mese di Marzo 2021',
 'result': 'Ecco i valori venduti per insegna nel mese di Marzo 2021:\n                     1)Insegna:SUPERSTORE , Valore venduto:17107539.77209594.\n                     2)Insegna:IPERSTORE , Valore venduto:5566087.722760825.\n                     3)Insegna:SUPERMARKET , Valore venduto:3490484.5134535003.'}

In [75]:
fewshot_chain.invoke("Elenca il valore venduto per insegna giorno 30/01/2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per insegna giorno 30/01/2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to 

{'query': 'Elenca il valore venduto per insegna giorno 30/01/2021',
 'result': 'Ecco il valore venduto per insegna giorno 30/01/2021:\n                     1)Insegna:SUPERSTORE , Valore venduto:825388.2192464182.\n                     2)Insegna:IPERSTORE , Valore venduto:247163.27375719938.\n                     3)Insegna:SUPERMARKET , Valore venduto:179836.32055327288.'}

In [81]:
fewshot_chain.invoke("Elenca il valore venduto per insegna in data 15 Ottobre 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per insegna in data 15 Ottobre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attenti

{'query': 'Elenca il valore venduto per insegna in data 15 Ottobre 2020',
 'result': 'Ecco il valore venduto per insegna il giorno 15 Ottobre 2020:\n                     1)Insegna:SUPERSTORE , Valore venduto:398632.87278489384.\n                     2)Insegna:IPERSTORE , Valore venduto:119638.07289699314.\n                     3)Insegna:SUPERMARKET , Valore venduto:105053.67368844393.'}

In [82]:
fewshot_chain.invoke("Quale insegna ha il maggior valore venduto nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il maggior valore venduto nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to wh

{'query': 'Quale insegna ha il maggior valore venduto nel 2020?',
 'result': "L'insegna con il maggior valore venduto nel 2020 è 'SUPERSTORE' con un valore venduto di 173705873.10332513."}

In [94]:
fewshot_chain.invoke("Quale insegna ha il minor valore venduto nel mese di Aprile 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor valore venduto nel mese di Aprile 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay at

{'query': 'Quale insegna ha il minor valore venduto nel mese di Aprile 2021?',
 'result': "L'insegna 'SUPERMARKET' ha il minor valore venduto nel mese di Aprile 2021 con una quantità venduta di 3110574.462861035."}

In [96]:
fewshot_chain.invoke("Quale insegna ha il maggior valore venduto nel mese di Ottobre 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il maggior valore venduto nel mese di Ottobre 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': 'Quale insegna ha il maggior valore venduto nel mese di Ottobre 2020?',
 'result': "L'insegna con il maggior valore venduto nel mese di Ottobre 2020 è 'SUPERSTORE' con un valore venduto di 15322959.882663812."}

In [97]:
fewshot_chain.invoke("Quale insegna ha il minor valore venduto in data 15 Gennaio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor valore venduto in data 15 Gennaio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay at

{'query': 'Quale insegna ha il minor valore venduto in data 15 Gennaio 2020?',
 'result': "L'insegna 'SUPERMARKET' ha il minor valore venduto in data 15 Gennaio 2020 con un valore venduto di 101280.85852368937."}

In [119]:
fewshot_chain.invoke("Quale è il valore venduto dell'insegna 'SUPERSTORE' nel  2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto dell'insegna 'SUPERSTORE' nel  2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay atten

{'query': "Quale è il valore venduto dell'insegna 'SUPERSTORE' nel  2020?",
 'result': "Il valore venduto dell'insegna 'SUPERSTORE' nel  2020 è di circa €173.705873,1032142."}

In [117]:
fewshot_chain.invoke("Quale è il valore venduto dell'insegna 'IPERSTORE' nel mese di Febbraio 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto dell'insegna 'IPERSTORE' nel mese di Febbraio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': "Quale è il valore venduto dell'insegna 'IPERSTORE' nel mese di Febbraio 2021?",
 'result': "Il valore venduto dell'insegna 'IPERSTORE' nel mese di Febbraio 2021 è di circa €1212694.216144102."}

In [118]:
fewshot_chain.invoke("Quale è il valore venduto dell'insegna 'IPERSTORE' in data 4 Marzo 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto dell'insegna 'IPERSTORE' in data 4 Marzo 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also,

{'query': "Quale è il valore venduto dell'insegna 'IPERSTORE' in data 4 Marzo 2020?",
 'result': "Il valore venduto dell'insegna 'IPERSTORE' il giorno 4 Marzo 2020 è di €132621.5507191715."}

# *TEST VALORE VENDUTO - REPARTO*

In [72]:
fewshot_chain.invoke("Quale è il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': "Quale è il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02'?",
 'result': "Il valore venduto del reparto 'Grocery' del punto vendita 'SUPERSTORE 02' è di circa €57.196.066,17.\n```"}

In [10]:
fewshot_chain.invoke("Quale è il valore venduto per reparto del reparto 'Fresh' del punto vendita 'SUPERSTORE 02'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto per reparto del reparto 'Fresh' del punto vendita 'SUPERSTORE 02'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that

{'query': "Quale è il valore venduto per reparto del reparto 'Fresh' del punto vendita 'SUPERSTORE 02'?",
 'result': "Il valore venduto per reparto del reparto 'Fresh' del punto vendita 'SUPERSTORE 02' è pari:5492251.279046778."}

In [24]:
fewshot_chain.invoke("Quale è il valore venduto per reparto del reparto 'Grocery' del punto vendita 'SUPERSTORE%02' in data 13 Gennaio 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il valore venduto per reparto del reparto 'Grocery' del punto vendita 'SUPERSTORE%02' in data 13 Gennaio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to 

{'query': "Quale è il valore venduto per reparto del reparto 'Grocery' del punto vendita 'SUPERSTORE%02' in data 13 Gennaio 2021?",
 'result': "Il valore venduto per reparto del reparto 'Grocery' del punto vendita 'SUPERSTORE%02' in data 13 Gennaio 2021 è di '6944.206006015843'."}

In [26]:
fewshot_chain.invoke("Quale è il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for c

{'query': "Quale è il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel 2021?",
 'result': "Il reparto con il maggior valore venduto per reparto del punto vendita 'IPERSTORE 02' nel 2021 è 'Grocery' con un valore venduto di 4502067.179924277."}

In [29]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE%01' in data 12 Novembre 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE%01' in data 12 Novembre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE%01' in data 12 Novembre 2020",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE%01' in data 12 Novembre 2020 è: 'Fresh':12097.424661813593,'Grocery':10945.976865484232,'Fruit and Vegetables':4246.007757133577."}

In [49]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%01' nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%01' nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%01' nel 2020",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%01' nel 2020 è: 'Grocery':1093554.380642311,'Fresh':979380.8542101576,'Meats':415877.14977644867."}

In [57]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 4 Gennaio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 4 Gennaio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not qu

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 4 Gennaio 2020",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 4 Gennaio 2020 è: 'Grocery':17995.902416163044,'Fresh':10609.619706522994,'Meats':4655.73546944858."}

In [68]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 13 Luglio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 13 Luglio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not q

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 13 Luglio 2020",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERSTORE 01' in data 13 Luglio 2020 sono: 'Fresh' con valore venduto di '11886.46513814055', 'Grocery' con valore venduto di '9730.67698176139', e 'Fruit and Vegetables' con valore venduto di '4321.74020610537'."}

In [72]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%07' nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%07' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%07' nel 2021",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET%07' nel 2021 è: 'Fresh':371010.4106500092,'Grocery':323667.72139390366,'Meats':134293.6327868852."}

In [76]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 01' nel 2021") #PROBLEMA CON LIKE



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 01' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 01' nel 2021",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 01' nel 2021 è: 'Grocery':11126537.817642227,'Fresh':9707560.001535483,'Meats':4084903.468703413."}

In [22]:
fewshot_chain.invoke("Elenca il valore venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERMARKET 01' , nel 2021") #CON LA PUNTEGGIATURA FUNZIONA



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERMARKET 01' , nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query fo

{'query': "Elenca il valore venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERMARKET 01' , nel 2021",
 'result': "Ecco il valore venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERSTORE 01' , nel 2021:\n                     1)Reparto:Grocery , Valore venduto:64638.73758645797.\n                     2)Reparto:Fresh , Valore venduto:61788.57254958147.\n                     3)Reparto:Meats , Valore venduto:25831.123248882246."}

In [77]:
fewshot_chain.invoke("Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita: 'SUPERMARKET 01' nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita: 'SUPERMARKET 01' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for col

{'query': "Elenca il valore venduto per reparto dei primi 3 reparti del punto vendita: 'SUPERMARKET 01' nel 2021",
 'result': "Il valore venduto per reparto dei primi 3 reparti del punto vendita: 'SUPERMARKET 01' nel 2021 è: 'Grocery':64638.73758645797,'Fresh':61788.57254958147,'Meats':25831.123248882246."}

# *TEST COSTO DEL VENDUTO - PUNTI VENDITA*

In [80]:
fewshot_chain.invoke("Quale punto vendita ha il maggior costo del venduto per punto vendita?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha il maggior costo di venduto per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': 'Quale punto vendita ha il maggior costo di venduto per punto vendita?',
 'result': "Il punto vendita con il maggior costo di venduto per punto vendita è il punto vendita 'SUPERSTORE 01' e il costo totale di venduto è di 26595806.34704225."}

In [88]:
fewshot_chain.invoke("Quale punto vendita ha il minor costo del venduto per punto vendita?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha il minor costo del venduto per punto vendita?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': 'Quale punto vendita ha il minor costo del venduto per punto vendita?',
 'result': "Il punto vendita con il minor costo del venduto per punto vendita è il punto vendita 'SUPERMARKET 07' e il costo totale del venduto è di 1787719.603386735."}

In [54]:
fewshot_chain.invoke("Quale punto vendita ha il minor costo del venduto per punto vendita nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha il minor costo del venduto per punto vendita nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': 'Quale punto vendita ha il minor costo del venduto per punto vendita nel 2021?',
 'result': "Il punto vendita con il minor costo del venduto nel 2021 è il punto vendita 'SUPERMARKET 01' e il costo del venduto è di 154391.8808018939."}

In [89]:
fewshot_chain.invoke("Quale punto vendita ha il minor costo del venduto per punto vendita nel mese di Febbraio 2021?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha il minor costo del venduto per punto vendita nel mese di Febbraio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': 'Quale punto vendita ha il minor costo del venduto per punto vendita nel mese di Febbraio 2021?',
 'result': "Il punto vendita con il minor costo del venduto per punto vendita nel mese di Febbraio 2021 è il punto vendita 'SUPERMARKET 07' con un costo totale di venduto di 59208.81036224609€."}

In [53]:
fewshot_chain.invoke("Quale punto vendita ha il maggior costo del venduto per punto vendita in data 23 Settembre 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha il maggior costo del venduto per punto vendita in data 23 Settembre 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns 

{'query': 'Quale punto vendita ha il maggior costo del venduto per punto vendita in data 23 Settembre 2020?',
 'result': "Il punto vendita con il maggior costo del venduto per punto vendita il data '23 Settembre 2020' è 'SUPERSTORE 01' e il costo del venduto è di 29250.066123024408."}

In [90]:
fewshot_chain.invoke("Elenca i primi 2 punti vendita con il maggior costo del venduto nel mese di marzo 2021") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 2 punti vendita con il maggior costo del venduto nel mese di marzo 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do no

{'query': 'Elenca i primi 2 punti vendita con il maggior costo del venduto nel mese di marzo 2021',
 'result': "I primi due punti vendita con il maggior costo del venduto nel mese di marzo 2021 sono il punto vendita 'SUPERSTORE 01' con il costo del venduto di 1246444.0894905985 e il punto vendita 'SUPERSTORE 04' con il costo del venduto di 1158793.580567046."}

In [56]:
fewshot_chain.invoke("Elenca i primi 5 punti vendita con il maggior costo del venduto nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 5 punti vendita con il maggior costo del venduto nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also,

{'query': 'Elenca i primi 5 punti vendita con il maggior costo del venduto nel 2020',
 'result': 'Ecco i primi 5 punti vendita con il maggior costo del venduto nel 2020 sono:\n                     1)Punto vendita:SUPERSTORE 01 , Costo del venduto:12327870.536628157.\n                     2)Punto vendita:IPERSTORE 01 , Costo del venduto:11407633.03194762.\n                     3)Punto vendita:SUPERSTORE 13 , Costo del venduto:11035084.88326269.\n                     4)Punto vendita:SUPERSTORE 04 , Costo del venduto:10309956.29240487.\n                     5)Punto vendita:SUPERSTORE 09 , Costo del venduto:9951550.680914842.'}

In [59]:
fewshot_chain.invoke("Elenca i primi 2 punti vendita con il minor costo del venduto in data 17 Dicembre 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca i primi 2 punti vendita con il minor costo del venduto in data 17 Dicembre 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do no

{'query': 'Elenca i primi 2 punti vendita con il minor costo del venduto in data 17 Dicembre 2021',
 'result': "Ecco i primi 2 punti vendita con il minor costo del venduto il data 17 Dicembre 2021 sono: 'SUPERMARKET 07' con costo venduto di '3417.3168619803764' e 'SUPERMARKET 12' con costo venduto di '4522.7704664263565'."}

# *TEST COSTO DEL VENDUTO - INSEGNA*

In [100]:
fewshot_chain.invoke("Quale insegna ha il minor costo del venduto per insegna nel 2020?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor costo del venduto per insegna nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay at

{'query': 'Quale insegna ha il minor costo del venduto per insegna nel 2020?',
 'result': "L'insegna con il minor costo del venduto nel 2020 è 'SUPERMARKET' e il costo del venduto è di 30400033.03020644."}

In [101]:
fewshot_chain.invoke("Quale insegna ha il maggior costo del venduto per insegna nel 2021?") #NGRAM THRESHOLD 0.02



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il maggior costo del venduto per insegna nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay 

{'query': 'Quale insegna ha il maggior costo del venduto per insegna nel 2021?',
 'result': "Il punto vendita con il maggior costo del venduto nel 2021 è il punto vendita 'SUPERSTORE' e il costo del venduto è di 130734786.28881."}

In [113]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna nel 2020") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which 

{'query': 'Elenca il costo del venduto per insegna nel 2020',
 'result': 'Il costo del venduto per insegna nel 2020 è il seguente:\n                     1) Insegna: SUPERSTORE , Costo del venduto:122716576.59607603.\n                     2) Insegna: IPERSTORE , Costo del venduto:37516208.064365864.\n                     3) Insegna: SUPERMARKET , Costo del venduto:30400033.03020658.'}

In [114]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna nel 2021") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which 

{'query': 'Elenca il costo del venduto per insegna nel 2021',
 'result': 'Il costo del venduto per insegna nel 2021 è il seguente:\n                     1) Insegna: SUPERSTORE , Costo del venduto:130734786.28880638.\n                     2) Insegna: IPERSTORE , Costo del venduto:41423586.2240143.\n                     3) Insegna: SUPERMARKET , Costo del venduto:26461157.571494125.'}

In [115]:
fewshot_chain.invoke("Quale insegna ha il minor costo del venduto per insegna nel 2020?") #NGRAM THRESHOLD



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor costo del venduto per insegna nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay at

{'query': 'Quale insegna ha il minor costo del venduto per insegna nel 2020?',
 'result': "Il punto vendita con il minor costo del venduto nel 2020 è il punto vendita 'SUPERMARKET' e il costo del venduto è di 30400033.030206166."}

In [133]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna di tutte le insegne nel mese di Gennaio 2020") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna di tutte le insegne nel mese di Gennaio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not 

{'query': 'Elenca il costo del venduto per insegna di tutte le insegne nel mese di Gennaio 2020',
 'result': 'Il costo del venduto totale per insegna nel mese di Gennaio 2020 è:\n                     1) Insegna:SUPERSTORE , Costo del venduto totale:9710513.650908269.\n                     2) Insegna:IPERSTORE , Costo del venduto totale:2928969.9008850884.\n                     3) Insegna:SUPERMARKET , Costo del venduto totale:2345658.9706558143.'}

In [8]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna di tutte le insegne nel 2020") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna di tutte le insegne nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': 'Elenca il costo del venduto per insegna di tutte le insegne nel 2020',
 'result': 'Ecco i costi del venduto per insegna nel 2020:\n                     1)Insegna:SUPERSTORE , Costo del venduto:122716576.5960748.\n                     2)Insegna:IPERSTORE , Costo del venduto:37516208.06436583.\n                     3)Insegna:SUPERMARKET , Costo del venduto:30400033.030206334.'}

In [9]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna nel 2020") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which 

{'query': 'Elenca il costo del venduto per insegna nel 2020',
 'result': 'Il costo del venduto per insegna nel 2020 è il seguente:\n                     1) Insegna:SUPERSTORE , Costo del venduto:122716576.5960742.\n                     2) Insegna:IPERSTORE , Costo del venduto:37516208.064366534.\n                     3) Insegna:SUPERMARKET , Costo del venduto:30400033.03020615.'}

In [33]:
fewshot_chain.invoke("Quale insegna ha il minor costo del venduto per insegna nel mese di Marzo 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor costo del venduto per insegna nel mese di Marzo 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist

{'query': 'Quale insegna ha il minor costo del venduto per insegna nel mese di Marzo 2020?',
 'result': "L'insegna 'SUPERMARKET' ha il minor costo del venduto per insegna nel mese di Marzo 2020 con un costo totale di venduto di 2827700.53225551."}

In [34]:
fewshot_chain.invoke("Quale insegna ha il minor costo del venduto per insegna in data 25 Marzo 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il minor costo del venduto per insegna in data 25 Marzo 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist.

{'query': 'Quale insegna ha il minor costo del venduto per insegna in data 25 Marzo 2021?',
 'result': "L'insegna con il minor costo del venduto nel data '25 Marzo 2021' è 'SUPERMARKET' e il costo del venduto è di 117545.25766738431."}

In [50]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna nel mese di Febbraio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna nel mese di Febbraio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay at

{'query': 'Elenca il costo del venduto per insegna nel mese di Febbraio 2020',
 'result': 'Il costo del venduto per punto vendita nel mese di Febbraio 2020 è il seguente:\n                     1)Insegna:SUPERSTORE , Costo del venduto:10062132.200033385.\n                     2)Insegna:IPERSTORE , Costo del venduto:3028203.028756599.\n                     3)Insegna:SUPERMARKET , Costo del venduto:2392893.18688409.'}

In [51]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna nel mese di Ottobre 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna nel mese di Ottobre 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay att

{'query': 'Elenca il costo del venduto per insegna nel mese di Ottobre 2021',
 'result': 'Il costo del venduto per punto vendita nel mese di Ottobre 2021 è il seguente:\n                     1)Insegna:SUPERSTORE , Costo del venduto:11120287.39208995.\n                     2)Insegna:IPERSTORE , Costo del venduto:3465884.2378489054.\n                     3)Insegna:SUPERMARKET , Costo del venduto:2124596.0877334327.'}

In [52]:
fewshot_chain.invoke("Elenca il costo del venduto per insegna in data 30 Agosto 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per insegna in data 30 Agosto 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay atten

{'query': 'Elenca il costo del venduto per insegna in data 30 Agosto 2021',
 'result': "Ecco i costi del venduto per insegna nel data '30 Agosto 2021':\n                     1)Insegna:IPERSTORE , Costo del venduto:97031.30128214844.\n                     2)Insegna:SUPERSTORE , Costo del venduto:316312.35246564186.\n                     3)Insegna:SUPERMARKET , Costo del venduto:67380.06971221391."}

# *TEST COSTO DEL VENDUTO - REPARTO*

In [82]:
fewshot_chain.invoke("Quale reparto ha il maggior costo del venduto per reparto del punto vendita: 'SUPERMARKET 01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale reparto ha il maggior costo del venduto per reparto del punto vendita: 'SUPERMARKET 01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': "Quale reparto ha il maggior costo del venduto per reparto del punto vendita: 'SUPERMARKET 01'?",
 'result': "Il reparto con il maggior costo del venduto per reparto del punto vendita: 'SUPERMARKET 01' è 'Grocery' e il costo del venduto è di '818043.0580458362'."}

In [86]:
fewshot_chain.invoke("Quale reparto ha il maggior costo del venduto per reparto del punto vendita : 'SUPERSTORE 01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale reparto ha il maggior costo del venduto per reparto del punto vendita : 'SUPERSTORE 01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': "Quale reparto ha il maggior costo del venduto per reparto del punto vendita : 'SUPERSTORE 01'?",
 'result': "Il reparto con il maggior costo del venduto per reparto del punto vendita : 'SUPERSTORE 01' è 'Fresh' e il costo totale è di 6822062.912364537."}

In [91]:
fewshot_chain.invoke("Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE%01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE%01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that

{'query': "Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE%01'?",
 'result': "Il reparto con il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE%01' è 'Fresh' e il costo totale è di 6822062.912364517."}

In [92]:
fewshot_chain.invoke("Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE 01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE 01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that

{'query': "Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE 01'?",
 'result': "Il reparto con il maggior costo del venduto per reparto del punto vendita 'SUPERSTORE 01' è 'Grocery' e il costo del venduto è di 34636449.07331336."}

In [87]:
fewshot_chain.invoke("Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'IPERSTORE 01'?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'IPERSTORE 01'?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that 

{'query': "Quale reparto ha il maggior costo del venduto per reparto del punto vendita 'IPERSTORE 01'?",
 'result': "Il reparto con il maggior costo del venduto per reparto del punto vendita 'IPERSTORE 01' è 'Grocery' e il costo del venduto per reparto è di 6969315.953978634."}

In [18]:
fewshot_chain.invoke("Quale è il costo del venduto , del reparto 'Grocery' , del punto vendita 'IPERSTORE 03' nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il costo del venduto , del reparto 'Grocery' , del punto vendita 'IPERSTORE 03' nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns

{'query': "Quale è il costo del venduto , del reparto 'Grocery' , del punto vendita 'IPERSTORE 03' nel 2021?",
 'result': "Il costo del venduto del reparto 'Grocery' del punto vendita 'IPERSTORE 03' nel 2021 è di circa 2580898.563431476 Euro."}

In [21]:
fewshot_chain.invoke("Elenca il costo del venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERSTORE 03' , nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il costo del venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERSTORE 03' , nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query 

{'query': "Elenca il costo del venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERSTORE 03' , nel 2020",
 'result': "Ecco il costo del venduto per reparto , dei primi 3 reparti , del punto vendita 'SUPERSTORE 03' , nel 2020:\n                     1)Reparto:Grocery , Costo del venduto:2203561.3820014647.\n                     2)Reparto:Fresh , Costo del venduto:1550894.3730830532.\n                     3)Reparto:Beverages , Costo del venduto:857567.4106126587."}

# *TEST MARGINE - PUNTI VENDITA*

In [9]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 3 punti vendita , nel mese di Dicembre 2021") #NGRAM 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 3 punti vendita , nel mese di Dicembre 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that 

{'query': 'Elenca il margine per punto vendita , dei primi 3 punti vendita , nel mese di Dicembre 2021',
 'result': 'Ecco il margine per punto vendita , dei primi 3 punti vendita , nel mese di Dicembre 2021:\n                     1)Punto vendita:SUPERSTORE 01 , Margine:797047.4521092075 , Margine percentuale:0.3154930913507964.\n                     2)Punto vendita:SUPERSTORE 04 , Margine:622730.7819912422 , Margine percentuale:0.32284551927512156.\n                     3)Punto vendita:IPERSTORE 01 , Margine:537157.895063903 , Margine percentuale:0.28255625765721437.'}

In [10]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 2 punti vendita , nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 2 punti vendita , nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Als

{'query': 'Elenca il margine per punto vendita , dei primi 2 punti vendita , nel 2020',
 'result': "Il margine per punto vendita , dei primi due punti vendita , nel 2020 è stato di 'SUPERSTORE 01' pari di €5610927.18 e del 'SUPERSTORE 13' pari di €4579633.73 . Il margine percentuale per punto vendita , dei primi due punti vendita , nel 2020 è stato del 'SUPERSTORE 01' pari del 31.27% e del 'SUPERSTORE 13' pari del 29.33% ."}

In [35]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 4 punti vendita , nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 4 punti vendita , nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Als

{'query': 'Elenca il margine per punto vendita , dei primi 4 punti vendita , nel 2021',
 'result': 'Ecco il margine per punto vendita , dei primi 4 punti vendita , nel 2021:\n                     1)Punto vendita:SUPERSTORE 01 , Margine:7486268.408640755 , Margine percentuale:34,41%.\n                     2)Punto vendita:SUPERSTORE 04 , Margine:5923760.2914866265 , Margine percentuale:32,98%.\n                     3)Punto vendita:IPERSTORE 03 , Margine:5197053.379953511 , Margine percentuale:33,81%.\n                     4)Punto vendita:IPERSTORE 01 , Margine:5093798.8159377035 , Margine percentuale:29,15%.'}

In [91]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that d

{'query': 'Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020',
 'result': 'Ecco il margine per punto vendita , dei primi 2 punti vendita , in data 7 Settembre 2020:\n                     1)Punto vendita:SUPERSTORE 01 , Margine:15400.038950255586 , Margine percentuale:33,81%.\n                     2)Punto vendita:IPERSTORE 03 , Margine:12468.405150869175 , Margine percentuale:34,09%.'}

In [97]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 4 punti vendita , in data 27 Marzo 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 4 punti vendita , in data 27 Marzo 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do n

{'query': 'Elenca il margine per punto vendita , dei primi 4 punti vendita , in data 27 Marzo 2021',
 'result': 'Il margine per punto vendita , dei primi 4 punti vendita , il giorno 27 Marzo 2021 sono: SUPERSTORE 01: €35254.52391089615 con un margine del %3257168705941095; SUPERSTORE 04: €27466.069197257206 con un margine del %29543950889643844; IPERSTORE 01: €26816.102544417157 con un margine del %25952153357273244; IPERSTORE 03: €25764.221297300242 con un margine del %3026503924306648.'}

In [95]:
fewshot_chain.invoke("Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 23 Gennaio 2021") #NGRAM THRESHOLD 0.15



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 23 Gennaio 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do

{'query': 'Elenca il margine per punto vendita , dei primi 2 punti vendita , in data 23 Gennaio 2021',
 'result': 'Ecco il margine per punto vendita , dei primi 2 punti vendita , in data 23 Gennaio 2021:\n                     1)Punto vendita:SUPERSTORE 01 , Margine:29190.170144012343 , Margine percentuale:31,59%.\n                     2)Punto vendita:SUPERSTORE 04 , Margine:24991.21715436942 , Margine percentuale:30,38%.'}

In [100]:
fewshot_chain.invoke("Quale è il punto vendita , con il maggior margine per punto vendita , nel 2021?") #NGRAM THRESHOLD 0.15



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita , con il maggior margine per punto vendita , nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist

{'query': 'Quale è il punto vendita , con il maggior margine per punto vendita , nel 2021?',
 'result': 'Il punto vendita con il maggior margine per punto vendita nel 2021 è il SUPERSTORE 01 con un margine di €7486268.408640737 e un margine percentuale del €0.3441297292816654.'}

In [118]:
fewshot_chain.invoke("Quale è il punto vendita , con il maggior margine per punto vendita , nel mese di Aprile 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita , con il maggior margine per punto vendita , nel mese di Aprile 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': 'Quale è il punto vendita , con il maggior margine per punto vendita , nel mese di Aprile 2020?',
 'result': 'Il punto vendita con il maggior margine per punto vendita nel mese di Aprile 2020 è il "SUPERSTORE 01" con un margine del 32.09% e un margine assoluto di €427777.90.'}

In [127]:
fewshot_chain.invoke("Quale è il punto vendita ,con il maggior margine per punto vendita , in data 3 Gennaio 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita ,con il maggior margine per punto vendita , in data 3 Gennaio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that

{'query': 'Quale è il punto vendita ,con il maggior margine per punto vendita , in data 3 Gennaio 2021?',
 'result': 'Il punto vendita con il maggior margine per punto vendita , il giorno 3 Gennaio 2021 è IPERSTORE 03 con un margine del 32.30%.'}

In [136]:
fewshot_chain.invoke("Quale è il margine del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': "Quale è il margine del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?",
 'result': "Il margine del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020 è 2636.0942917376574 euro."}

In [137]:
fewshot_chain.invoke("Quale è il margine  e il margine in percentuale del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine  e il margine in percentuale del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query fo

{'query': "Quale è il margine  e il margine in percentuale del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020?",
 'result': "Il margine del punto vendita 'SUPERMARKET 04' in data 15 Luglio 2020 è 2636.0942917376574 e il margine in percentuale è 29.97558465373132%"}

# *TEST MARGINE - INSEGNA*

In [78]:
fewshot_chain.invoke("Elenca il margine per insegna , di tutte le insegne , nel mese di Luglio 2020") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per insegna , di tutte le insegne , nel mese di Luglio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

{'query': 'Elenca il margine per insegna , di tutte le insegne , nel mese di Luglio 2020',
 'result': 'Ecco il margine per insegna , di tutte le insegne , nel mese di Luglio 2020:\n                     1)Insegna:SUPERSTORE , Margine:4166644.5094049424.\n                     2)Insegna:IPERSTORE , Margine:1323487.7565325552.\n                     3)Insegna:SUPERMARKET , Margine:1007546.6972521554.'}

In [97]:
fewshot_chain.invoke("Elenca il margine per insegna di tutte le insegne in data 30 Gennaio 2020") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per insegna di tutte le insegne in data 30 Gennaio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also

{'query': 'Elenca il margine per insegna di tutte le insegne in data 30 Gennaio 2020',
 'result': 'Ecco il margine per insegna di tutte le insegne nel data 30 Gennaio 2020:\n                     1)Insegna:SUPERSTORE , Valore venduto:394888.41952182085 , Margine:281406.29920000253.\n                     2)Insegna:IPERSTORE , Valore venduto:115180.66275877129 , Margine:81431.76245049854.\n                     3)Insegna:SUPERMARKET , Valore venduto:113206.08714700733 , Margine:80262.53595250623.'}

In [251]:
fewshot_chain.invoke("Elenca il margine per insegna di tutte le insegne nel 2021") #SEMANTIC SIMILARITY k=4



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per insegna di tutte le insegne nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention

{'query': 'Elenca il margine per insegna di tutte le insegne nel 2021',
 'result': 'Ecco il margine per insegna di tutte le insegne nel 2021:\n                     1)Insegna:SUPERSTORE , Margine:58302635.78640881 , Margine percentuale:30,84%.\n                     2)Insegna:IPERSTORE , Margine:18333422.13902795 , Margine percentuale:30,68%.\n                     3)Insegna:SUPERMARKET , Margine:11323054.69705472 , Margine percentuale:29,97%.'}

In [106]:
fewshot_chain.invoke("Elenca il margine per insegna di tutte le insegne nel mese di Luglio 2020") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per insegna di tutte le insegne nel mese di Luglio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also

{'query': 'Elenca il margine per insegna di tutte le insegne nel mese di Luglio 2020',
 'result': 'Ecco il margine per insegna di tutte le insegne nel mese di Luglio 2020:\n                     1)Insegna:SUPERSTORE , Margine:4166644.509404041.\n                     2)Insegna:IPERSTORE , Margine:1323487.756532574.\n                     3)Insegna:SUPERMARKET , Margine:1007546.6972521303.'}

In [119]:
fewshot_chain.invoke("Quale è il margine per insegna , dell'insegna 'IPERSTORE', nel 2020?") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine per insegna , dell'insegna 'IPERSTORE', nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': "Quale è il margine per insegna , dell'insegna 'IPERSTORE', nel 2020?",
 'result': "Il margine per l'insegna 'IPERSTORE' nel 2020 è di: 15532729.379261088 €."}

In [123]:
fewshot_chain.invoke("Quale è il margine  e il margine in percentuale dell'insegna 'IPERSTORE' nel 2020?") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine  e il margine in percentuale dell'insegna 'IPERSTORE' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': "Quale è il margine  e il margine in percentuale dell'insegna 'IPERSTORE' nel 2020?",
 'result': "Il margine dell'insegna 'IPERSTORE' nel 2020 è di 15532729.379261082 e il margine in percentuale è del 29,28%."}

In [146]:
fewshot_chain.invoke("Quale insegna ha il maggior margine nel mese di Giugno 2021?") #SEMANTIC SIMILARITY



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha il maggior margine nel mese di Giugno 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attenti

{'query': 'Quale insegna ha il maggior margine nel mese di Giugno 2021?',
 'result': "Il maggior margine per l'insegna IPERSTORE nel mese di Giugno 2021 è di 1453120.2743659243 e il margine percentuale è del 31,26%."}

# *TEST MARGINE - REPARTO*

In [154]:
fewshot_chain.invoke("Elenca il margine per reparto dei primi 3 reparti, del punto vendita 'SUPERSTORE 03', nel mese di Marzo 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per reparto dei primi 3 reparti, del punto vendita 'SUPERSTORE 03', nel mese di Marzo 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query 

{'query': "Elenca il margine per reparto dei primi 3 reparti, del punto vendita 'SUPERSTORE 03', nel mese di Marzo 2021",
 'result': "Ecco il margine per reparto dei primi 3 reparti , del punto vendita 'SUPERSTORE 03', nel mese di Marzo 2021:\n                     1)Reparto:Grocery , Margine:90496.643870079.\n                     2)Reparto:Fresh , Margine:59826.416219249586.\n                     3)Reparto:Beverages , Margine:21420.189262085638."}

In [175]:
fewshot_chain.invoke("Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti , del punto vendita 'IPERSTORE 03', nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti , del punto vendita 'IPERSTORE 03', nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be carefu

{'query': "Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti , del punto vendita 'IPERSTORE 03', nel 2021",
 'result': "Il margine per reparto e il margine percentuale dei primi tre reparti del punto vendita 'IPERSTORE 03' nel 2021 sono: Grocery: €1155527.790981416 (30.926015432278614%), Fresh: €1063637.7269435602 (33.51857150647922%), Fish: €690184.4490925625 (71.5300839557147%)."}

In [176]:
fewshot_chain.invoke("Elenca il margine per reparto e il margine in percentuale dei primi 3 reparti del punto vendita 'IPERSTORE 03' nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per reparto e il margine in percentuale dei primi 3 reparti del punto vendita 'IPERSTORE 03' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to

{'query': "Elenca il margine per reparto e il margine in percentuale dei primi 3 reparti del punto vendita 'IPERSTORE 03' nel 2021",
 'result': "Il margine per reparto è il seguente: 'Grocery': €1155527.7909814087; 'Fresh': €1063637.7269435427; 'Fish': €690184.449092566. Il margine percentuale dei primi tre reparti è il seguente: 'Grocery': 30.9260154322811%; 'Fresh': 33.5185715064792%; 'Fish': 71.53008395571486%."}

In [178]:
fewshot_chain.invoke("Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti, del punto vendita 'IPERSTORE 03', in data 17 Ottobre 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti, del punto vendita 'IPERSTORE 03', in data 17 Ottobre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables be

{'query': "Elenca il margine per reparto e il margine in percentuale, dei primi 3 reparti, del punto vendita 'IPERSTORE 03', in data 17 Ottobre 2020",
 'result': "Il margine per reparto del punto vendita 'IPERSTORE 03' il giorno 17 Ottobre 2020 è il seguente: Grocery: €4084.5189981789035 (31.17098754991368%) Fresh: €3955.995195366574 (33.6641895614476%) Fish: €1790.0173104207431 (62.57975131693276%)"}

In [186]:
fewshot_chain.invoke("Elenca il margine per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 03' in data 14 Aprile 2021") #NGRAM 0.1



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 03' in data 14 Aprile 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query f

{'query': "Elenca il margine per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 03' in data 14 Aprile 2021",
 'result': "Ecco il margine per reparto dei primi 3 reparti del punto vendita 'SUPERMARKET 03' in data 14 Aprile 2021:\n                     1)Reparto:Grocery , Margine:491.8794823300578.\n                     2)Reparto:Fresh , Margine:460.1211032109086.\n                     3)Reparto:Meats , Margine:227.80074800215965."}

In [228]:
fewshot_chain.invoke("Elenca il margine in percentuale, dei primi 3 reparti ,del punto vendita 'IPERSTORE 03', nel mese di Luglio 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine in percentuale, dei primi 3 reparti ,del punto vendita 'IPERSTORE 03', nel mese di Luglio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not qu

{'query': "Elenca il margine in percentuale, dei primi 3 reparti ,del punto vendita 'IPERSTORE 03', nel mese di Luglio 2020",
 'result': "Ecco il margine percentuale dei primi tre reparti del punto vendita 'IPERSTORE 03', nel mese di Luglio 2020:\n                     1)Reparto:Fresh , Margine percentuale:33%.\n                     2)Reparto:Grocery , Margine percentuale:34%.\n                     3)Reparto:Fish , Margine percentuale:63%."}

In [232]:
fewshot_chain.invoke("Elenca il margine dei primi 4 reparti del punto vendita 'SUPERMARKET 07', nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine dei primi 4 reparti del punto vendita 'SUPERMARKET 07', nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': "Elenca il margine dei primi 4 reparti del punto vendita 'SUPERMARKET 07', nel 2020",
 'result': "Ecco il margine dei primi 4 reparti del punto vendita 'SUPERMARKET 07', nel 2020:\n                     1)Reparto:Fresh , Margine:112833.82624053003 .\n                     2)Reparto:Grocery , Margine:99822.74204326147 .\n                     3)Reparto:Meats , Margine:43012.50149394913 .\n                     4)Reparto:Beverages , Margine:30938.068381189347 ."}

In [235]:
fewshot_chain.invoke("Elenca il margine e il margine in percentuale, dei primi 4 reparti del punto vendita 'SUPERMARKET 07' nel 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il margine e il margine in percentuale, dei primi 4 reparti del punto vendita 'SUPERMARKET 07' nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not quer

{'query': "Elenca il margine e il margine in percentuale, dei primi 4 reparti del punto vendita 'SUPERMARKET 07' nel 2020",
 'result': "Ecco il margine e il margine in percentuale , dei primi 4 reparti del punto vendita 'SUPERMARKET 07' nel 2020:\n                     1)Reparto:Fresh , Margine:112833.82624053003 , Margine percentuale:0.29455842730568793%.\n                     2)Reparto:Grocery , Margine:99822.74204326126 , Margine percentuale:0.26894608246751794%.\n                     3)Reparto:Meats , Margine:43012.501493949145 , Margine percentuale:0.2981528818869092%.\n                     4)Reparto:Beverages , Margine:30938.068381189278 , Margine percentuale:0.2328224186300246%."}

In [239]:
fewshot_chain.invoke("Quale è il reparto con il maggior margine del punto vendita 'SUPERSTORE 02' nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con il maggior margine del punto vendita 'SUPERSTORE 02' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not

{'query': "Quale è il reparto con il maggior margine del punto vendita 'SUPERSTORE 02' nel 2020?",
 'result': "Il reparto con il maggior margine del punto vendita 'SUPERSTORE 02' nel 2020 è 'Fresh' con margine di 1006024.7695189419€."}

In [241]:
fewshot_chain.invoke("Quale è il reparto con il minor margine del punto vendita 'SUPERSTORE 02', in data 30 Settembre 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con il minor margine del punto vendita 'SUPERSTORE 02', in data 30 Settembre 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for col

{'query': "Quale è il reparto con il minor margine del punto vendita 'SUPERSTORE 02', in data 30 Settembre 2021?",
 'result': "Il reparto con il minor margine del punto vendita 'SUPERSTORE 02', in data 30 Settembre 2021 è 'Fresh'."}

In [245]:
fewshot_chain.invoke("Quale è il reparto con il minor margine ,del punto vendita 'SUPERSTORE 02' nel mese di Ottobre 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il reparto con il minor margine ,del punto vendita 'SUPERSTORE 02' nel mese di Ottobre 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

 SELECT descr_liv1 AS reparto , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine FROM view_pv_tabellone WHERE data_format_date >= '2021-10-01' AND data_format_date <= '2021-10-31' AND rag_soc LIKE '%SUPERSTORE%02%' GROUP BY descr_liv1 ORDER BY margine ASC LIMIT 1;
[1m> Finished chain.[0m
[32;1m[1;3mSELECT descr_liv1 AS reparto , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine FROM view_pv_tabellone WHERE data_format_date >= '2021-10-01' AND data_format_date <= '2021-10-31' AND rag_soc LIKE '%SUPERSTORE%02%' GROUP BY descr_liv1 ORDER BY margine ASC LIMIT 1;[0m
SQLResult: [33;1m[1;3m[('Consumables', -408.8831475409847)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language t

{'query': "Quale è il reparto con il minor margine ,del punto vendita 'SUPERSTORE 02' nel mese di Ottobre 2021?",
 'result': "Il reparto con il minor margine ,del punto vendita 'SUPERSTORE 02' nel mese di Ottobre 2021 è 'Consumables'. Margine: -408.8831475409847."}

In [259]:
fewshot_chain.invoke("Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' , nel 2020?") #SEM SIM K=4



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' , nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do no

{'query': "Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' , nel 2020?",
 'result': "Non ho trovato nessun prodotto con tale corrispondenza nella tabella view_pv_tabellone per il reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' , nel data '2020'."}

In [267]:
fewshot_chain.invoke("Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' nel 2020?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not 

{'query': "Quale è il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' nel 2020?",
 'result': "Il margine del reparto 'Fresh' , del punto vendita 'SUPERSTORE 03' nel 2020 è di: €695290.1893768383."}

In [269]:
fewshot_chain.invoke("Quale è il margine del reparto 'Fresh' , del punto vendita 'IPERSTORE 04' nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il margine del reparto 'Fresh' , del punto vendita 'IPERSTORE 04' nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not e

{'query': "Quale è il margine del reparto 'Fresh' , del punto vendita 'IPERSTORE 04' nel 2021?",
 'result': "Il margine del reparto 'Fresh' , del punto vendita 'IPERSTORE 04' nel 2021 è di 781642.3627929525 € e il valore totale delle vendite è di 2391532.6890262747 € e il costo totale netto è di 1609890.3262333223 €."}

# *TEST INCIDENZA OFFERTE - PUNTI VENDITA*

In [278]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita nel 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not

{'query': "Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita nel 2021",
 'result': "Ecco l'incidenza delle offerte per punto vendita dei primi 3 punti vendita nel 2021:\n                     1)Punto vendita:SUPERMARKET 09, Incidenza offerte:0.4281937149601795, Totale offerte non offerte:2597325.718905089.\n                     2)Punto vendita:SUPERMARKET 10, Incidenza offerte:0.4056609388324028, Totale offerte non offerte:2463798.7093513412.\n                     3)Punto vendita:SUPERMARKET 07, Incidenza offerte:0.38585967081093814, Totale offerte non offerte:1187772.4217020017."}

In [281]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita nel mese di Dicembre 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita nel mese di Dicembre 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for c

{'query': "Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita nel mese di Dicembre 2021",
 'result': "Ecco l'incidenza delle offerte per punto vendita , dei primi 2 punti vendita nel mese di Dicembre 2021:\n                     1)Punto vendita:SUPERMARKET 09, Incidenza offerte:0.71021520391425.\n                     2)Punto vendita:SUPERMARKET 10, Incidenza offerte:0.6447857447465203."}

In [29]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for column

{'query': "Elenca l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021",
 'result': "Ecco l'incidenza delle offerte per punto vendita dei primi 3 punti vendita in data 22 Marzo 2021:\n                     1)Punto vendita:SUPERSTORE 01, Incidenza offerte:0.17550076609293033.\n                     2)Punto vendita:SUPERSTORE 04, Incidenza offerte:0.20940227456889132.\n                     3)Punto vendita:IPERSTORE 02, Incidenza offerte:0.25801994136291945."}

In [35]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita, in data 3 Giugno 2021")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita, in data 3 Giugno 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colu

 SELECT rag_soc AS punto_vendita , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210603 GROUP BY rag_soc ORDER BY incidenza_offerte DESC LIMIT 2;
[1m> Finished chain.[0m
[32;1m[1;3mSELECT rag_soc AS punto_vendita , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210603 GROUP BY rag_soc ORDER BY incidenza_offerte DESC LIMIT 2;[0m
SQLResult: [33;1m[1;3m[('SUPERMARKET 07', 0.4090469575562905), ('SUPERMARKET 10', 0.40560255928907085)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT cla

{'query': "Elenca l'incidenza delle offerte per punto vendita, dei primi 2 punti vendita, in data 3 Giugno 2021",
 'result': "La percentuale di incidenza delle offerte per i primi due punti vendita 'SUPERMARKET 07' e 'SUPERMARKET 10' nel data 3 Giugno 2021 è del 40%."}

In [36]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per punto vendita dei primi 2 punti vendita in data 3 Giugno 2021") #SENZA LE VIRGOLE SBALLA COMPLETAMENTE LA QUERY



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per punto vendita dei primi 2 punti vendita in data 3 Giugno 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for column

{'query': "Elenca l'incidenza delle offerte per punto vendita dei primi 2 punti vendita in data 3 Giugno 2021",
 'result': "Ecco l'incidenza delle offerte per punto vendita dei primi due punti vendita in data 3 Giugno 2021:\n                     1)Punto vendita:SUPERSTORE 04; Incidenza offerte:4986;\n                     2)Punto vendita:SUPERSTORE 01; Incidenza offerte:6238;"}

In [51]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte del punto vendita 'SUPERMARKET 07' nel mese di Maggio 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte del punto vendita 'SUPERMARKET 07' nel mese di Maggio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns tha

{'query': "Quale è l'incidenza delle offerte del punto vendita 'SUPERMARKET 07' nel mese di Maggio 2020?",
 'result': "L'incidenza delle offerte del punto vendita 'SUPERMARKET 07' nel mese di Maggio 2020 è del 37,58%."}

In [53]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. A

{'query': "Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' nel 2021?",
 'result': "L'incidenza delle offerte del punto vendita 'IPERSTORE 04' nel 2021 è del 24,97%."}

In [54]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' in data 4 Novembre 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' in data 4 Novembre 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that 

{'query': "Quale è l'incidenza delle offerte del punto vendita 'IPERSTORE 04' in data 4 Novembre 2021?",
 'result': "L'incidenza delle offerte del punto vendita 'IPERSTORE 04' in data 4 Novembre 2021 è del 24,95%."}

In [230]:
fewshot_chain.invoke("Quale punto vendita ha la maggior incidenza delle offerte nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la maggior incidenza delle offerte nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay 

{'query': 'Quale punto vendita ha la maggior incidenza delle offerte nel 2020?',
 'result': "Il punto vendita con la maggior incidenza delle offerte nel 2020 è il punto vendita 'SUPERMARKET 09' e la sua incidenza delle offerte è il 41%."}

In [254]:
fewshot_chain.invoke("Quale punto vendita ha la maggior incidenza delle offerte nel mese di Luglio 2020?") #NGRAM 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Quale punto vendita ha la maggior incidenza delle offerte nel mese di Luglio 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not ex

{'query': 'Quale punto vendita ha la maggior incidenza delle offerte nel mese di Luglio 2020?',
 'result': "Il punto vendita con la maggior incidenza delle offerte nel mese di Luglio 2020 è il punto vendita 'SUPERMARKET 09' e l'incidenza delle offerte è il 47%."}

# *TEST INCIDENZA OFFERTE - INSEGNA*

In [64]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': "Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2020?",
 'result': "L'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2020 è del 26,46%."}

In [72]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 13 Giugno 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 13 Giugno 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not e

LECT SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210613 AND descr_cat LIKE '%SUPERSTORE%';
[1m> Finished chain.[0m
[32;1m[1;3mSELECT SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc = 20210613 AND descr_cat LIKE '%SUPERSTORE%';[0m
SQLResult: [33;1m[1;3m[(0.23738857900016888,)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query o

{'query': "Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 13 Giugno 2021?",
 'result': "L'incidenza delle offerte dell'insegna 'SUPERSTORE' in data 13 Giugno 2021 è del 23,73%"}

In [82]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE', nel mese di Ottobre 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE', nel mese di Ottobre 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do no

{'query': "Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE', nel mese di Ottobre 2021?",
 'result': "L'incidenza delle offerte dell'insegna 'SUPERSTORE' nel mese di Ottobre 2021 è del 25%."}

In [84]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2021?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

{'query': "Quale è l'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2021?",
 'result': "L'incidenza delle offerte dell'insegna 'SUPERSTORE' nel 2021 è del 25,85%."}

In [175]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per insegna nel 2020") #NGRAM THRESHOLD 0.01



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per insegna nel 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to w

{'query': "Elenca l'incidenza delle offerte per insegna nel 2020",
 'result': 'Ecco il valore venduto per insegna nel mese di Gennaio 2020:\n                     1)Insegna:SUPERMARKET , Incidenza offerte:31,43%.\n                     2)Insegna:IPERSTORE , Incidenza offerte:26,97%.\n                     3)Insegna:SUPERMARKET , Incidenza offerte:26,46%.'}

In [177]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per insegna, nel mese di Maggio 2020") #NGRAM THRESHOLD 0.01



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per insegna, nel mese di Maggio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pa

 SELECT descr_cat AS insegna , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc >= 20200501 AND data_doc <= 20200531 GROUP BY descr_cat ORDER BY incidenza_offerte DESC;
[1m> Finished chain.[0m
[32;1m[1;3mSELECT descr_cat AS insegna , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc >= 20200501 AND data_doc <= 20200531 GROUP BY descr_cat ORDER BY incidenza_offerte DESC;[0m
SQLResult: [33;1m[1;3m[('SUPERMARKET', 0.2975532811735882), ('IPERSTORE', 0.2528561242666165), ('SUPERSTORE', 0.23992344238356592)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of example

{'query': "Elenca l'incidenza delle offerte per insegna, nel mese di Maggio 2020",
 'result': "Ecco l'incidenza delle offerte per insegna nel mese di Maggio 2020:\n                     1)Insegna:SUPERMARKET , Incidenza offerte:0.2975532811735882.\n                     2)Insegna:IPERSTORE , Incidenza offerte:0.2528561242666165.\n                     3)Insegna:SUPERMARKET , Incidenza offerte:0.23992344238356592."}

In [178]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per insegna nel mese di Maggio 2020") #NGRAM THRESHOLD 0.01 #SENZA LA VIRGOLA SBALLA LA QUERY



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per insegna nel mese di Maggio 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': "Elenca l'incidenza delle offerte per insegna nel mese di Maggio 2020",
 'result': "L'incidenza delle offerte per insegna nel mese di Maggio 2020 è: SUPERSTORE:1.9186407459942407%."}

In [204]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per insegna, in data 20 Agosto 2021") #NGRAM 0.01



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per insegna, in data 20 Agosto 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay

{'query': "Elenca l'incidenza delle offerte per insegna, in data 20 Agosto 2021",
 'result': "Ecco l'incidenza delle offerte per insegna, in data 20 Agosto 2021:\n                     1)Insegna:SUPERMARKET , Incidenza offerte:0.35140639274426627.\n                     2)Insegna:IPERSTORE , Incidenza offerte:0.28411061693345463.\n                     3)Insegna:SUPERSTORE , Incidenza offerte:0.2743375789820932."}

In [214]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per insegna in data 20 Agosto 2021") #ngram 0.01



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per insegna in data 20 Agosto 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay 

{'query': "Elenca l'incidenza delle offerte per insegna in data 20 Agosto 2021",
 'result': "L'incidenza delle offerte per l'insegna 'IPERSTORE' in data '20 Agosto 2021' è del 63,72%. L'incidenza delle offerte per l'insegna 'SUPERSTORE' in data '20 Agosto 2021' è del 63,50%. L'incidenza delle offerte per l'insegna 'SUPERMARKET' in data '20 Agosto 2021' è del 61,94%."}

In [222]:
fewshot_chain.invoke("Quale è l'insegna con la maggior incidenza delle offerte nel 2020?")



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'insegna con la maggior incidenza delle offerte nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay a

{'query': "Quale è l'insegna con la maggior incidenza delle offerte nel 2020?",
 'result': "La maggior incidenza delle offerte nel 2020 è stata registrata per l'insegna 'Insegna1'."}

In [266]:
fewshot_chain.invoke("Quale insegna ha la maggior incidenza delle offerte in data 14 Giugno 2021?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha la maggior incidenza delle offerte in data 14 Giugno 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Al

{'query': 'Quale insegna ha la maggior incidenza delle offerte in data 14 Giugno 2021?',
 'result': "L'insegna con la maggior incidenza delle offerte il giorno 14 Giugno 2021 è il punto vendita 'SUPERMARKET' e l'incidenza delle offerte è del 30%."}

In [267]:
fewshot_chain.invoke("Quale insegna ha la maggior incidenza delle offerte nel 2020?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha la maggior incidenza delle offerte nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attent

{'query': 'Quale insegna ha la maggior incidenza delle offerte nel 2020?',
 'result': "L'insegna con la maggior incidenza delle offerte nel 2020 è 'SUPERMARKET' e l'incidenza delle offerte è del 31%."}

In [269]:
fewshot_chain.invoke("Quale insegna ha la maggior incidenza delle offerte, nel mese di Aprile 2021?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha la maggior incidenza delle offerte, nel mese di Aprile 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. 

 SELECT descr_cat AS insegna , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc >= '20210401' AND data_doc <= '20210430' GROUP BY descr_cat ORDER BY incidenza_offerte DESC LIMIT 1;
[1m> Finished chain.[0m
[32;1m[1;3mSELECT descr_cat AS insegna , SUM(val_off) / SUM(val_off + val_non_off) AS incidenza_offerte FROM view_pv_tabellone WHERE data_doc >= '20210401' AND data_doc <= '20210430' GROUP BY descr_cat ORDER BY incidenza_offerte DESC LIMIT 1;[0m
SQLResult: [33;1m[1;3m[('SUPERMARKET', 0.333029947860885)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using th

{'query': 'Quale insegna ha la maggior incidenza delle offerte, nel mese di Aprile 2021?',
 'result': "L'insegna 'SUPERMARKET' ha la maggior incidenza delle offerte nel mese di Aprile 2021 con una incidenza del 33%."}

In [270]:
fewshot_chain.invoke("Quale insegna ha la maggior incidenza delle offerte nel mese di Aprile 2021?") #NGRAM 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale insegna ha la maggior incidenza delle offerte nel mese di Aprile 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. A

DatabaseException: Orig exception: Code: 43, e.displayText() = DB::Exception: Illegal type Date of argument of function like: While processing data_format_date LIKE '%2021-04%' (version 21.6.5.37 (official build))


# *TEST INCIDENZA OFFERTE - REPARTO*

In [47]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte del reparto 'Grocery' del punto vendita 'SUPERSTORE 04' nel 2020?") #ngram 0.03 o 0.05



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte del reparto 'Grocery' del punto vendita 'SUPERSTORE 04' nel 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for colum

{'query': "Quale è l'incidenza delle offerte del reparto 'Grocery' del punto vendita 'SUPERSTORE 04' nel 2020?",
 'result': "L'incidenza delle offerte del reparto 'Grocery' del punto vendita 'SUPERSTORE 04' nel 2020 è del 27%."}

In [60]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte, del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' nel mese di Maggio 2021?") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte, del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' nel mese di Maggio 2021?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not q

{'query': "Quale è l'incidenza delle offerte, del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' nel mese di Maggio 2021?",
 'result': "L'incidenza delle offerte del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' nel mese di Maggio 2021 è del 26,60%."}

In [61]:
fewshot_chain.invoke("Quale è l'incidenza delle offerte del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' in data 14 Novembre 2020?") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Quale è l'incidenza delle offerte del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' in data 14 Novembre 2020?
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not q

{'query': "Quale è l'incidenza delle offerte del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' in data 14 Novembre 2020?",
 'result': "L'incidenza delle offerte del reparto 'Fresh' del punto vendita 'SUPERSTORE 04' in data 14 Novembre 2020 è del 30%."}

In [62]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel 2021") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query fo

DatabaseException: Orig exception: Code: 53, e.displayText() = DB::Exception: Cannot convert string 2021-01-01 to type Int32: while executing 'FUNCTION greaterOrEquals(data_doc : 0, '2021-01-01' : 2) -> greaterOrEquals(data_doc, '2021-01-01') UInt8 : 5' (version 21.6.5.37 (official build))


In [63]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 2021") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query f

{'query': "Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 2021",
 'result': "Ecco l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 2021:\n                     1)Reparto:Cold , Incidenza delle offerte:0.40839971080274023.\n                     2)Reparto:Beverages , Incidenza delle offerte:0.40199287011502205.\n                     3)Reparto:Grocery , Incidenza delle offerte:0.328127493714984."}

In [70]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel Giugno 2020") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel Giugno 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not q

{'query': "Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel Giugno 2020",
 'result': "L'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' nel Giugno 2020 è: Cold: 0,5043492056744031; Beverages: 0,4562656201120625; Home Care: 0,38939385655643116)."}

In [72]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 5 Agosto 2021") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 5 Agosto 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to no

{'query': "Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel 5 Agosto 2021",
 'result': "Ecco l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01', nel mese di Agosto 2021:\n                     1)Reparto:Cold , Incidenza delle offerte:0.3988573144414039%.\n                     2)Reparto:Beverages , Incidenza delle offerte:0.38108595332749917%.\n                     3)Reparto:Home Care , Incidenza delle offerte:0.326437953932838%."}

In [74]:
fewshot_chain.invoke("Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 5 Agosto 2021") #ngram 0.07



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 5 Agosto 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to

{'query': "Elenca l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 5 Agosto 2021",
 'result': "Ecco l'incidenza delle offerte per reparto dei primi 3 reparti del punto vendita 'IPERSTORE 01' in data 5 Agosto 2021:\n                     1)Reparto:Cold , Incidenza delle offerte:0.3988573144414039%.\n                     2)Reparto:Beverages , Incidenza delle offerte:0.38108595332749917%.\n                     3)Reparto:Home Care , Incidenza delle offerte:0.326437953932838%."}

# *TEST CON DIVERSI VALORI*

In [259]:
fewshot_chain.invoke("Elenca il valore venduto e il margine per insegna nel 2021") #NGRAM THRESHOLD 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto e il margine per insegna nel 2021
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention

{'query': 'Elenca il valore venduto e il margine per insegna nel 2021',
 'result': "Il valore venduto per l'insegna 'SUPERSTORE' nel 2021 è di €189037422.07520562; il margine per l'insegna 'SUPERSTORE' nel 2021 è del €58302635.78639908; il valore venduto per l'insegna 'IPERSTORE' nel 2021 è di €59757008.3630954; il margine per l'insegna 'IPERSTORE' nel 2021 è del €18333422.139079213; il valore venduto per l'insegna 'SUPERMARKET' nel 2021 è di €37784212.268574096; il margine per l'insegna 'SUPERMARKET' nel 2021 è del €11323054.697079662."}

In [21]:
fewshot_chain.invoke("Elenca il valore venduto e il margine per insegna nel mese di Ottobre 2020") #NGRAM 0.03



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto e il margine per insegna nel mese di Ottobre 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Als

 SELECT descr_cat AS insegna , SUM(val_off + val_non_off) AS valore_venduto , SUM(val_off + val_non_off) - SUM(costo_nettissimo_off + costo_nettissimo_no_off) AS margine FROM view_pv_tabellone WHERE data_doc >= 20201001 AND data_doc <= 20201031 GROUP BY descr_cat ORDER BY margine DESC;
[1m> Finished chain.[0m
[32;1m[1;3mSELECT descr_cat AS insegna , SUM(val_off + val_non_off) AS valore_venduto , SUM(val_off + val_non_off) - SUM(costo_nettissimo_off + costo_nettissimo_no_off) AS margine FROM view_pv_tabellone WHERE data_doc >= 20201001 AND data_doc <= 20201031 GROUP BY descr_cat ORDER BY margine DESC;[0m
SQLResult: [33;1m[1;3m[('SUPERSTORE', 15322959.882664353, 4455185.8535737395), ('IPERSTORE', 4748374.986499963, 1385716.0324106822), ('SUPERMARKET', 3616950.532863614, 1060620.3392008287)][0m
Answer:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHous

{'query': 'Elenca il valore venduto e il margine per insegna nel mese di Ottobre 2020',
 'result': 'Ecco il valore venduto e il margine per insegna nel mese di Ottobre 2020:\n                     1)Insegna:SUPERSTORE , Valore venduto:15322959.882664353 , Margine:4455185.8535737395 .\n                     2)Insegna:IPERSTORE , Valore venduto:4748374.986499963 , Margine:1385716.0324106822 .\n                     3)Insegna:SUPERMARKET , Valore venduto:3616950.532863614 , Margine:1060620.3392008287 .'}

In [40]:
fewshot_chain.invoke("Elenca il valore venduto e il margine per insegna, di tutte le insegne, in data 15 Aprile 2020")



[1m> Entering new SQLDatabaseChain chain...[0m
Elenca il valore venduto e il margine per insegna, di tutte le insegne, in data 15 Aprile 2020
SQLQuery:

[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m
You are a ClickHouse expert. Given an input question, first create a syntactically correct ClickHouse query to run, then look at the results of the query and return the answer in Italian language to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most 5 results using the LIMIT clause as per ClickHouse. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns th

{'query': 'Elenca il valore venduto e il margine per insegna, di tutte le insegne, in data 15 Aprile 2020',
 'result': "La tabella restituisce i seguenti valori: ['SUPERSTORE', '437595.1025871639', '132266.23689455242'], ['IPERSTORE', '130173.96805402188', '38696.81882862109'], ['SUPERMARKET', '126581.4579414028', '36896.191253982135']"}

In [None]:
fewshot_chain.invoke("Elenca il valore venduto e il margine per insegna, di tutte le insegne, in data 15 Aprile 2020")

# *STREAMLIT APP*

In [37]:
!streamlit run app.py

[0m
[34m[1m  You can now view your Streamlit app in your browser.[0m
[0m
[34m  Local URL: [0m[1mhttp://localhost:8501[0m
[34m  Network URL: [0m[1mhttp://192.168.200.2:8501[0m
[0m
[34m[1m  For better performance, install the Watchdog module:[0m

  $ xcode-select --install
  $ pip install watchdog
            [0m

`from langchain_community.utilities import SQLDatabase`.

To install langchain-community run `pip install -U langchain-community`.


[1m> Entering new SQLDatabaseChain chain...[0m
Quale è il punto vendita con il maggior margine per punto vendita nel mese di Dicembre 2021?
SQLQuery: SELECT rag_soc AS punto_vendita , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) AS margine , SUM(val_off + val_non_off - costo_nettissimo_off - costo_nettissimo_no_off) / SUM(val_off + val_non_off) AS margine_percentuale FROM view_pv_tabellone WHERE data_doc >= 20211201 AND data_doc <= 20211231 GROUP BY rag_soc ORDER BY margine DESC LIMIT 1;[32;1m[1

Domande buone con threshold 0.07:
-Quale è il punto vendita con il maggior margine per punto vendita nel mese di Dicembre 2021?
-Quale è il punto vendita con il maggior valore venduto per punto vendita nel 2020?