In [44]:
import numpy as np
import openai
import pandas as pd
import json
from google.cloud import secretmanager
from google.cloud import storage
import faiss

In [32]:
def access_secret(secret_id):
    client = secretmanager.SecretManagerServiceClient()
    name = f"projects/1052202528756/secrets/{secret_id}/versions/latest"
    response = client.access_secret_version(request={"name": name})
    return response.payload.data.decode("UTF-8")

In [34]:
openai_client = openai.OpenAI(api_key = access_secret("OPENAI_API_KEY"))

In [65]:
# Create dataframe of information
with open("/Users/openstockltd/Documents/Chatbot/V2/Preprocessing V2/olivia_information_vectors.json") as f:
    data = json.load(f)

hyperparams = data["hyperparams"]

embedding_model = hyperparams["embedding_model"]
chat_model = hyperparams["chat_model"]

In [67]:
vector_db = pd.DataFrame(data['data'])

vector_db

Unnamed: 0,id,category,information_en,information_fr,information_it,media,vector_embedding
0,1,printers,How to Set a Static IP on a Receipt Printer:\n...,Comment configurer une adresse IP statique sur...,Come impostare un IP statico su una stampante ...,,"[0.005239351186901331, -0.014315578155219555, ..."
1,2,pricing,"Discount, tax and totals are calculated in the...","Les remises, les taxes et les totaux sont calc...","Sconti, imposte e totali vengono calcolati nel...",,"[-0.03406905382871628, 0.01699058525264263, -0..."
2,3,reports,Reporting Summary\n\nEach sale includes:\nTota...,Résumé du rapport\n\nChaque vente comprend :\n...,Riepilogo report\n\nOgni vendita include:\nTot...,,"[-0.006289031356573105, 0.0101417051628232, -0..."
3,4,printers,Olivia POS supports the following receipt prin...,Olivia POS prend en charge les imprimantes de ...,Olivia POS supporta le seguenti stampanti per ...,,"[-0.0025999024510383606, 0.01753482036292553, ..."
4,5,subscription,"To start a subscription with Olivia POS, pleas...","Pour souscrire un abonnement à Olivia POS, veu...","Per attivare un abbonamento a Olivia POS, acce...",,"[-0.03717361018061638, 0.025075510144233704, -..."
5,6,subscription,To manage or cancel your Olivia POS subscripti...,Pour gérer ou résilier votre abonnement Olivia...,Per gestire o cancellare il tuo abbonamento a ...,,"[-0.05112096294760704, 0.023105602711439133, -..."
6,7,floorplan,"To change your restaurant floorplans, please s...","Pour modifier les plans de votre restaurant, v...",Per modificare le planimetrie del tuo ristoran...,,"[-0.0219853688031435, -0.010387655347585678, -..."


## Embedding and FAISS Vector Search Handling

In [70]:
# Create matrix of information vectors
embedding_matrix = np.vstack(vector_db['vector_embedding'].values).astype('float32')

# Generate FAISS index
dim = embedding_matrix.shape[1]
index = faiss.IndexFlatIP(dim)
index.add(embedding_matrix)

In [82]:
def get_embedded_vector(text):
    '''
    Returns an array of the text embedded in vector space by chosen OpenAI model
    '''
    try:
        vector = openai_client.embeddings.create(input=text, model=embedding_model).data[0].embedding
        return vector
    except Exception as e:
        print(f"Embedding generation failed: {e}")
        raise

def get_confidence_and_indices(input_vector, k):
    '''
    Takes input vector (list).
    Finds 
    '''

    input_vector = np.array([input_vector], dtype=np.float32)

    # Find the cosine similarity of input with k
    cosine_similarities, indices = index.search(input_vector, k)

    return cosine_similarities, indices

## Single Input

In [133]:
user_input = "Come impostare un IP statico su una stampante per ricevute:\n1. Collegare la stampante alla rete utilizzando un cavo Ethernet.\n2. Stampare la configurazione di rete tenendo premuto il pulsante Feed mentre si accende la stampante. Rilasciare il pulsante quando inizia la stampa.\n3. Annotare l'indirizzo IP corrente dalla stampa.\n4. Aprire un browser e inserire l'indirizzo IP (ad esempio, http://192.168.1.100).\n5. Accedere all'interfaccia web (il nome utente/password predefiniti sono solitamente admin/admin o epson/epson). Se necessario, è possibile cercare i dettagli di accesso specifici per marca.\n6. Andare su Impostazioni di rete > TCP/IP.\n7. Modificare l'impostazione dell'indirizzo IP su Manuale o Statico.\n8. Immettere l'IP statico desiderato, la subnet mask (ad esempio 255.255.255.0) e il gateway (ad esempio 192.168.1.1; in genere è preferibile utilizzare l'indirizzo IP già assegnato alla stampante).\n9. Salvare e riavviare la stampante.\nAssicurarsi che l'IP impostato sia al di fuori dell'intervallo DHCP del router per evitare conflitti."

confidence, indices = (get_confidence_and_ids(get_embedded_vector(user_input), 5))

In [134]:
print(confidence)

print(vector_db.iloc[indices[0]]['information_en'])

[[0.8190708  0.40463892 0.17690106 0.16746755 0.16361283]]
0    How to Set a Static IP on a Receipt Printer:\n...
3    Olivia POS supports the following receipt prin...
4    To start a subscription with Olivia POS, pleas...
5    To manage or cancel your Olivia POS subscripti...
1    Discount, tax and totals are calculated in the...
Name: information_en, dtype: object


In [None]:
# 0.3 seems to be a good lowest confidence level, possible lower

## Full loop for testing

## Hybrid Search - Implementing keyword recognition