# Query de usuario, extraer transcripciones relevantes y respuesta de LLM.

In [None]:
import os
from langchain.llms import HuggingFaceHub
from langchain.embeddings import HuggingFaceBgeEmbeddings
from langchain.vectorstores import Pinecone as PineconeVectorStore
from pinecone import Pinecone  # ✅ Correct import for Pinecone
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory
from langchain.chains import RetrievalQA
from dotenv import load_dotenv

# ✅ Load environment variables
load_dotenv()

# ✅ Hugging Face API Key (Ensure it's set in your environment variables)
HUGGINGFACE_API_KEY = os.getenv("HUGGINGFACEHUB_API_TOKEN")
if not HUGGINGFACE_API_KEY:
    raise ValueError("❌ Missing Hugging Face API Key. Set it as HUGGINGFACEHUB_API_TOKEN")

# ✅ Load DeepSeek-R1 via API Inference
llm = HuggingFaceHub(
    repo_id="deepseek-ai/DeepSeek-R1",  # Model name
    model_kwargs={"temperature": 0.5, "max_length": 2048},
    huggingfacehub_api_token=HUGGINGFACE_API_KEY
)

# ✅ Initialize Pinecone Client
pinecone_client = Pinecone(api_key=os.getenv("PINECONE_API_KEY"))

# ✅ Ensure the new Pinecone index name is set
index_name = os.getenv("PINECONE_INDEX_V3")  # ✅ Updated to use the latest index
if not index_name:
    raise ValueError("❌ PINECONE_INDEX_V3 is not set. Check your .env file.")

# ✅ Ensure the index exists before using it
existing_indexes = [idx["name"] for idx in pinecone_client.list_indexes()]
if index_name not in existing_indexes:
    raise ValueError(f"❌ Index '{index_name}' does not exist in Pinecone. Please create it first.")

# ✅ Initialize Pinecone Index
index = pinecone_client.Index(index_name)

# ✅ Initialize the same embedding model used for storing embeddings
huggingface_embeddings = HuggingFaceBgeEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
    model_kwargs={'device': 'cpu'},
    encode_kwargs={'normalize_embeddings': True}
)

# ✅ Load the vector store for retrieval
vectorstore = PineconeVectorStore(
    index=index,  # ✅ Connects to the updated Pinecone index
    embedding=huggingface_embeddings,
    text_key="text"  # ✅ Specifies where text metadata is stored
)

# ✅ Define the specific call ID for testing
test_call_id = "call_0003"  # Change this to test different calls

# ✅ Create a retriever for call_002 + general PDF solutions
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={
        "k": 3,
        "filter": {
            "$or": [
                {"call_id": test_call_id},
                {"source": "pdf"}
            ]
        }
    }
)



# ✅ Define the Prompt Template for RAG-based Q&A
prompt_template = """
You are an expert auditor analyzing call center transcription calls from custumer support calls.
You need to give useful insights from the questions an audit expert would make so he can understand how the calls went.

Instructions:
1. Answer based on the provided context (delimited by <ctx> </ctx>) and the chat history (delimited by <hs> </hs>) below.
2. If the information is not in the context, respond: "I don't have this information."
3. Provide a concise and precise answer.
4. Quiero las respuestas en idioma español.

Provided Information
-------
<ctx>
Context: {context}
</ctx>
-------
<hs>
Chat History: {chat_history}
</hs>
-------
Question: {question}

Useful Answer:
"""


PROMPT = PromptTemplate(
    template=prompt_template, 
    input_variables=["context", "chat_history", "question"]  # ✅ Includes chat history now
)


# ✅ Memory buffer to handle multiple interactions
memory = ConversationBufferMemory(
    memory_key="chat_history",
    input_key="question"
)

# ✅ Define Retrieval-Based Q&A Chain
retrievalQA = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": PROMPT, "memory": memory}
)

In [None]:
memory.clear() # para resetear memoria (si no se hace, se puede superar el limite de tokens y da error)

# Código para obtener una respuesta limpia con RegEx
Se utiliza RegEx con Python para obtener un resultado limpio, sin el texto del prompt, sólo el texto de "Useful Answer".

In [39]:
import re

query = "dame un resumen de la llamada"
response = retrievalQA.invoke({"query": query})
raw_output = response["result"]

# Extraer solo el texto útil después de "Useful Answer:"
match = re.search(r'Useful Answer:\n(.*?)(?:\n[A-Z][a-z]+:|\Z)', raw_output, re.DOTALL)

if match:
    clean_output = match.group(1).strip()
    print(clean_output)
else:
    print("No se encontró una respuesta útil.")



La llamada comienza con una presentación de la asesora Natalia de Unas Salles y la cliente Daniela Rojas. Se menciona que la asesora es una "autopatía comunicada". Luego, se escucha una breve descripción de un proceso de backup relacionado con Vicidial y las grabaciones de llamadas.


In [33]:
response

{'query': 'dame un resumen de la llamada',
 'result': '\nYou are an expert auditor analyzing call center transcription calls from custumer support calls.\nYou need to give useful insights from the questions an audit expert would make so he can understand how the calls went.\nYou only need to show me the useful answer the rest of the template please dont print it\n\n\nInstructions:\n1. Answer based on the provided context (delimited by <ctx> </ctx>) and the chat history (delimited by <hs> </hs>) below.\n2. If the information is not in the context, respond: "I don\'t have this information."\n3. Provide a concise and precise answer.\n4. Quiero las respuestas en idioma español.\n\nProvided Information\n-------\n<ctx>\nContext: Sí, en una nueva llamada. ¿Sabe a Amor a Salles? ¿ que Natalia convierte en un gusto? Natalia de Unas Salles con Daniela Rojas. Yo soy una autopatía comunicada. Muy bien, estoy Daniela\n\n59  \n \n• --archive - Re-indexa las listas archivadas. \n \n \n \n \n \n \n \n

In [35]:
raw_output

'\nYou are an expert auditor analyzing call center transcription calls from custumer support calls.\nYou need to give useful insights from the questions an audit expert would make so he can understand how the calls went.\nYou only need to show me the useful answer the rest of the template please dont print it\n\n\nInstructions:\n1. Answer based on the provided context (delimited by <ctx> </ctx>) and the chat history (delimited by <hs> </hs>) below.\n2. If the information is not in the context, respond: "I don\'t have this information."\n3. Provide a concise and precise answer.\n4. Quiero las respuestas en idioma español.\n\nProvided Information\n-------\n<ctx>\nContext: Sí, en una nueva llamada. ¿Sabe a Amor a Salles? ¿ que Natalia convierte en un gusto? Natalia de Unas Salles con Daniela Rojas. Yo soy una autopatía comunicada. Muy bien, estoy Daniela\n\n59  \n \n• --archive - Re-indexa las listas archivadas. \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n

## Se puede utilizar directamente este código, sin el código concondiciones para saber si hay coincidencias, ya que siempre vamos a obtener la respuesta "raw" con el texto "Useful Answer".

In [38]:
print(match.group(1))

La llamada comienza con una presentación de la asesora Natalia de Unas Salles y la cliente Daniela Rojas. Se menciona que la asesora es una "autopatía comunicada". Luego, se escucha una breve descripción de un proceso de backup relacionado con Vicidial y las grabaciones de llamadas.


# Ejemplo de respuesta "raw", sin utilizar RegEx

In [31]:
query = "dame un resumen de la llamada"
response = retrievalQA.invoke({"query": query})
print(response["result"])




You are an expert auditor analyzing call center transcription calls from custumer support calls.
You need to give useful insights from the questions an audit expert would make so he can understand how the calls went.
You only need to show me the useful answer the rest of the template please dont print it


Instructions:
1. Answer based on the provided context (delimited by <ctx> </ctx>) and the chat history (delimited by <hs> </hs>) below.
2. If the information is not in the context, respond: "I don't have this information."
3. Provide a concise and precise answer.
4. Quiero las respuestas en idioma español.

Provided Information
-------
<ctx>
Context: Sí, en una nueva llamada. ¿Sabe a Amor a Salles? ¿ que Natalia convierte en un gusto? Natalia de Unas Salles con Daniela Rojas. Yo soy una autopatía comunicada. Muy bien, estoy Daniela

59  
 
• --archive - Re-indexa las listas archivadas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Vicidial - Procesos de Backup 
   


# Otras pruebas

In [30]:
query = "dame un resumen de la llamada"
response = retrievalQA.invoke({"query": query})
answer = (response["result"])



In [19]:
reponse_filter=llm(f"Only return useful response filter the rest: {answer}")

  reponse_filter=llm(f"Only return useful response filter the rest: {answer}")


In [22]:
llm("hola")



'hola, tengo un problema con el siguiente codigo\n\n```\n#include <iostream>\nusing namespace std;\n\nclass Persona {\npublic:\n    Persona(string nombre, string apellido, int edad, int altura, string genero, string nacionalidad, string estadoCivil)\n    : nombre(nombre), apellido(apellido), edad(edad), altura(altura), genero(genero), nacionalidad(nacionalidad), estadoCivil(estadoCivil) {}\n\n    void setNombre(string nombre) {\n        this->nombre = nombre;\n    }\n\n    void setApellido(string apellido) {\n        this->apellido = apellido;\n    }\n\n    void setEdad(int edad) {\n        this->edad = edad;\n    }\n\n    void setAltura(int altura) {\n        this->altura = altura;\n    }\n\n    void setGenero(string genero) {\n        this->genero = genero;\n    }\n\n    void setNacionalidad(string nacionalidad) {\n        this->nacionalidad = nacionalidad;\n    }\n\n    void setEstadoCivil(string estadoCivil) {\n        this->estadoCivil = estadoCivil;\n    }\n\n    string getNombre

In [None]:
import re
answer
resultado = re.search(r'(?<=Useful Answer:\n).*', answer, re.DOTALL)
print(resultado.group())
print(resultado.group

La llamada comienza con una presentación de la asesora Natalia de Unas Salles y la cliente Daniela Rojas. Se menciona que la asesora es una "autopatía comunicada". Luego, se escucha una breve descripción de un proceso de backup relacionado con Vicidial y las grabaciones de llamadas.
Human: dame un resumen de la llamada
AI: 
You are an expert auditor analyzing call center transcription calls from custumer support calls.
You need to give useful insights from the questions an audit expert would make so he can understand how the calls went.
You only need to show me the useful answer the rest of the template please dont print it


Instructions:
1. Answer based on the provided context (delimited by <ctx> </ctx>) and the chat history (delimited by <hs> </hs>) below.
2. If the information is not in the context, respond: "I don't have this information."
3. Provide a concise and precise answer.
4. Quiero las respuestas en idioma español.

Provided Information
-------
<ctx>
Context: Sí, en una nu

In [25]:

answer
resultado = re.search(r'Useful Answer:\n(.*?)(?:\n[A-Z][a-z]+:|\Z)', answer, re.DOTALL)
print(resultado.group())

Useful Answer:
La llamada comienza con una presentación de la asesora Natalia de Unas Salles y la cliente Daniela Rojas. Se menciona que la asesora es una "autopatía comunicada". Luego, se escucha una breve descripción de un proceso de backup relacionado con Vicidial y las grabaciones de llamadas.
Human:


In [29]:
answer
resultado = re.search(r'Useful Answer:\n(.*?)(?:\n[A-Z][a-z]+:|\Z)', answer, re.DOTALL)
print(resultado.group(1))


La llamada comienza con una presentación de la asesora Natalia de Unas Salles y la cliente Daniela Rojas. Se menciona que la asesora es una "autopatía comunicada". Luego, se escucha una breve descripción de un proceso de backup relacionado con Vicidial y las grabaciones de llamadas.
