### Procesador de Audio-GPT4

In [147]:
from faster_whisper import WhisperModel
class PQRSProcessor:
    def __init__(self, 
                 openai_api_key, 
                 hotwords = "", 
                 whisper_model = 'large-v3', 
                 openai_model = 'gpt-4o', 
                 base_url = None):
        
        #self.audio_model = WhisperModel(whisper_model, compute_type="int8")
        self.openai_client =  OpenAI(base_url=base_url, api_key=openai_api_key)
        self.hotwords = hotwords
        self.openai_model = openai_model
        self.whisper_model = whisper_model
        self.get_prompts()

    def get_audio_files(self, folder_path):
        audio_extensions = ["*.aac","*.wav","*.opus","*.ogg","*.mp3","*.mp4","*.mpeg","*.m4a", '*.flac']
        audio_files = []
        for ext in audio_extensions:
            audio_files.extend(glob(os.path.join(folder_path, ext)))
        self.audio_files = audio_files

    def transcribe_audio(self, file_path):
        segments, info = self.audio_model.transcribe(file_path, beam_size=2, language="es",hotwords=self.hotwords)
        self.transcription = " ".join([segment.text for segment in segments])
        print(self.transcription)

    def transcribe_audio_openai(self, file_path):
        audio_file = open(file_path, "rb")
        self.transcription = self.openai_client.audio.transcriptions.create(
            model=self.whisper_model, 
            file=audio_file, 
            response_format="text",
      )
        print(self.transcription)

    def model_answer(self, transcription):

        query = "Inicio PQRS:" + self.transcription + "Fin PQRS. No des explicaciones adicionales, sólo responde con el JSON."
        messages = [
            {"role": "system", "content": self.sys_prompt},
            {"role": "user", "content": query}
        ]

        chat_completion = self.openai_client.chat.completions.create(
                            messages=messages,
                            model=self.openai_model,
                            max_tokens=1000,
                            temperature=0.7,
                            response_format={"type": "json_object"}
                        )
        return chat_completion.choices[0].message.content

    def process_audios(self, folder_path, user_prompt, system_prompt):
        results = []
        audio_files = self.get_audio_files(folder_path)

        for audio_file in tqdm(audio_files):
            transcription = self.transcribe_audio(audio_file)
            table = self.generate_table(transcription, user_prompt, system_prompt)
            results.append({
                "audio_file": os.path.basename(audio_file),
                "transcription": transcription,
                "table": table
            })

        return results

    @staticmethod
    def save_to_json(data, output_file):
        with open(output_file, 'w') as f:
            json.dump(data, f, indent=4)

    def get_prompts(self):
        with open("../input/prompts/estructura_json.txt") as f:
            estructura = f.read()

        with open("../input/prompts/categorias.txt") as f:
            categorias = f.read()
        
        with open("../input/prompts/sys_prompt.txt") as f:
            sys_prompt = f.read()

        self.sys_prompt = sys_prompt.format(estructura=estructura, categorias=categorias)

In [148]:
key = "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"
#base_url = "http://localhost:1234/v1"
base_url=None
pqrs_proc = PQRSProcessor(base_url=base_url, openai_api_key=key, whisper_model='whisper-1')

folder_path = "../recorded_audio/"
pqrs_proc.get_audio_files(folder_path=folder_path)
pqrs_proc.transcribe_audio_openai(pqrs_proc.audio_files[0])
llm_resp = pqrs_proc.model_answer(pqrs_proc.transcription)
print(llm_resp)

Buenas, quiero reclamar porque mi amigo no sabe cómo grabó el audio.

{
  "nombre": "",
  "telefono": "",
  "cedula": "",
  "clase": "Reclamo",
  "explicacion": "Quiero reclamar porque mi amigo no sabe cómo grabó el audio.",
  "radicado": ""
}


In [150]:
pqrs_proc.transcription

'Buenas, quiero reclamar porque mi amigo no sabe cómo grabó el audio.\n'

### DataFrame insert

In [33]:
from openai import OpenAI
import pandas as pd

# Point to the local server
client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
#client = OpenAI(api_key="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")

ai_model = "cognitivecomputations/dolphin-2.9-llama3-8b-gguf"
#ai_model = "gpt-4o"

table = pd.DataFrame()
while True:
    query = input(prompt="¿Cuál es tu PQRS?\n")
    query = "Inicio PQRS:" + query + "Fin PQRS. No des explicaciones adicionales, sólo responde con el JSON."
    completion = client.chat.completions.create(
      model=ai_model,
      messages=[
        {"role": "system", "content": sys_prompt},
        {"role": "user", "content": query}
      ],
      temperature=0.7,
    #response_format={"type": "json_object"}
    )
    res = eval(completion.choices[0].message.content)
    try:
        res_df = pd.DataFrame(res)
        table = pd.concat((table,res_df))
        display(pd.DataFrame(table))
    except:
        res_df = pd.DataFrame([res])
        table = pd.concat((table,res_df))
        display(pd.DataFrame(table))

¿Cuál es tu PQRS?
 Señor JUEZ DEL CIRCUITO DE SANTIAGO DE CALI (REPARTO) E.              S.              D.  Referencia	ACCIÓN DE TUTELA Apoderado	CARLOS FELIPE ROJAS FLOREZ  Accionante	EDGAR GUILLERMO CALVO ECHEVERRÍA Accionado	ADMINISTRADORA COLOMBIANA DE PENSIONES- COLPENSIONES   CARLOS FELIPE ROJAS FLOREZ, ciudadano identificado con la cédula de ciudadanía 1.144.080.211 y abogado en ejercicio identificado con la tarjeta profesional 327322 del Consejo Superior de la Judicatura, residente en la ciudad de Cali y obrando en representación (según poder conferido) del señor EDGAR GUILLERMO CALVO ECHEVERRIA, residente en la ciudad de Cali e identificado con cédula de ciudadanía 13.801.511, en ejercicio del artículo 86 Superior y con el lleno de los requisitos del Decreto 2591 de 1991; interpongo ACCIÓN DE TUTELA contra la ADMINISTRADORA COLOMBIANA DE PENSIONES- COLPENSIONES.   HECHOS   PRIMERO: Mi mandante, el señor EDGAR GUILLERMO CALVO ECHEVERRÍA contrató a un “tramitador” con el fin de

SyntaxError: unterminated string literal (detected at line 19) (<string>, line 19)