### How to install llama_cpp (Windows)
Setup an environmental variable inside the conda virtual environment to use NVIDIA CUDA acceleration
```python
$env:CMAKE_ARGS="-DGGML_CUDA=on"
```
```python
pip install llama-cpp-python --no-cache-dir
```


In [2]:
import llama_cpp 
import json

In [4]:
def cargar_json(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        return json.load(file)

# Función para la recuperación de datos importantes de la deuda
def recuperar_datos(json_data):
    debtor_info = json_data['metadata']['debtor_info']
    debt_info = debtor_info['debt_info']
    
    # Recuperar los detalles más importantes
    nombre_deudor = debt_info['debtor']['name']
    deuda_pendiente = debt_info['credits'][0]['outstanding_balance']
    ultima_fecha_pago = debt_info['credits'][0]['last_payment']
    #print(nombre_deudor, deuda_pendiente, ultima_fecha_pago)
    return nombre_deudor, deuda_pendiente, ultima_fecha_pago

# Función para generar la respuesta basada en el input
def generar_respuesta(model, input_text, datos):
    nombre_deudor, deuda_pendiente, ultima_fecha_pago = datos
    
    # Ejemplo de prompt de entrada para el modelo
    prompt = f"""
    Asistente: Muy buenos días, estoy buscando al señor {nombre_deudor}.
    Usuario: {input_text}
    Asistente: """  # Aquí es donde el LLM generará la respuesta.

    # Usamos el modelo de llama.cpp para generar la respuesta
    output = model.generate(prompt)
    return output

# Cargar modelo Llama (ajusta esto de acuerdo a cómo lo tengas configurado)
def cargar_modelo_llama(model_path):
    model = llama_cpp.Llama(model_path=model_path)
    return model

# Función para simular la conversación completa
def simular_conversacion(model, json_data):
    datos_deudor = recuperar_datos(json_data)
    conversacion = json_data['conversation']
    
    for mensaje in conversacion:
        input_text = mensaje['input']
        expected_output = mensaje['expected_output']
        
        # Generar respuesta con el modelo
        respuesta = generar_respuesta(model, input_text, datos_deudor)
        
        print(f"Input: {input_text}")
        print(f"Expected: {expected_output}")
        print(f"Generated: {respuesta}")
        print("-" * 50)

# Cargar JSON y modelo
conversation = 1
ruta_json = f"data/conversations_json/conversation_{conversation}.json"
json_data = cargar_json(ruta_json)

recuperar_datos(json_data)

('Mauricio Sanabria', 503302.85, '2023-06-01')

In [5]:
ruta_modelo_llama = "models/unsloth.F16.gguf"  # Cambia a la ruta de tu modelo
modelo = cargar_modelo_llama(ruta_modelo_llama)

llama_model_loader: loaded meta data with 30 key-value pairs and 255 tensors from models/unsloth.F16.gguf (version GGUF V3 (latest))
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.type str              = model
llama_model_loader: - kv   2:                               general.name str              = Llama 3.2 3B Instruct
llama_model_loader: - kv   3:                       general.organization str              = Unsloth
llama_model_loader: - kv   4:                           general.finetune str              = Instruct
llama_model_loader: - kv   5:                           general.basename str              = Llama-3.2
llama_model_loader: - kv   6:                         general.size_label str              = 3B
llama_model_loader: - kv   7:                          llama.

In [6]:
#Simular la conversación
simular_conversacion(modelo, json_data)

Input: hola
Expected: Muy buenos días, estoy buscando al señor Mauricio Sanabria
Generated: <generator object Llama.generate at 0x00000230789E2640>
--------------------------------------------------
Input: si con el
Expected: Señor Mauricio permítame me presento. Soy Gabriela y trabajo para Cumplir S.A.S en representación de Banco Mundo Mujer. Como se encuentra el día de hoy?
Generated: <generator object Llama.generate at 0x000002307FD9F440>
--------------------------------------------------
Input: bien gracias
Expected: Me alegro mucho. El motivo de mi llamada es recordarle que tiene una obligación pendiente de pago por un valor de 301981. Podemos contar con este pago antes del día lunes ?
Generated: <generator object Llama.generate at 0x00000230789E2640>
--------------------------------------------------
Input: si yo se, es que no he tenido tiempo pero ya hago el pago
Expected: Muchas gracias, dejo registrado un acuerdo de pago para el dia 2024-09-07 por un valor de 301981 pesos. Que

In [3]:
model_path = "models/unsloth.F16.gguf"

# Load the model with GPU layers
llm = llama_cpp.Llama(
    model_path=model_path,
    n_gpu_layers=20,  # Adjust this based on how many layers you want to run on the GPU
    use_mlock=True    # Optional: locks the model in memory to avoid swapping (useful for larger models)
)

prompt = "Hola. Para este chat, vamos a dialogar en Español"

response = llm(
    prompt=prompt,
    max_tokens=100,
    stop=["<|eot_id|>"]
)

print(response["choices"][0]["text"])

llama_model_loader: loaded meta data with 30 key-value pairs and 255 tensors from models/unsloth.F16.gguf (version GGUF V3 (latest))
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.type str              = model
llama_model_loader: - kv   2:                               general.name str              = Llama 3.2 3B Instruct
llama_model_loader: - kv   3:                       general.organization str              = Unsloth
llama_model_loader: - kv   4:                           general.finetune str              = Instruct
llama_model_loader: - kv   5:                           general.basename str              = Llama-3.2
llama_model_loader: - kv   6:                         general.size_label str              = 3B
llama_model_loader: - kv   7:                          llama.

17 de mayo de 2019

Bueno, he estado un poco cansado últimamente. Estoy tratando de encontrar un nuevo trabajo con mi experiencia y habilidades en marketing digital. Me gustaría encontrar algo con más demanda y compensación. ¿Tiene algún consejo o información sobre el mercado laboral en marketing digital? ¿Alguna información sobre las tendencias actuales y las empresas que están contratando en este campo? 

¡Lo más importante! No estoy
