# Human Value Detection

## Modelos Seleccionados
- Microsoft Phi-4 / 14B: https://ollama.com/library/phi4:14b
- DeepSeek R1 Distill Qwen / 14B: https://ollama.com/library/deepseek-r1:14b
- META Llama 3.1 / 8B: https://ollama.com/library/llama3.1:8b
- Mistral NeMo / 12B: https://ollama.com/library/mistral-nemo:12b
___

- **MODELO TEST** => META Llama 3.2 / 3B: https://ollama.com/library/llama3.2:3b

## Comandos Terminal Fundamentales para Ollama
Documentación de Ollama en Python: https://github.com/ollama/ollama-python

```bash
pip install ollama   ## Instalar Ollama
ollama --version     ## Versión de Ollama
ollama serve         ## Start ollama
ollama create        ## Create a model from a Modelfile
ollama show          ## Show information for a model
ollama run           ## Run a model
ollama stop          ## Stop a running model
ollama pull          ## Pull a model from a registry
ollama push          ## Push a model to a registry
ollama list          ## List models
ollama ps            ## List running models
ollama cp            ## Copy a model
ollama rm            ## Remove a model
ollama help          ## Help about any command
```

## Métodos Fundamentales de Python para Ollama

### `chat`

- **Estructura**:  
  ```python
  ollama.chat(
      model=<modelo>, 
      messages=[
          {'role': <role>, 
           'content': <prompt>}]
  )
  ```
- **Descripción**:  
  Realiza una conversación estilo chat con un modelo LLM local. Se deben pasar mensajes con roles como `'user'`, `'assistant'` o `'system'`. Ideal para tareas que requieren diálogo multi-turno.

---

### `generate`

- **Estructura**:  
  ```python
  ollama.generate(
      model=<modelo>, 
      prompt=<prompt>
  )
  ```
- **Descripción**:  
  Genera una respuesta simple a un prompt dado sin contexto conversacional. Es útil para tareas de completado directo de texto.

---

### `list`

- **Estructura**:  
  ```python
  ollama.list()
  ```
- **Descripción**:  
  Devuelve una lista de los modelos descargados localmente en tu entorno Ollama.

---

### `show`

- **Estructura**:  
  ```python
  ollama.show(<modelo>)
  ```
- **Descripción**:  
  Muestra detalles del modelo especificado, incluyendo información como su tamaño, etiquetas, parámetros, etc.

---

### `create`

- **Estructura**:  
  ```python
  ollama.create(
      model=<nombre>, 
      from_=<modelo_base>, 
      system=<contexto>
  )
  ```
- **Descripción**:  
  Crea un nuevo modelo basado en otro, definiendo un contexto o prompt de sistema personalizado.

---

### `copy`

- **Estructura**:  
  ```python
  ollama.copy('<modelo_origen>', '<modelo_destino>')
  ```
- **Descripción**:  
  Crea una copia de un modelo existente con un nuevo nombre, útil para duplicar y modificar variantes.

---

### `delete`

- **Estructura**:  
  ```python
  ollama.delete(<modelo>)
  ```
- **Descripción**:  
  Elimina un modelo local de tu sistema.

---

### `pull`

- **Estructura**:  
  ```python
  ollama.pull(<modelo>)
  ```
- **Descripción**:  
  Descarga un modelo desde el repositorio remoto de Ollama a tu entorno local.

---

### `push`

- **Estructura**:  
  ```python
  ollama.push(<ruta>/<modelo>)
  ```
- **Descripción**:  
  Sube tu modelo local personalizado al repositorio remoto (requiere autenticación y permisos).

---

### `embed`

- **Estructura**:  
  ```python
  ollama.embed(
      model=<modelo>, 
      input=<prompt>
  )
  ```
- **Descripción**:  
  Genera un embedding (vector de representación) de un texto usando el modelo especificado. Útil para tareas de similitud, clustering o recuperación.

---

### `embed` (batch)

- **Estructura**:  
  ```python
  ollama.embed(
      model=<modelo>, 
      input=[<prompt1>, <prompt2>, ...]
  )
  ```
- **Descripción**:  
  Genera embeddings para múltiples textos en lote, optimizando tiempos de procesamiento.

---

### `ps`

- **Estructura**:  
  ```python
  ollama.ps()
  ```
- **Descripción**:  
  Muestra los procesos activos que están usando modelos en Ollama, útil para monitorear uso de recursos.

## Importar Librerías

In [1]:
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

In [2]:
import os
import re
import json
import time
import ollama
import pandas as pd

## Constantes y Funciones

In [3]:
MODELO_TEST = 'llama3.2'
MODELOS = [
    'phi4:14b',
    'deepseek-r1:14b',
    'llama3.1:8b',
    'mistral-nemo:12b'
]

In [4]:
def consulta_simple(model, prompt):
    return ollama.chat(
                model=model,
                messages=[{
                    "role": 'user',
                    "content": f"{prompt}"}]
                )['message']['content']

def consulta_contexto(model, contexto, prompt):
    messages = [
        {'role': 'system', 'content': f'{contexto}'},
        {'role': 'user'  , 'content': f'{prompt}'}
    ]
    return ollama.chat(
                model=model,
                messages=messages
                )['message']['content']

## Ejemplos de Uso

In [5]:
contexto  = 'Eres un experto en psicología.'
prompt1   = '¿Cuál es la capital de La Rioja?'
prompt2   = 'Explícame la diferencia entre ansiedad y estrés.'

In [7]:
print(f'Consulta Simple: {consulta_simple(MODELO_TEST, prompt1)}')
print(f'\nConsulta con Contexto: {consulta_contexto(MODELO_TEST, contexto, prompt2)}')

Consulta Simple: La respuesta es: Logroño.

Logroño es una ciudad ubicada en la región de Castilla y León, España, y es la capital de la provincia de La Rioja. Es conocida por su rica historia, su arquitectura medieval y su producción de vino.

Consulta con Contexto: La ansiedad y el estrés son dos estados emocionales comunes que pueden afectar negativamente nuestra salud mental y física, pero tienen características distintas.

**Estrés**

El estrés es una respuesta del cuerpo a un desafío o situación que consideramos amenazante. Cuando enfrentamos un problema o una situación desafiante, nuestro sistema nervioso liberación hormonas como la adrenalina, lo que nos permite reaccionar rápidamente y buscar soluciones. El estrés puede ser positivo (estreso beneficioso) cuando se maneja de manera efectiva y no daña nuestra salud mental y física.

**Ansiedad**

La ansiedad es una respuesta emocional excesiva o prolongada a una situación que consideramos peligrosa o amenazante. A diferencia del

## Crear Modelos Personalizados

In [10]:
ruta_prompts = '../DATA/prompts/'
list_prompts = [f for f in os.listdir(ruta_prompts) if f.endswith(".txt")]
', '.join(sorted([x for x in list_prompts]))

'few_shot_macro.txt, few_shot_subvalores.txt, prompt_rag.txt, zero_shot_macro.txt, zero_shot_subvalores.txt'

In [11]:
model_names = [
    'valores_zero_shot_macro', 'valores_zero_shot_subcateg'
]

model_prompts = [
    'zero_shot_macro.txt', 'zero_shot_subvalores.txt'
]

In [12]:
def generar_modelo_pers(model_name,model_base,prompt_struct):
    ollama.create(
        model=model_name,
        from_=model_base,
        system=open(prompt_struct).read()
    )

In [13]:
for n,p in zip(model_names, model_prompts):
    generar_modelo_pers(n, MODELO_TEST,ruta_prompts+p)

In [14]:
!ollama list

NAME                                 ID              SIZE      MODIFIED               
valores_zero_shot_macro:latest       3533fd191039    2.0 GB    Less than a second ago    
valores_zero_shot_subcateg:latest    d91f93bfe257    2.0 GB    Less than a second ago    
zero_shot:latest                     add687d148d9    2.0 GB    4 days ago                
few_shot_10:latest                   6763b22eee77    2.0 GB    4 days ago                
few_shot_3:latest                    52e297424b1f    2.0 GB    4 days ago                
few_shot_5:latest                    3b8d5c993f4a    2.0 GB    4 days ago                
llama3.2:latest                      a80c4f17acd5    2.0 GB    5 days ago                


## Cargar Datos

In [15]:
ruta = "../DATA/data_human_value/"
lista_archivos = [f for f in os.listdir(ruta) if f.endswith(".tsv")]

In [16]:
', '.join(sorted([x for x in lista_archivos]))

'labels_test.tsv, labels_train.tsv, labels_val.tsv, sentences_test.tsv, sentences_train.tsv, sentences_val.tsv, test_merged.tsv, train_merged.tsv, val_merged.tsv'

In [17]:
### DATASETS DE ENTRENAMIENTO
train = pd.read_csv(ruta+'train_merged.tsv', sep="\t")
val   = pd.read_csv(ruta+'val_merged.tsv', sep="\t")

### DATASETS PARA COMPROBACIÓN FINAL
sentences_test  = pd.read_csv(ruta+'sentences_test.tsv', sep="\t")
labels_test     = pd.read_csv(ruta+'labels_test.tsv', sep="\t") 
test            = pd.read_csv(ruta+'test_merged.tsv', sep="\t")

## Pruebas con Zero-Shot

In [18]:
from sklearn.metrics import classification_report, f1_score, confusion_matrix

In [19]:
# --- CONFIGURACIÓN ---
INPUT_FILE = ruta+'train_merged.tsv'
MODEL_NAME = 'valores_zero_shot_macro'
FASE       = 'macro'  # 'macro' o 'sub'

# --- CARGA DEL DATASET ---
train = pd.read_csv(INPUT_FILE, sep='\t').sample(frac=0.2)

In [153]:
# --- FUNCIONES ---
def extraer_gold(row, fase):
    for col in row.index:
        if fase == 'macro' and any(col.startswith(m) for m in [
                                    'openness_to_change', 
                                    'self_enhancement', 
                                    'conservation', 
                                    'self_transcendence'
        ]):
            if row[col] == 1:
                return pd.Series(col.rsplit(' ', 1))
        elif fase == 'sub' and ':' in col:
            if row[col] == 1:
                return pd.Series(col.rsplit(' ', 1))
    return pd.Series([None, None])

def obtener_prediccion(frase):
    prompt = f'Oración: "{frase}"\n\nRespuesta:'
    try:
        response = ollama.chat(
            model=MODEL_NAME,
            messages=[{'role': 'user', 'content': prompt}]
        )
        salida = response['message']['content']
        match = re.search(r'\{.*?\}', salida, re.DOTALL)
        if match:
            resultado = json.loads(match.group())
            return pd.Series([resultado.get('valor'), resultado.get('polaridad')])
    except Exception as e:
        print(f"Error procesando: {frase[:40]}... -> {e}")
    return pd.Series([None, None])

In [154]:
# --- GENERAR GOLD Y PREDICCIONES ---
train[['valor_gold', 'polaridad_gold']] = train.apply(lambda row: extraer_gold(row, FASE), axis=1)
train[['valor_pred', 'polaridad_pred']] = train['Text'].apply(obtener_prediccion)

# --- MÉTRICAS ---
train['match_exacto'] = ( (train['valor_gold'] == train['valor_pred']) & 
                          (train['polaridad_gold'] == train['polaridad_pred']) )

f1_macro = f1_score(train['polaridad_gold'], 
                    train['polaridad_pred'], 
                    average='macro', zero_division=0)
f1_micro = f1_score(train['polaridad_gold'], 
                    train['polaridad_pred'], 
                    average='micro', zero_division=0)
exact_match = train['match_exacto'].mean()

KeyboardInterrupt: 

In [None]:
print("\n--- MÉTRICAS ---")
print("F1 Macro:", round(f1_macro, 4))
print("F1 Micro:", round(f1_micro, 4))
print("Exact Match:", round(exact_match, 4))
print("\nReporte:")
print(classification_report(train['polaridad_gold'], 
                            train['polaridad_pred'], zero_division=0))

In [None]:
# --- GUARDAR RESULTADOS ---
output_path = f'resultados_{FASE}_{MODEL_NAME}.csv'
df.to_csv(output_path, index=False)
print(f"\nResultados guardados en: {output_path}")