# Modelos probados:
- Gemini 2.5 flash
- qwen3:8b
- granite3.3

In [None]:
# Importar las bibliotecas necesarias
from openai import OpenAI
import pandas as pd
import time
import re

HUGGINGFACE_API_KEY = "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"
GEMINI_API_KEY = "AIzaSyAJRz8G-3RO9ffbEIsaej-bskTHGmFpQAc"

OLLAMA_SERVER = "https://ollama.nest0r.dev/"
OLLAMA_USERNAME = "nestor"
OLLAMA_PASSWORD = "nestor12"

HOW_MANY_MESSAGES_TO_CHECK_SPAM = 5

MODELS = {
    "gemini" : "gemini-2.5-flash-preview-04-17",
    "qwen3": "qwen3:8b",
    "granite3.3": "granite3.3:8b",
}

# Inicializar el cliente de OpenAI
client = OpenAI(
    api_key=GEMINI_API_KEY,
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

# Variables de configuración


In [None]:
def format_response(response):
    """
    Funcion para formatear la respuesta.
    Obtiene solo el contenido de la respuesta y se limpia mediante regex 
    """

    response_content = response.choices[0].message.content
    formatted_response = re.sub(r'^\s*|\s*$', '', response_content)
    
    return formatted_response

In [None]:
# Leer el archivo csv
df = pd.read_csv('./INPUT/spam.csv', encoding='latin-1')

# Borrar Unnamed: 2	Unnamed: 3	Unnamed: 4
df = df.drop(columns=['Unnamed: 2', 'Unnamed: 3', 'Unnamed: 4'])
df.head(5)

Unnamed: 0,type,message
0,ham,"Go until jurong point, crazy.. Available only ..."
1,ham,Ok lar... Joking wif u oni...
2,spam,Free entry in 2 a wkly comp to win FA Cup fina...
3,ham,U dun say so early hor... U c already then say...
4,ham,"Nah I don't think he goes to usf, he lives aro..."


In [19]:
# Dividir entre train y test
train = df.sample(frac=0.8, random_state=42)
test = df.drop(train.index)

In [None]:
# Zero-shot

# Crear un dataframe para almacenar las respuestas
response_df_zero_shot = pd.DataFrame(columns=['message', 'label_zero_shot', 'real_label'])

# Iterar sobre los mensajes de prueba
for i in range(HOW_MANY_MESSAGES_TO_CHECK_SPAM):
    response = client.chat.completions.create(
        model="gemini-2.0-flash",
        messages=[
            {"role": "system", "content": 
             """
                Eres un experto en clasificación de mensajes, se te enviará un mensaje y debes clasificarlo como spam o no spam.
                Responde solo con la palabra "spam", en caso de ser spam, o "ham", en caso de no ser spam.
             """},
            {
                "role": "user",
                "content": test.iloc[i]['message']
            }
        ]
    )

    # Guardar la respuesta en el dataframe
    new_row = pd.DataFrame([{
        'message': test.iloc[i]['message'],
        'label_zero_shot': format_response(response),
        'real_label': test.iloc[i]['type']
    }])
    response_df_zero_shot = pd.concat([response_df_zero_shot, new_row], ignore_index=True)
    
    # Sleep para evitar el límite de peticiones
    time.sleep(1)

# Mostrar el resultado
# print(response_df_zero_shot)


                                             message label_zero_shot  \
0  U dun say so early hor... U c already then say...            spam   
1  Nah I don't think he goes to usf, he lives aro...             ham   
2  FreeMsg Hey there darling it's been 3 week's n...            spam   
3  Had your mobile 11 months or more? U R entitle...            spam   
4                         Oh k...i'm watching here:)             ham   

  real_label  
0        ham  
1        ham  
2       spam  
3       spam  
4        ham  


In [36]:
# Mostrar estadisticas de accuracy
accuracy_zero_shot = (response_df_zero_shot['label_zero_shot'] == response_df_zero_shot['real_label']).mean()
print(f"Accuracy Zero-Shot: {accuracy_zero_shot:.2f}")

Accuracy Zero-Shot: 0.80


In [39]:
# Few-shot

# Crear un dataframe para almacenar las respuestas
response_df_few_shot = pd.DataFrame(columns=['message', 'label_few_shot', 'real_label'])

# Seleccionar algunos ejemplos del conjunto de entrenamiento para few-shot
few_shot_examples = train.sample(3, random_state=42) # Tomamos 3 ejemplos

# Iterar sobre los mensajes de prueba
for i in range(HOW_MANY_MESSAGES_TO_CHECK_SPAM):
    # Construir los mensajes para el few-shot
    messages_few_shot = [
        {"role": "system", "content":
         """
            Eres un experto en clasificación de mensajes, se te enviará un mensaje y debes clasificarlo como spam o no spam.
            Responde solo con la palabra "spam", en caso de ser spam, o "ham", en caso de no ser spam.
            Aquí tienes algunos ejemplos:
         """}
    ]
    # Añadir los ejemplos de few-shot
    for index, row in few_shot_examples.iterrows():
        messages_few_shot.append({"role": "user", "content": row['message']})
        messages_few_shot.append({"role": "assistant", "content": row['type']})

    # Añadir el mensaje actual a clasificar
    messages_few_shot.append({"role": "user", "content": test.iloc[i]['message']})

    response = client.chat.completions.create(
        model="gemini-2.0-flash",
        messages=messages_few_shot
    )

    # Guardar la respuesta en el dataframe
    new_row = pd.DataFrame([{
        'message': test.iloc[i]['message'],
        'label_few_shot': format_response(response),
        'real_label': test.iloc[i]['type']
    }])
    response_df_few_shot = pd.concat([response_df_few_shot, new_row], ignore_index=True)

    # Sleep para evitar el límite de peticiones
    time.sleep(1)

# Mostrar el resultado
print("Resultados del Few-Shot:")
print(response_df_few_shot)

# Mostrar estadisticas de accuracy
accuracy_few_shot = (response_df_few_shot['label_few_shot'] == response_df_few_shot['real_label']).mean()
print(f"\nAccuracy Few-Shot: {accuracy_few_shot:.2f}")


Resultados del Few-Shot:
                                             message label_few_shot real_label
0  U dun say so early hor... U c already then say...            ham        ham
1  Nah I don't think he goes to usf, he lives aro...            ham        ham
2  FreeMsg Hey there darling it's been 3 week's n...           spam       spam
3  Had your mobile 11 months or more? U R entitle...           spam       spam
4                         Oh k...i'm watching here:)            ham        ham

Accuracy Few-Shot: 1.00


In [None]:
# Chain of thoughts

# Crear un dataframe para almacenar las respuestas
response_df_chain_of_thoughts = pd.DataFrame(columns=['message', 'label_chain_of_thoughts', 'real_label'])

# Iterar sobre los mensajes de prueba
for i in range(HOW_MANY_MESSAGES_TO_CHECK_SPAM):
    response = client.chat.completions.create(
        # Usamos un modelo con capacidad de razonamiento
        model="gemini-2.5-pro-exp-03-25", 
        messages=[
            {"role": "system", "content": 
             """
                Eres un experto en clasificación de mensajes, se te enviará un mensaje y debes clasificarlo como spam o no spam.
                Responde solo con la palabra "spam", en caso de ser spam, o "ham", en caso de no ser spam.
             """},
            {
                "role": "user",
                "content": test.iloc[i]['message']
            }
        ]
    )

    # Guardar la respuesta en el dataframe
    new_row = pd.DataFrame([{
        'message': test.iloc[i]['message'],
        'label_chain_of_thoughts': format_response(response),
        'real_label': test.iloc[i]['type']
    }])
    response_df_chain_of_thoughts = pd.concat([response_df_chain_of_thoughts, new_row], ignore_index=True)
    
    # Sleep para evitar el límite de peticiones
    time.sleep(1)

# Mostrar el resultado
print("Resultados del Chain of thoughts:")
print(response_df_chain_of_thoughts)

# Mostrar estadisticas de accuracy
accuracy_chain_of_thoughts = (response_df_chain_of_thoughts['label_chain_of_thoughts'] == response_df_chain_of_thoughts['real_label']).mean()
print(f"\nAccuracy Chain of thoughts: {accuracy_chain_of_thoughts:.2f}")

Resultados del Few-Shot:
                                             message label_chain_of_thoughts  \
0  U dun say so early hor... U c already then say...                     ham   
1  Nah I don't think he goes to usf, he lives aro...                     ham   
2  FreeMsg Hey there darling it's been 3 week's n...                    spam   
3  Had your mobile 11 months or more? U R entitle...                    spam   
4                         Oh k...i'm watching here:)                     ham   

  real_label  
0        ham  
1        ham  
2       spam  
3       spam  
4        ham  

Accuracy Few-Shot: 1.00
