<a href="https://colab.research.google.com/github/cjudithrb/generatejunits/blob/main/src/colab/6_2_Evaluacion_v2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## **1: Pre-requisitos**

### **1.1. Instalación de Dependencias**

In [None]:
%%capture
!pip install evaluate==0.4.0 rouge-score==0.1.2 peft==0.13.2 datasets==3.0.1

### **1.2: Importación de Librerías**

In [None]:
import os
import re
import torch
import pandas as pd
import datetime
import pytz
import psutil
import datetime
import pytz
import time
import wandb

from datasets import Dataset
from huggingface_hub import login
from peft import PeftModel, PeftConfig
from transformers import AutoModelForCausalLM, AutoTokenizer

os.environ["WANDB_API_KEY"] = "WANDB_API_KEY"

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## **2: Carga y Preparación del Dataset Evaluación**

In [None]:
# Definición de variables
BASE_MODEL_NAME = 'meta-llama/Llama-3.2-3B'#'google/gemma-2-2b'#'Qwen/Qwen2.5-3B'
MODEL_NAME = BASE_MODEL_NAME.split('/')[-1]
TEST_DATASET_FOLDER = '/content/drive/MyDrive/ColabNotebooks/DataEval/Gson'
INPUT_COLUMN = 'description'
OUTPUT_COLUMN = 'test_case'
OUTPUT_DIR = '/content/DataEvalOutput'
BATCH_SIZE = 4
BEAM_SIZE = 4
MAX_NEW_TOKENS = 256
MAX_LENGTH = 512
GPU_NUM = '0'


### **2.1. Carga de archivos de evaluación**

In [None]:
def list_csv_files(folder_path):
    """
    Lista todos los archivos CSV en un directorio específico.

    Args:
        folder_path (str): Ruta al directorio donde se encuentran los archivos CSV.

    Returns:
        list: Lista de rutas de archivos CSV.
    """
    return [file for file in os.listdir(folder_path) if file.endswith(".csv")]

def load_and_concat_csv_files(csv_files, folder_path):
    """
    Lee y concatena archivos CSV desde un directorio específico en un solo DataFrame.

    Args:
        csv_files (list): Lista de nombres de archivos CSV.
        folder_path (str): Ruta al directorio que contiene los archivos CSV.

    Returns:
        pd.DataFrame: DataFrame combinado de todos los archivos CSV.
    """
    all_data = []
    for csv_file in csv_files:
        file_path = os.path.join(folder_path, csv_file)
        data = pd.read_csv(file_path, delimiter='\t')
        all_data.append(data)
    if all_data:
        combined_data = pd.concat(all_data, ignore_index=True)
        print(f"{len(csv_files)} archivos CSV cargados y concatenados con éxito.")
        return combined_data
    else:
        print("No se encontraron archivos CSV o no se cargaron datos.")
        return pd.DataFrame()

def main_load_csv(test_folder):
    # Listar y cargar archivos CSV
    csv_files = list_csv_files(test_folder)
    if not csv_files:
        print("No se encontraron archivos CSV en el directorio especificado.")
        return

    df_test = load_and_concat_csv_files(csv_files, test_folder)

    if df_test.empty:
        print("No se cargaron datos válidos. Verifique los archivos CSV.")
        return

    return df_test

# Función para extraer la clase, el método y la descripción de una línea de texto
def extract_details(row):
    class_match = re.search(r'Class:\s*(\S+)', row)
    method_match = re.search(r'Method:\s*(\S+)', row)
    description_match = re.search(r'Description:\s*(.*?)$', row, re.DOTALL)

    extracted = {
        'Class': class_match.group(1) if class_match else None,
        'Method': method_match.group(1) if method_match else None,
        'Description': description_match.group(1).strip() if description_match else None
    }
    return pd.Series(extracted)

def add_prompt(df, column_name, text):
    df[column_name] = text
    return df

### **2.2. Carga del modelo para evaluación**

In [None]:
# Replace "YOUR_HUGGING_FACE_TOKEN" with your actual token
login(token="HUGGING_FACE_TOKEN")

In [None]:
def get_device():
    """Configura y retorna el dispositivo basado en la disponibilidad de CUDA."""
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print(f"Usando dispositivo: {device}")
    return device

def load_model_and_tokenizer(base_model_name, is_peft=False, peft_repo=None):
    """
    Carga un modelo (base o PEFT) y el tokenizador correspondiente, moviéndolos al dispositivo adecuado.

    Args:
        base_model_name (str): Nombre o ruta del modelo base preentrenado.
        is_peft (bool): Indica si se debe cargar un modelo PEFT.
        peft_repo (str): Ruta o nombre del repositorio PEFT si is_peft es True.

    Returns:
        model, tokenizer: El modelo y el tokenizador cargados en el dispositivo.
    """
    device = get_device()

    # Cargar el modelo base
    model = AutoModelForCausalLM.from_pretrained(base_model_name, device_map="auto")

    if is_peft and peft_repo:
        # Cargar configuración PEFT y crear el modelo PEFT
        config = PeftConfig.from_pretrained(peft_repo)
        #model = PeftModel.from_pretrained(model, peft_repo).to(device)
        model = PeftModel.from_pretrained(model, peft_repo, device_map={"": device}) # Esta línea fue modificada, device_map para el modelo PEFT
        print("Modelo PEFT cargado correctamente.")
        tokenizer_name = peft_repo  # Utilizar el nombre del repositorio PEFT para el tokenizador
    else:
        tokenizer_name = base_model_name  # Usar el nombre del modelo base para el tokenizador

    # Cargar el tokenizador y establecer el pad_token
    tokenizer = AutoTokenizer.from_pretrained(tokenizer_name, use_fast=True, padding_side='left', clean_up_tokenization_spaces=True)
    tokenizer.pad_token = tokenizer.eos_token
    print("Modelo y tokenizador cargados exitosamente.")

    return model, tokenizer

## **3: Evaluando con tecnicas de prompting**

In [None]:
lima_tz = pytz.timezone('America/Lima')
current_datetime = datetime.datetime.now(lima_tz).strftime("%Y%m%d_%H%M%S")

# Carga de los datos de prueba
data_test = main_load_csv(TEST_DATASET_FOLDER)
if not data_test.empty:
    data_test[['Class', 'Method', 'OnlyDescription']] = data_test[INPUT_COLUMN].apply(extract_details)
    data_test = add_prompt(data_test, 'Prompt', "Write a JUnit test method for the following Java method")

14 archivos CSV cargados y concatenados con éxito.


In [None]:
data_test.head()

Unnamed: 0,description,Class,Method,OnlyDescription,Prompt
0,Write a JUnit test method for the Java method ...,JsonStreamParser,next,/**\n* Returns the next available {@link JsonE...,Write a JUnit test method for the following Ja...
1,Class: JsonStreamParser\nMethod: hasNext\nDesc...,JsonStreamParser,hasNext,/**\n* Returns true if a {@link JsonElement} i...,Write a JUnit test method for the following Ja...
2,Class: JsonStreamParser\nMethod: remove\nDescr...,JsonStreamParser,remove,/**\n* This optional {@link Iterator} method i...,Write a JUnit test method for the following Ja...
3,Write a JUnit test method for the Java method ...,Primitives,isWrapperType,/**\n* Returns {@code true} if {@code type} is...,Write a JUnit test method for the following Ja...
4,Write a JUnit test method for the Java method ...,Primitives,wrap,/**\n* Returns the corresponding wrapper type ...,Write a JUnit test method for the following Ja...


In [None]:
# Carga de modelos
model_peft, tokenizer_peft = load_model_and_tokenizer(BASE_MODEL_NAME, is_peft=True, peft_repo=REPO_HF_NAME)

Usando dispositivo: cuda


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/844 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/20.9k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.97G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/1.46G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/185 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/50.5k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.09M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/301 [00:00<?, ?B/s]

Modelo y tokenizador cargados exitosamente.


### **Util**

In [None]:
def save_outputs_by_class(data, generated_outputs, output_dir="./outputs"):
    """
    Guarda los resultados generados en archivos separados por cada ClassName,
    asegurando que se guarden múltiples ejemplos.

    Args:
        data (pd.DataFrame): DataFrame con los datos de entrada.
        generated_outputs (list): Lista de salidas generadas por el modelo.
        output_dir (str): Directorio donde se guardarán los archivos de salida.
    """
    os.makedirs(output_dir, exist_ok=True)
    outputs_by_class = {}

    if len(data) != len(generated_outputs):
        print(f"Advertencia: La longitud de los datos ({len(data)}) y las salidas generadas ({len(generated_outputs)}) no coinciden.")
        min_length = min(len(data), len(generated_outputs))
        data = data.iloc[:min_length]
        generated_outputs = generated_outputs[:min_length]

    for i, (index, row) in enumerate(data.iterrows()):
        class_name = row.get('Class', 'Unknown')  # Maneja el caso en que no exista 'Class'
        if not class_name or class_name == 'None':
            match = re.search(r'Class\s*:\s*(\w+)', generated_outputs[i])
            class_name = match.group(1) if match else 'Unknown'

        outputs_by_class.setdefault(class_name, []).append(generated_outputs[i])

    for class_name, outputs in outputs_by_class.items():
        filename = os.path.join(output_dir, f"{class_name}_test_cases.txt")
        with open(filename, 'a') as f:
            f.writelines(f"{output}\n\n" for output in outputs)
        print(f"Archivo guardado para la clase {class_name}: {filename}")

def generate_test_case(prompts, model, tokenizer, max_new_tokens=256):
    """
    Genera casos de prueba a partir de una lista de prompts usando el modelo y el tokenizador.

    Args:
        prompts (list): Lista de prompts generados.
        model: Modelo de lenguaje para generación de texto.
        tokenizer: Tokenizador para preparar la entrada del modelo.
        max_new_tokens (int): Número máximo de tokens generados.

    Returns:
        list: Casos de prueba generados por el modelo.
    """
    outputs = []
    for prompt in prompts:
        inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
        output = model.generate(
            inputs["input_ids"],
            attention_mask=inputs["attention_mask"],
            max_new_tokens=max_new_tokens,
            pad_token_id=tokenizer.eos_token_id
        )
        outputs.append(tokenizer.decode(output[0], skip_special_tokens=True))
    return outputs

def extract_and_save_java_code_only(file_path, output_file_path):
    """
    Lee un archivo, extrae solo los bloques de código Java después de 'JUnit en Java:',
    y los guarda en un nuevo archivo, omitiendo descripciones u otros textos.

    Args:
        file_path (str): Ruta al archivo de entrada.
        output_file_path (str): Ruta al archivo de salida.
    """
    with open(file_path, 'r') as file:
        content = file.read()

    matches = re.findall(r"JUnit en Java:\n(.*?)(?=\n===|$)", content, re.DOTALL)
    extracted_codes = [match.strip() for match in matches]

    with open(output_file_path, 'w') as output_file:
        for i, code in enumerate(extracted_codes, 1):
            code_lines = [
                line for line in code.split('\n')
                if not line.startswith("Paso") and not line.startswith("Descripción")
                and not line.strip().startswith("Class:") and not line.strip().startswith("Method:")
            ]
            clean_code = '\n'.join(code_lines).strip()
            if clean_code:
                output_file.write(f"=== Extracted Code #{i} ===\n{clean_code}\n\n")
    print(f"Bloques de código limpios guardados en: {output_file_path}")

torch.cuda.empty_cache()

### **3.2. Few-Shot Prompting**

In [None]:
def make_few_shot_prompt(dataset, num_examples):
    """
    Genera un prompt few-shot utilizando ejemplos de un dataset de pruebas.

    Args:
        dataset (list): Lista de ejemplos, cada uno con los campos 'class', 'method', 'description', y 'junit_test_case'.
        num_examples (int): Número de ejemplos a incluir en el prompt.

    Returns:
        str: Prompt few-shot generado.
    """
    # Asegurarse de no exceder el tamaño del dataset
    num_examples = min(num_examples, len(dataset))

    # Construcción del prompt few-shot
    prompt_lines = ["Genera un test unitario en JUnit para cada método descrito a continuación.\n\n"]
    for i in range(num_examples):
        example = dataset[i]
        prompt_lines.extend([
            f"Clase: {example['class']}\n",
            f"Método: {example['method']}\n",
            f"Descripción: {example['description']}\n",
            f"JUnit Test Case:\n{example['junit_test_case']}\n\n"
        ])

    return ''.join(prompt_lines)

def generate_test_case_prompt_with_few_shot(data_test, num_records, few_shot_prompt):
    """
    Genera un prompt para creación de casos de prueba JUnit a partir de un dataset dado,
    usando ejemplos de few-shot como contexto.

    Args:
        data_test (list): Lista de ejemplos con los campos 'class', 'method', y 'description'.
        num_records (int): Número de registros a incluir en el prompt.
        few_shot_prompt (str): Prompt few-shot generado con ejemplos de referencia.

    Returns:
        str: Prompt completo para generación de casos de prueba JUnit.
    """
    # Asegurarse de no exceder el tamaño del dataset
    num_records = min(num_records, len(data_test))

    # Construcción del prompt, comenzando con el prompt few-shot
    prompt_lines = [few_shot_prompt, "Ahora genera test cases para los siguientes métodos:\n\n"]
    for i in range(num_records):
        record = data_test[i]
        prompt_lines.extend([
            f"Clase: {record['class']}\n",
            f"Método: {record['method']}\n",
            f"Descripción: {record['description']}\n",
            "JUnit Test Case:\n"  # El modelo generará el contenido
        ])

    return ''.join(prompt_lines)

# Generar el prompt few-shot con ejemplos de dataset_calculadora
few_shot_prompt = make_few_shot_prompt(dataset_calculadora, num_examples=2)

# Usar el prompt few-shot como contexto para generar test cases en data_test
generated_outputs_fewshot = generate_test_case_prompt_with_few_shot(data_test, num_records=len(data_test), few_shot_prompt=few_shot_prompt)

# Mostrar el prompt completo
print(f"TEST CASE WITH FEW-SHOT :\n{test_case_prompt}\n{'='*80}")


In [None]:
NAME_TEC_PROMPT = '/FewShot'
OUTPUT_DIR_FULL = CONFIG['TEST_DATASET_FOLDER'] + '/DataEvalOutput_'+current_datetime + NAME_TEC_PROMPT
os.makedirs(OUTPUT_DIR_FULL, exist_ok=True)

# Ruta al archivo de entrada generado por save_outputs_by_class
#FILE_PATH = OUTPUT_DIR_FULL + '/CSVParser_test_cases.txt' # Ruta al archivo de entrada generado por save_outputs_by_class
#OUTPUT_FILE_PATH = '/CSVParserTest.txt' # Ruta al archivo de salida donde se guardarán los códigos extraídos
save_outputs_by_class(data_test, generated_outputs_fewshot, output_dir=OUTPUT_DIR_FULL)

# Recorrer todos los archivos en el directorio OUTPUT_DIR_FULL
for filename in os.listdir(OUTPUT_DIR_FULL):
    # Verificar si el archivo termina en '_test_cases.txt'
    if filename.endswith('_test_cases.txt'):
        # Construir la ruta completa del archivo de entrada
        file_path = os.path.join(OUTPUT_DIR_FULL, filename)

        # Construir la ruta de salida con el sufijo "Test" en lugar de "_test_cases.txt"
        output_file_path = os.path.join(OUTPUT_DIR_FULL, filename.replace('_test_cases.txt', 'Test.txt'))

        # Ejecutar la función en el archivo actual
        extract_and_save_java_code_only(file_path, output_file_path)
        print(f'Archivo procesado y guardado en {output_file_path}')

### **3.3. Chain of Thought (CoT) Prompting**

In [None]:
def make_prompt_one_or_few_shot_pot(data_test, num_examples, start_index=0):
    """
    Genera una lista de prompts de tipo Program of Thoughts para un conjunto de ejemplos del dataset.

    Args:
        data_test (pd.DataFrame): DataFrame de entrada con las columnas necesarias.
        num_examples (int): Número de ejemplos para generar prompts.
        start_index (int): Índice a partir del cual comenzar a extraer ejemplos.

    Returns:
        list: Lista de prompts generados.
    """
    total_examples = len(data_test)
    num_examples = min(num_examples, total_examples - start_index)  # Ajustar el número de ejemplos

    # Construcción de prompts usando listas para concatenación eficiente
    prompts = [
        (
            f"Genera un test unitario para el método siguiente siguiendo estos pasos:\n\n"
            f"Paso 1: Lee y comprende la descripción del método.\n"
            f"Descripción del método: {data_test.iloc[i]['OnlyDescription']}\n"
            f"Paso 2: Identifica el comportamiento esperado del método.\n"
            f"Paso 3: Construye una clase de prueba JUnit en Java que verifique este comportamiento.\n"
            f"Paso 4: Incluye declaraciones de aserción relevantes en el método de prueba. Y asegurate de usar @Test\n\n"
            f"Class: {data_test.iloc[i]['Class']}\n"
            f"Method: {data_test.iloc[i]['Method']}\n"
            "JUnit en Java:\n"
        )
        for i in range(start_index, start_index + num_examples)
    ]
    return prompts

In [None]:
start_time = time.time()
# Inicializar W&B
wandb.init(
    project="Inf_Test_cases_GSON",
    name=f"PromptingCoT_{MODEL_NAME}_{current_datetime}",
    config={
        "num_examples": len(data_test),
        "model_name": BASE_MODEL_NAME,
        "description": "Generación de prompts estilo CoT"
    }
)

# Generación de los prompts y test cases
n = len(data_test)
prompts = make_prompt_one_or_few_shot_pot(data_test, n)
generated_outputs_pot = generate_test_case(prompts, model_base, tokenizer_base)

# Loggear la duración del proceso de generación
duration = time.time() - start_time
wandb.log({"generation_duration_seconds": duration})

# Mostrar los resultados generados
for i, (prompt, output) in enumerate(zip(prompts, generated_outputs_pot), 1):
    print(f"CoT PROMPT #{i}:\n{prompt}\n{'='*80}")
    print(f"MODEL GENERATION #{i}:\n{output}\n")

VBox(children=(Label(value='0.012 MB of 0.012 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

PoT PROMPT #1:
Genera un test unitario para el método siguiente siguiendo estos pasos:

Paso 1: Lee y comprende la descripción del método.
Descripción del método: /**
* Returns the next available {@link JsonElement} on the reader. Null if none available.
*
* @return the next available {@link JsonElement} on the reader. Null if none available.
* @throws JsonParseException if the incoming stream is malformed JSON.
* @since 1.4
*/
Paso 2: Identifica el comportamiento esperado del método.
Paso 3: Construye una clase de prueba JUnit en Java que verifique este comportamiento.
Paso 4: Incluye declaraciones de aserción relevantes en el método de prueba. Y asegurate de usar @Test

Class: JsonStreamParser
Method: next
JUnit en Java:

MODEL GENERATION #1:
Genera un test unitario para el método siguiente siguiendo estos pasos:

Paso 1: Lee y comprende la descripción del método.
Descripción del método: /**
* Returns the next available {@link JsonElement} on the reader. Null if none available.
*
* @

In [None]:
NAME_TEC_PROMPT = '/CoT'
#OUTPUT_DIR_FULL = CONFIG['OUTPUT_DIR'] + NAME_TEC_PROMPT
OUTPUT_DIR_FULL = TEST_DATASET_FOLDER + '/Llama'+current_datetime + NAME_TEC_PROMPT
os.makedirs(OUTPUT_DIR_FULL, exist_ok=True)

# Ruta al archivo de entrada generado por save_outputs_by_class
#FILE_PATH = OUTPUT_DIR_FULL + '/CSVParser_test_cases.txt' # Ruta al archivo de entrada generado por save_outputs_by_class
#OUTPUT_FILE_PATH = '/CSVParserTest.txt' # Ruta al archivo de salida donde se guardarán los códigos extraídos
save_outputs_by_class(data_test, generated_outputs_pot, output_dir=OUTPUT_DIR_FULL)

# Recorrer todos los archivos en el directorio OUTPUT_DIR_FULL
for filename in os.listdir(OUTPUT_DIR_FULL):
    # Verificar si el archivo termina en '_test_cases.txt'
    if filename.endswith('_test_cases.txt'):
        # Construir la ruta completa del archivo de entrada
        file_path = os.path.join(OUTPUT_DIR_FULL, filename)

        # Construir la ruta de salida con el sufijo "Test" en lugar de "_test_cases.txt"
        output_file_path = os.path.join(OUTPUT_DIR_FULL, filename.replace('_test_cases.txt', 'Test.txt'))

        # Ejecutar la función en el archivo actual
        extract_and_save_java_code_only(file_path, output_file_path)
        print(f'Archivo procesado y guardado en {output_file_path}')

# Finaliza la ejecución de W&B
wandb.finish()

Archivo guardado para la clase JsonStreamParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/JsonStreamParser_test_cases.txt
Archivo guardado para la clase Primitives: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/Primitives_test_cases.txt
Archivo guardado para la clase JsonNull: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/JsonNull_test_cases.txt
Archivo guardado para la clase JsonParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/JsonParser_test_cases.txt
Archivo guardado para la clase TypeToken: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/TypeToken_test_cases.txt
Archivo guardado para la clase JsonObject: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT/JsonObject_test_cases.txt
Archivo guardado para la clase JsonArray: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/PoT

VBox(children=(Label(value='0.369 MB of 0.369 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
generation_duration_seconds,▁

0,1
generation_duration_seconds,1405.00023


In [None]:
start_time = time.time()
# Inicializar W&B
wandb.finish()
wandb.init(
    project="Inf_Test_cases_CSV",
    name=f"PromptingCoT_{MODEL_NAME}_{current_datetime}",
    config={
        "num_examples": len(data_test),
        "model_name": BASE_MODEL_NAME,
        "description": "Generación de prompts estilo CoT"
    }
)

# Generación de los prompts y test cases
n = len(data_test)
prompts = make_prompt_one_or_few_shot_pot(data_test, n)
generated_outputs_pot = generate_test_case(prompts, model_base, tokenizer_base)

# Loggear la duración del proceso de generación
duration = time.time() - start_time
wandb.log({"generation_duration_seconds": duration})

# Mostrar los resultados generados
for i, (prompt, output) in enumerate(zip(prompts, generated_outputs_pot), 1):
    print(f"CoT PROMPT #{i}:\n{prompt}\n{'='*80}")
    print(f"MODEL GENERATION #{i}:\n{output}\n")

[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33mcjudithrb-work[0m ([33mcjudihtrb-work[0m). Use [1m`wandb login --relogin`[0m to force relogin


PoT PROMPT #1:
Genera un test unitario para el método siguiente siguiendo estos pasos:

Paso 1: Lee y comprende la descripción del método.
Descripción del método: /**
* Returns the character delimiting the values (typically ';', ',' or '\t').
*
* @return the delimiter character
*/
Paso 2: Identifica el comportamiento esperado del método.
Paso 3: Construye una clase de prueba JUnit en Java que verifique este comportamiento.
Paso 4: Incluye declaraciones de aserción relevantes en el método de prueba. Y asegurate de usar @Test

Class: CSVFormat
Method: getDelimiter
JUnit en Java:

MODEL GENERATION #1:
Genera un test unitario para el método siguiente siguiendo estos pasos:

Paso 1: Lee y comprende la descripción del método.
Descripción del método: /**
* Returns the character delimiting the values (typically ';', ',' or '\t').
*
* @return the delimiter character
*/
Paso 2: Identifica el comportamiento esperado del método.
Paso 3: Construye una clase de prueba JUnit en Java que verifique est

In [None]:
!wandb sync /content/wandb/run-20241115_225615-v07ztqyx

Find logs at: /content/wandb/debug-cli.root.log
Syncing: https://wandb.ai/cjudihtrb-work/Inf_Test_cases_CSV/runs/v07ztqyx ... done.


### **3.4. Chain-of-Code (CoC) Prompting**

In [None]:
def make_prompt_one_or_few_shot_coc(datatest, num_examples, start_index=0):
    """
    Genera una lista de prompts en estilo Chain-of-Code para un conjunto de ejemplos del dataset.

    Args:
        tokenized_dataset (dict): Dataset tokenizado con descripciones y casos de prueba.
        num_examples (int): Número de ejemplos para generar prompts.
        start_index (int): Índice a partir del cual comenzar a extraer ejemplos.
        class_name (str): Nombre de la clase en la cual se encuentra el método.
        method_name (str): Nombre del método para el cual se genera el test.

    Returns:
        list: Lista de prompts generados en estilo Chain-of-Code.
    """
    total_examples = len(datatest)
    num_examples = min(num_examples, total_examples - start_index)

    # Crear prompts en estilo Chain-of-Code
    prompts = [
        (
            f"Genera un test unitario JUnit en Java para el método descrito a continuación.\n"
            f"Clase: {datatest.iloc[i]['Class']}\n"
            f"Method: {datatest.iloc[i]['Method']}\n"
            f"Descripción: {datatest.iloc[i]['OnlyDescription']}\n\n"
            "Test JUnit en Java:\n"
        )
        for i in range(start_index, start_index + num_examples)
    ]

    return prompts

In [None]:
start_time = time.time()
# Inicializar W&B
wandb.init(
    project="Inf_Test_cases_GSON",
    name=f"PromptingCoC_{MODEL_NAME}_{current_datetime}",
    config={
        "num_examples": len(data_test),
        "model_name": BASE_MODEL_NAME,
        "description": "Generación de prompts estilo CoC"
    }
)

# Generación de los prompts y test cases
prompts = make_prompt_one_or_few_shot_coc(data_test, num_examples=len(data_test))
#generated_outputs_coc = generate_test_case(prompts, model_peft, tokenizer_peft)
generated_outputs_coc = generate_test_case(prompts, model_base, tokenizer_base)

# Loggear la duración del proceso de generación
duration = time.time() - start_time
wandb.log({"generation_duration_seconds": duration})

# Mostrar resultados
for i, (prompt, output) in enumerate(zip(prompts, generated_outputs_coc), 1):
    print(f"CoC PROMPT #{i}:\n{prompt}\n{'='*80}")
    print(f"MODEL GENERATION #{i}:\n{output}\n")

CoC PROMPT #1:
Genera un test unitario JUnit en Java para el método descrito a continuación.
Clase: JsonStreamParser
Method: next
Descripción: /**
* Returns the next available {@link JsonElement} on the reader. Null if none available.
*
* @return the next available {@link JsonElement} on the reader. Null if none available.
* @throws JsonParseException if the incoming stream is malformed JSON.
* @since 1.4
*/

Test JUnit en Java:

MODEL GENERATION #1:
Genera un test unitario JUnit en Java para el método descrito a continuación.
Clase: JsonStreamParser
Method: next
Descripción: /**
* Returns the next available {@link JsonElement} on the reader. Null if none available.
*
* @return the next available {@link JsonElement} on the reader. Null if none available.
* @throws JsonParseException if the incoming stream is malformed JSON.
* @since 1.4
*/

Test JUnit en Java:
```
public class JsonStreamParserTest {

    @Test
    public void testNext() throws Exception {
        JsonParser parser = ne

In [None]:
NAME_TEC_PROMPT = '/CoC'
#OUTPUT_DIR_FULL = CONFIG['OUTPUT_DIR'] + NAME_TEC_PROMPT
OUTPUT_DIR_FULL = TEST_DATASET_FOLDER + '/Llama'+current_datetime + NAME_TEC_PROMPT
os.makedirs(OUTPUT_DIR_FULL, exist_ok=True)

save_outputs_by_class(data_test, generated_outputs_coc, output_dir=OUTPUT_DIR_FULL)

# Recorrer todos los archivos en el directorio OUTPUT_DIR_FULL
for filename in os.listdir(OUTPUT_DIR_FULL):
    # Verificar si el archivo termina en '_test_cases.txt'
    if filename.endswith('_test_cases.txt'):
        # Construir la ruta completa del archivo de entrada
        file_path = os.path.join(OUTPUT_DIR_FULL, filename)

        # Construir la ruta de salida con el sufijo "Test" en lugar de "_test_cases.txt"
        output_file_path = os.path.join(OUTPUT_DIR_FULL, filename.replace('_test_cases.txt', 'Test.txt'))

        # Ejecutar la función en el archivo actual
        extract_and_save_java_code_only(file_path, output_file_path)
        print(f'Archivo procesado y guardado en {output_file_path}')

# Finaliza la ejecución de W&B
wandb.finish()

Archivo guardado para la clase JsonStreamParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/JsonStreamParser_test_cases.txt
Archivo guardado para la clase Primitives: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/Primitives_test_cases.txt
Archivo guardado para la clase JsonNull: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/JsonNull_test_cases.txt
Archivo guardado para la clase JsonParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/JsonParser_test_cases.txt
Archivo guardado para la clase TypeToken: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/TypeToken_test_cases.txt
Archivo guardado para la clase JsonObject: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC/JsonObject_test_cases.txt
Archivo guardado para la clase JsonArray: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/CoC

VBox(children=(Label(value='0.319 MB of 0.319 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
generation_duration_seconds,▁

0,1
generation_duration_seconds,1795.68771


### **3.5. Tree-of-Thoughts (ToT) Prompting**

In [None]:
def make_prompt_one_or_few_shot_tot(data_test, num_examples, start_index=0):
    """
    Genera una lista de prompts en estilo Tree-of-Thoughts para un conjunto de ejemplos del dataset.

    Args:
        tokenized_dataset: Dataset tokenizado que contiene descripciones y casos de prueba.
        num_examples: Número de ejemplos para generar prompts.
        start_index: Índice a partir del cual comenzar a extraer ejemplos.

    Returns:
        Una lista de prompts generados.
    """
    prompts = []
    total_examples = len(data_test)

    # Asegura que el número de ejemplos no exceda la longitud del dataset
    num_examples = min(num_examples, total_examples - start_index)

    for i in range(start_index, start_index + num_examples):
        #test_example = data_test[i]
        description = {data_test.iloc[i]['OnlyDescription']}

        # Prompt en formato Tree-of-Thoughts
        prompt = (
            f"Considera las siguientes opciones para generar un test case JUnit para el siguiente método: {data_test.iloc[i]['Method']}\n"
            f"Con descripcion: {description}\n"
            f"Opción 1: Crear un test que verifique el valor de retorno esperado del método.\n"
            f"Opción 2: Crear un test que verifique el comportamiento del método ante diferentes entradas.\n"
            f"Opción 3: Crear un test que evalúe los efectos secundarios del método (si modifica algún estado).\n\n"
            f"Genera el test case JUnit con las opciones anteriores como guía:\n"
        )

        prompt2 = (
            f"Imagina que deseas escribir un test unitario en JUnit para el siguiente método de la clase:\n\n"
            f"Clase: {data_test.iloc[i]['Class']}\n"
            f"Método: {data_test.iloc[i]['Method']}\n"
            f"Descripción del método: {description}\n\n"
            "Considera las siguientes opciones para crear un test efectivo:\n\n"
            "Opción 1: Verificar el valor de retorno esperado del método.\n"
            "- Define el resultado esperado para diferentes entradas del método.\n"
            "- Asegúrate de incluir tanto los casos típicos como los casos límite.\n\n"
            "Opción 2: Evaluar el comportamiento del método ante diferentes entradas.\n"
            "- Considera posibles entradas válidas e inválidas que el método podría recibir.\n"
            "- Asegúrate de verificar que el método maneje errores o valores atípicos correctamente.\n\n"
            "Opción 3: Evaluar los efectos secundarios del método.\n"
            "- Si el método modifica algún estado o variable global, verifica que los cambios sean los esperados.\n"
            "- Asegúrate de que no existan efectos secundarios no deseados.\n\n"
            "Usando las opciones anteriores como guía, genera un test case en JUnit que considere todos los aspectos relevantes para validar el método adecuadamente. Recuerda incluir aserciones claras y bien definidas para cada opción seleccionada en el test:\n"
        )
        prompts.append(prompt)

    return prompts

In [None]:
start_time = time.time()
# Inicializar W&B
wandb.init(
    project="Inf_Test_cases_GSON",
    name=f"PromptingToT_{MODEL_NAME}_{current_datetime}",
    config={
        "num_examples": len(data_test),
        "model_name": BASE_MODEL_NAME,
        "description": "Generación de prompts estilo ToT"
    }
)

# Generación de los prompts y test cases
n = len(data_test)
prompts = make_prompt_one_or_few_shot_tot(data_test, num_examples=n)
#generated_outputs_tot = generate_test_case(prompts, model_peft, tokenizer_peft)
generated_outputs_tot = generate_test_case(prompts, model_base, tokenizer_base)

# Loggear la duración del proceso de generación
duration = time.time() - start_time
wandb.log({"generation_duration_seconds": duration})

# Mostrar resultados
for i, (prompt, output) in enumerate(zip(prompts, generated_outputs_tot), 1):
    print(f"ToT PROMPT #{i}:\n{prompt}\n{'='*80}")
    print(f"MODEL GENERATION #{i}:\n{output}\n")

ToT PROMPT #1:
Considera las siguientes opciones para generar un test case JUnit para el siguiente método: next
Con descripcion: {'/**\n* Returns the next available {@link JsonElement} on the reader. Null if none available.\n*\n* @return the next available {@link JsonElement} on the reader. Null if none available.\n* @throws JsonParseException if the incoming stream is malformed JSON.\n* @since 1.4\n*/'}
Opción 1: Crear un test que verifique el valor de retorno esperado del método.
Opción 2: Crear un test que verifique el comportamiento del método ante diferentes entradas.
Opción 3: Crear un test que evalúe los efectos secundarios del método (si modifica algún estado).

Genera el test case JUnit con las opciones anteriores como guía:

MODEL GENERATION #1:
Considera las siguientes opciones para generar un test case JUnit para el siguiente método: next
Con descripcion: {'/**\n* Returns the next available {@link JsonElement} on the reader. Null if none available.\n*\n* @return the next av

In [None]:
start_time = time.time()
# Inicializar W&B
wandb.init(
    project="Inf_Test_cases_GSON",
    name=f"PromptingToT_{MODEL_NAME}_{current_datetime}",
    config={
        "num_examples": len(data_test),
        "model_name": BASE_MODEL_NAME,
        "description": "Generación de prompts estilo ToT"
    }
)

# Generación de los prompts y test cases
n = len(data_test)
prompts = make_prompt_one_or_few_shot_tot(data_test, num_examples=n)
#generated_outputs_tot = generate_test_case(prompts, model_peft, tokenizer_peft)
generated_outputs_tot = generate_test_case(prompts, model_base, tokenizer_base)

# Loggear la duración del proceso de generación
duration = time.time() - start_time
wandb.log({"generation_duration_seconds": duration})

# Mostrar resultados
for i, (prompt, output) in enumerate(zip(prompts, generated_outputs_tot), 1):
    print(f"ToT PROMPT #{i}:\n{prompt}\n{'='*80}")
    print(f"MODEL GENERATION #{i}:\n{output}\n")

ToT PROMPT #1:
Imagina que deseas escribir un test unitario en JUnit para el siguiente método de la clase:

Clase: JsonStreamParser
Método: next
Descripción del método: {'/**\n* Returns the next available {@link JsonElement} on the reader. Null if none available.\n*\n* @return the next available {@link JsonElement} on the reader. Null if none available.\n* @throws JsonParseException if the incoming stream is malformed JSON.\n* @since 1.4\n*/'}

Considera las siguientes opciones para crear un test efectivo:

Opción 1: Verificar el valor de retorno esperado del método.
- Define el resultado esperado para diferentes entradas del método.
- Asegúrate de incluir tanto los casos típicos como los casos límite.

Opción 2: Evaluar el comportamiento del método ante diferentes entradas.
- Considera posibles entradas válidas e inválidas que el método podría recibir.
- Asegúrate de verificar que el método maneje errores o valores atípicos correctamente.

Opción 3: Evaluar los efectos secundarios del

In [None]:
wandb.finish()

VBox(children=(Label(value='0.012 MB of 0.012 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

In [None]:
NAME_TEC_PROMPT = '/ToT'
#OUTPUT_DIR_FULL = CONFIG['OUTPUT_DIR'] + NAME_TEC_PROMPT
OUTPUT_DIR_FULL = TEST_DATASET_FOLDER + '/Llama'+current_datetime + NAME_TEC_PROMPT
os.makedirs(OUTPUT_DIR_FULL, exist_ok=True)

save_outputs_by_class(data_test, generated_outputs_tot, output_dir=OUTPUT_DIR_FULL)

# Recorrer todos los archivos en el directorio OUTPUT_DIR_FULL
for filename in os.listdir(OUTPUT_DIR_FULL):
    # Verificar si el archivo termina en '_test_cases.txt'
    if filename.endswith('_test_cases.txt'):
        # Construir la ruta completa del archivo de entrada
        file_path = os.path.join(OUTPUT_DIR_FULL, filename)

        # Construir la ruta de salida con el sufijo "Test" en lugar de "_test_cases.txt"
        output_file_path = os.path.join(OUTPUT_DIR_FULL, filename.replace('_test_cases.txt', 'Test.txt'))

        # Ejecutar la función en el archivo actual
        extract_and_save_java_code_only(file_path, output_file_path)
        print(f'Archivo procesado y guardado en {output_file_path}')

# Finaliza la ejecución de W&B
wandb.finish()

Archivo guardado para la clase JsonStreamParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/JsonStreamParser_test_cases.txt
Archivo guardado para la clase Primitives: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/Primitives_test_cases.txt
Archivo guardado para la clase JsonNull: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/JsonNull_test_cases.txt
Archivo guardado para la clase JsonParser: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/JsonParser_test_cases.txt
Archivo guardado para la clase TypeToken: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/TypeToken_test_cases.txt
Archivo guardado para la clase JsonObject: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT/JsonObject_test_cases.txt
Archivo guardado para la clase JsonArray: /content/drive/MyDrive/ColabNotebooks/DataEval/Gson/Llama20241128_133522/ToT

VBox(children=(Label(value='0.377 MB of 0.377 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
generation_duration_seconds,▁

0,1
generation_duration_seconds,1557.54523
