In [1]:
# %pip install --upgrade datasets groq

In [2]:
import requests
import os
from datasets import load_dataset

# Config

In [3]:
INPUT_DATASET = "dariolopez/justicio-BOE-A-1978-31229-constitucion-by-articles-qa"

In [4]:
SYSTEM_PROMPT = """
Como un experto en derecho y leyes españolas, tu tarea es responder preguntas sobre el Boletín Oficial del Estado (BOE) de España. Para ello, debes tener en cuenta y utilizar el contexto proporcionado para responder de forma precisa a la pregunta del usuario.
Asegúrate de responder siempre en español. Si no conoces la respuesta o no tienes suficiente información para responderla, simplemente admítelo; no intentes inventar una respuesta.
Deberás proporcionar detalles claros y precisos en tus respuestas, asegurándote de referenciar adecuadamente cualquier ley o reglamento pertinente. Tu objetivo es proporcionar respuestas útiles y precisas para ayudar a los usuarios a entender mejor el BOE y cómo se aplica a sus preguntas.
"""

In [5]:
SYSTEM_PROMPT_CONTEXT = """
El contexto tiene un formato de lista, donde cada elemento será un diccionario con dos claves:
[{'context': 'contexto necesario para contestar la pregunta', 'score': 0.8}]
La clave 'context' contendrá la información necesaria para contestar a la pregunta y la clave 'score' será una puntuación de entre 0.0 y 1.0. Deberás dar más importancia al contexto cuanto mayor sea el score.
En la respuesta no menciones nada sobre el contexto o los scores.
"""

In [6]:
URL = "http://95.217.231.93:5001/semantic_search"

In [7]:
dataset = load_dataset(INPUT_DATASET)

In [9]:
from groq import Groq
import json
import time


client = Groq(
    api_key=os.environ.get('GROQ_API_KEY'),
)

In [10]:
answers_groq = []
contexts = []

for idx, row in enumerate(dataset['train']):
    time.sleep(20)  # groq limits: https://console.groq.com/settings/limits
    try:
        docs = requests.get(URL, params={'input_query': row['question'], 'collection_name': 'justicio'}, timeout=1)
        context_preprocessed = [{"context": doc[0]['page_content'], "score": doc[1]} for doc in docs.json()]
        messages = [
            {"role": "system", "content": SYSTEM_PROMPT},
            {
                "role": "system",
                "content": SYSTEM_PROMPT_CONTEXT,
            },
            {"role": "system", "content": "A continuación se proporciona el contexto:"},
            {"role": "system", "content": str(context_preprocessed)},
            {
                "role": "system",
                "content": "A continuación se proporciona la pregunta del usuario:",
            },
            {"role": "user", "content": row['question']},
        ]
        chat_completion = client.chat.completions.create(
            messages=messages,
            model="llama3-70b-8192",
            temperature=0,
            max_tokens=2048,
            stream=False,
        )
        answer = chat_completion.choices[0].message.content
    
    except Exception as e:
        print(e)
        answer = None

    answers_groq.append(answer)
    contexts.append(context_preprocessed)
    print(f"{idx+1} - {row['question']}")
    print(row['answer'])
    print(answer)
    print("\n\n")

1 - ¿Cuáles son los valores superiores del ordenamiento jurídico en España?
La libertad, la justicia, la igualdad y el pluralismo político.
Según la Constitución Española de 1978, los valores superiores del ordenamiento jurídico en España son la justicia, la libertad, la igualdad y el pluralismo político. Estos valores se establecen en el Preámbulo de la Constitución y se desarrollan a lo largo del texto constitucional.

En particular, el artículo 1.1 de la Constitución establece que "España es un Estado social y democrático de Derecho, que propugna como valores superiores de su ordenamiento jurídico la libertad, la justicia, la igualdad y el pluralismo político".

Estos valores superiores guían la interpretación y aplicación del derecho en España y son la base del ordenamiento jurídico español.



2 - ¿Quién es el titular de la soberanía nacional en España?
El pueblo español.
Según el artículo 1.2 de la Constitución Española, la soberanía nacional reside en el pueblo español. Esto sig

In [11]:
len(answers_groq)

515

In [12]:
len(contexts)

515

In [13]:
dataset

DatasetDict({
    train: Dataset({
        features: ['number', 'context', 'question', 'answer'],
        num_rows: 515
    })
})

In [14]:
dataset['train'] = dataset['train'].add_column('context_qa', contexts)
dataset['train'] = dataset['train'].add_column('response_groq_llama3_70b_8192', answers_groq)

In [15]:
dataset

DatasetDict({
    train: Dataset({
        features: ['number', 'context', 'question', 'answer', 'context_qa', 'response_groq_llama3_70b_8192'],
        num_rows: 515
    })
})

In [16]:
import huggingface_hub

huggingface_hub.login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

In [17]:
dataset.push_to_hub(f"{INPUT_DATASET}-qa-groq_llama3_70b_8192")

Uploading the dataset shards:   0%|          | 0/1 [00:00<?, ?it/s]

Creating parquet from Arrow format:   0%|          | 0/1 [00:00<?, ?ba/s]

README.md:   0%|          | 0.00/659 [00:00<?, ?B/s]

CommitInfo(commit_url='https://huggingface.co/datasets/dariolopez/justicio-BOE-A-1978-31229-constitucion-by-articles-qa-qa-groq_llama3_70b_8192/commit/3a3a46039ebfc36a3554740381bea0820a84b5c2', commit_message='Upload dataset', commit_description='', oid='3a3a46039ebfc36a3554740381bea0820a84b5c2', pr_url=None, pr_revision=None, pr_num=None)