In [1]:
import json
import requests
from openai import OpenAI
client = OpenAI()

with open('questions_and_queries.json', 'r', encoding='utf-8') as file:
    example_data = json.load(file)

with open('annotations_2.json', 'r', encoding='utf-8') as file: #annotation_2 is what I named the new annotations file
    label_data = json.load(file)

    
def generate_sparql_query(user_question, label_data, examples_data):
    concepts_and_labels = "\n".join(
        f"URI of Label: {pair['uri']}\nLabel: {pair['label']}\n" for pair in label_data
    )
    example_queries = "\n".join(
        f"User Question: {pair['user_question']}\nSPARQL Query: {pair['sparql_query']}\n" for pair in examples_data
    )

    prompt = f"""
    The following are all the labels for the decisions in the decisions dataset and their URIs:

    {concepts_and_labels}

    Based on the user's question: {user_question}, go through all the labels then choose at least 1 label that best matches the question's theme and context. 

    Get the URIs of the chosen label(s), these will be used in the next step.

    NEXT STEP:

    The following are examples of user questions in Dutch and their corresponding SPARQL queries:

    {example_queries}

    Based on the examples above and the URIs of the chosen labels, generate a SPARQL query for the following user question:

    User Question: {user_question}
    SPARQL Query:

    But please make sure to use the URIs of the chosen labels in the "?annotation oa:hasBody" part of the query like in the examples. 
    
    If there is more than one URI, you can separate them with a comma. 
    
    Make sure to not include any extra spaces or '\n' characters in the query.

    Give only the query as the answer.
    """
    response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "system", "content": "You are a helpful assistant that generates SPARQL queries to be run on a SPARQL endpoint containing data about decisions of the city of Gent based on user questions and labels of decisions related to their questions. Your language is Dutch."},
                {"role": "user", "content": prompt}
            ],
            max_tokens=1000,
            temperature=0
        )

    return response

# Example user question
user_question = "Wat waren de laatste 3 besluiten betreffende de middelbare school in Gent?"

# Generate SPARQL query for the example user question
sparql_query = generate_sparql_query(user_question, label_data=label_data, examples_data=example_data)
print(f"User Question: {user_question}")
print(f"Generated SPARQL Query: {sparql_query}")

User Question: Wat waren de laatste 3 besluiten betreffende de middelbare school in Gent?
Generated SPARQL Query: ChatCompletion(id='chatcmpl-9lWooz7NwsvHIzIIuHmatsB6O5de3', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="PREFIX prov: <http://www.w3.org/ns/prov#> \nPREFIX besluit: <http://data.vlaanderen.be/ns/besluit#> \nPREFIX eli: <http://data.europa.eu/eli/ontology#> \nPREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> \nPREFIX oa: <http://www.w3.org/ns/oa#> \n\nSELECT ?annotation ?target ?title ?motivering (GROUP_CONCAT(?value; separator=', ') AS ?values) ?description ?date ?derivedFrom \nWHERE { \n    ?annotation oa:hasBody <http://stad.gent/id/concepts/policy_domains_themes/concept_89> ; \n                oa:hasTarget ?target . \n    ?target eli:title ?title ; \n            besluit:motivering ?motivering ; \n            prov:value ?value ; \n            eli:description ?description ; \n            eli:date_publication ?

In [2]:
query_content = sparql_query.choices[0].message.content
query_content_no_newlines = query_content.replace("\n", " ")

endpoint_url = "https://probe.stad.gent/sparql"
headers = {
    "Accept": "application/sparql-results+json"
}
params = {
    "query": query_content_no_newlines
}

response = requests.get(endpoint_url, headers=headers, params=params)
if response.status_code == 200:
    results = response.json()
    print(f"Results for question '{user_question}':", results)
else:
    print(f"Failed to execute query for question '{user_question}':", response.status_code)

Results for question 'Wat waren de laatste 3 besluiten betreffende de middelbare school in Gent?': {'results': {'ordered': True, 'distinct': False, 'bindings': [{'values': {'value': '\n                                                \n        \n            Artikel 1\n            \n            \n                Keurt goed de amendering van het gemeenteraadsbesluit betreffende de wijziging aan het reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\', geagendeerd op de gemeenteraad van mei 2022, in die zin dat:\xa0een aangepaste versie van de gecoördineerde versies van het reglement als bijlage bij het gemeenteraadsbesluit wordt gevoegd ter vervanging van de oorspronkelijke bijlageneen artikel wordt tussengevoegd dat luidt als volgt:Vervangt artikel 2, §1 d van het Reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\' zoals goedgekeurd door d

In [3]:
query_content

"PREFIX prov: <http://www.w3.org/ns/prov#> \nPREFIX besluit: <http://data.vlaanderen.be/ns/besluit#> \nPREFIX eli: <http://data.europa.eu/eli/ontology#> \nPREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> \nPREFIX oa: <http://www.w3.org/ns/oa#> \n\nSELECT ?annotation ?target ?title ?motivering (GROUP_CONCAT(?value; separator=', ') AS ?values) ?description ?date ?derivedFrom \nWHERE { \n    ?annotation oa:hasBody <http://stad.gent/id/concepts/policy_domains_themes/concept_89> ; \n                oa:hasTarget ?target . \n    ?target eli:title ?title ; \n            besluit:motivering ?motivering ; \n            prov:value ?value ; \n            eli:description ?description ; \n            eli:date_publication ?date ; \n            prov:wasDerivedFrom ?derivedFrom . \n} \nLIMIT 3"

In [4]:
results_content = results['results']['bindings']

In [13]:
results_content

[{'values': {'value': '\n                                                \n        \n            Artikel 1\n            \n            \n                Keurt goed de amendering van het gemeenteraadsbesluit betreffende de wijziging aan het reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\', geagendeerd op de gemeenteraad van mei 2022, in die zin dat:\xa0een aangepaste versie van de gecoördineerde versies van het reglement als bijlage bij het gemeenteraadsbesluit wordt gevoegd ter vervanging van de oorspronkelijke bijlageneen artikel wordt tussengevoegd dat luidt als volgt:Vervangt artikel 2, §1 d van het Reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\' zoals goedgekeurd door de gemeenteraad van 18 december 2019 als volgt:"d. Het inschrijvingsgeld in het deeltijds kunstonderwijs voor houders van een UiTPAS met kansentarief per schoolj

In [17]:
import re
cleaned_decisions = []
resources = []

for decision in results_content:
    cleaned_decision = {}
    for key, detail in decision.items():
        # Extract the value and remove any \n or extra spaces
        cleaned_value = re.sub(r'\s+', ' ', detail['value']).strip()
        cleaned_decision[key] = cleaned_value
    cleaned_decisions.append(cleaned_decision)

# Print or use the cleaned_decisions as needed
for d in cleaned_decisions:
    print(d)

for d in cleaned_decisions:
    resources.append(d['derivedFrom'])

{'values': 'Artikel 1 Keurt goed de amendering van het gemeenteraadsbesluit betreffende de wijziging aan het reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\', geagendeerd op de gemeenteraad van mei 2022, in die zin dat: een aangepaste versie van de gecoördineerde versies van het reglement als bijlage bij het gemeenteraadsbesluit wordt gevoegd ter vervanging van de oorspronkelijke bijlageneen artikel wordt tussengevoegd dat luidt als volgt:Vervangt artikel 2, §1 d van het Reglement \'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd\' zoals goedgekeurd door de gemeenteraad van 18 december 2019 als volgt:"d. Het inschrijvingsgeld in het deeltijds kunstonderwijs voor houders van een UiTPAS met kansentarief per schooljaar bedraagt:Volwassenen20% van het door Vlaanderen vastgelegde tarief* voor volwassenenMinderjarigen20% van het door Vlaanderen vast

In [18]:
prompt_2 = f"""
  The following is the question the user asked:

  {user_question}

  Based on the following data only, generate a response that answers their question, don't hallucinate:

  Data: {cleaned_decisions}
  Answer in the language the user asked in. Be sure to be friendly and explain in a way an ordinary person can understand. The language city officials use is often very different from the language citizens use (officials wind up speaking in departments and form numbers instead of needs in big organizations).

  Show the {resources} to the end-user so they can refer to them if they want.
  """

completion_2 = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "system", "content": "You are a helpful assistant for the citizens of Gent when they ask a question on the city's website regarding the decisions made by the city. Be friendly, speak in easy to use terms. You use both the user's question and relevant decisions passed to you."},
    {"role": "user", "content": prompt_2}
  ]
)

print(completion_2.choices[0].message.content)

De laatste drie besluiten betreffende middelbare scholen in Gent waren:

1. **Besluit 1:** Amendement van het college van burgemeester en schepenen betreffende de wijziging van het reglement 'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd'. Dit besluit gaat over aanpassingen in de inschrijvingsgelden voor het deeltijds kunstonderwijs voor houders van een UiTPAS met kansentarief.

2. **Besluit 2:** Wijzigt de selectieprocedure voor selectie- en bevorderingsambten en mandaten binnen het Stedelijk Onderwijs Gent en het iCLB. Dit besluit betreft veranderingen in de selectieprocedure voor verschillende functies binnen het onderwijs in Gent.

3. **Besluit 3:** Amendement van het gemeenteraadsbesluit betreffende de wijziging aan het reglement 'Retributie voor diensten van administratieve en technische aard van het Departement Onderwijs, Opvoeding en Jeugd'. Dit besluit bevat opnieuw aanpassingen met betrekking tot inschrijving