## Chatbot

In [None]:
import fitz
import os
from dotenv import load_dotenv

load_dotenv()

from google.generativeai import GenerativeModel, embed_content
# Konfigurera API-nyckeln direkt. Detta är det nya standardiserade sättet.
import google.generativeai as genai # Behåll denna för att kunna kalla genai.generate_content etc.
genai.configure(api_key=os.getenv("API_KEY"))


#### Testing the API

In [36]:
model = genai.GenerativeModel('gemini-2.0-flash')

response = model.generate_content(   
    contents="Hej där, vem pratar jag med? Kan du säga ett skämt om personer som spelar terraforming mars?"
)
print(response.text)

Hallå där! Du pratar med en stor språkmodell, en sorts AI. 

Här är ett skämt om Terraforming Mars:

Varför tar det så lång tid att spela Terraforming Mars?

För att alla är så upptagna med att terraformera Mars att ingen hinner terraformera bordet och städa upp efter sig!



### Extracting Text from a PDF File

In [None]:
def extract_text_from_pdf(pdf_path):
    """
    Extracts text from a PDF file and prints the first `num_chars` characters.

    Args:
    pdf_path (str): Path to the PDF file.

    Returns:
    str: Extracted text from the PDF.
    """
    # Open the PDF file
    mypdf = fitz.open(pdf_path)
    all_text = ""  # Initialize an empty string to store the extracted text

    # Iterate through each page in the PDF
    for page_num in range(mypdf.page_count):
        page = mypdf[page_num]  # Get the page
        text = page.get_text("text")  # Extract text from the page
        all_text += text  # Append the extracted text to the all_text string

    return all_text  # Return the extracted text

def read_txt_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as f:
        project_cards = f.read()
    return project_cards


# Datamapp path
data_folder_path = r"C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\data" #

# Lista för att lagra all text från regelböcker (PDFs)
all_rule_books_content = []

# Lista för att lagra all text från projektkort (TXTs)
all_project_cards_content = []

# Iterera över alla filer i data-mappen
for filename in os.listdir(data_folder_path): #
    file_path = os.path.join(data_folder_path, filename) #

    if filename.lower().endswith(".pdf"): #

        print(f"Läser in PDF: {filename}")
        extracted_text = extract_text_from_pdf(file_path)
        if extracted_text: # Lägg bara till om text extraherades framgångsrikt
            all_rule_books_content.append({"filename": filename, "content": extracted_text}) #

    elif filename.lower().endswith(".txt"): # Identifiera om det är projektkort eller andra txt-filer. Kan också lägga till fler txt-filer med fler kort i framtiden.
        if "project_cards" in filename.lower(): #
            print(f"Läser in TXT (projektkort): {filename}")
            extracted_text = read_txt_file(file_path)
            if extracted_text: # Lägg bara till om text extraherades framgångsrikt
                all_project_cards_content.append({"filename": filename, "content": extracted_text}) #
        else:
            print(f"Skippar TXT: {filename} (inte identifierad som projektkort)")
    else:
        print(f"Skippar fil: {filename} (varken PDF eller TXT)")

# Skriv ut en sammanfattning
print(f"\nTotalt antal regelböcker (PDFs) inlästa: {len(all_rule_books_content)}")
if all_rule_books_content:
    print(f"Exempel (första 200 tecken från första regelboken '{all_rule_books_content[0]['filename']}'):\n{all_rule_books_content[0]['content'][:200]}\n")

print(f"Totalt antal projektkortsfiler (TXTs) inlästa: {len(all_project_cards_content)}")
if all_project_cards_content:
    print(f"Exempel (första 200 tecken från första projektkortsfilen '{all_project_cards_content[0]['filename']}'):\n{all_project_cards_content[0]['content'][:200]}\n")

# Slå samman all regelbokstext till en enda sträng för chunking och embedding
combined_rule_book_text = ""
for rb in all_rule_books_content:
    combined_rule_book_text += rb["content"] + "\n\n" # Lägg till lite separation mellan dokumenten

# Slå samman all projektkortstext till en enda sträng för chunking och embedding
combined_project_cards_text = ""
for pc in all_project_cards_content:
    combined_project_cards_text += pc["content"] + "\n\n"

print(f"Storlek på kombinerad regelbokstext: {len(combined_rule_book_text)} tecken")
print(f"Storlek på kombinerad projektkortstext: {len(combined_project_cards_text)} tecken")



Läser in PDF: AMAZONIS_and_VASTITAS_ENG.pdf
Läser in PDF: Automa-rulebook-A-08-15-2023.pdf
Läser in PDF: Automa-rulebook-B-08-15-2023.pdf
Läser in PDF: Automa-rulebook-C-11-14-2023.pdf
Läser in PDF: COLONIES_ENG.pdf
Skippar fil: evaluation_questions.json (varken PDF eller TXT)
Läser in PDF: HELLAS_and_ELYSIUM_ENG.pdf
Läser in PDF: PRELUDE2_RULES_ENG.pdf
Läser in PDF: PRELUDE_ENG_RULES.pdf
Läser in TXT (projektkort): Terraforming_Mars_Project_Cards.txt
Läser in PDF: Terraforming_mars_rulebook_english.pdf
Läser in PDF: Terraforming_mars_rulebook_swedish.pdf
Läser in PDF: TURMOIL_ENG.pdf
Läser in PDF: UTOPIA_and_ CIMERIA_ENG.pdf
Läser in PDF: VENUS_ENG.pdf

Totalt antal regelböcker (PDFs) inlästa: 12
Exempel (första 200 tecken från första regelboken 'AMAZONIS_and_VASTITAS_ENG.pdf'):
EXTRA MATERIAL INCLUDED!
Explore the ancient sea of Vastitas Borealis, or play the larger Amazonis map 
with longer global parameters! Each map depicts a new region of Mars, with new 
placement bonuse

Totalt 

In [None]:
# Denna cell används bara när EN regelbok och EN projektkortsfilanvändes
# pdf_path = r"C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\data\terraforming_mars_rule_english.pdf"
# txt_file_path =r"C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\data\Terraforming_Mars_Project_Cards.txt"

# rule_book = extract_text_from_pdf(pdf_path)
# print(rule_book[:200])

# project_cards_text = read_txt_file(txt_file_path)
# print(f"\nDe första 200 tecknen från projektkorten:\n\n{project_cards_text[:200]}")

### Chunking the rule book

In [None]:
def chunk_text(text, n, overlap):
    """
    Chunks the given text into segments of n characters with overlap.
    """
    chunks = []
    for i in range(0, len(text), n - overlap):
        chunks.append(text[i:i + n])
    return chunks

chunk_size = 1000
chunk_overlap = 100

# Använder den sammanslagna texten av all regelböcker
rule_book_chunks = chunk_text(combined_rule_book_text, chunk_size, chunk_overlap)

print(f"Antal chunks i regelböckerna: {len(rule_book_chunks)}")
print("\nFörsta chunk:\n", rule_book_chunks[0])
if len(rule_book_chunks) > 1:
    print("\nAndra chunk:\n", rule_book_chunks[1])

Antal chunks i regelboken: 190

Första chunk:
 EXTRA MATERIAL INCLUDED!
Explore the ancient sea of Vastitas Borealis, or play the larger Amazonis map 
with longer global parameters! Each map depicts a new region of Mars, with new 
placement bonuses, ocean areas, and new sets of milestones and awards.
AMAZONIS PLANITIA
	
This map takes it’s name from the 
lava plains west of the mighty Olympus Mons. 
This area is highlighted by energy bonuses and 
is extremely flat and smooth compared to the 
mountains and craters covering much of Mars. 
This larger map features longer global 
parameters for a better 4-5 player experience. 
Or maybe you just want more space to settle 
and more terraforming for yourself. Here you 
also find wild resource bonuses that give you any 
standard resource. The delegate bonuses let you 
place delegates for free from the Reserve (ignore 
if not playing with Turmoil). Noctis City may be 
placed without its restriction, and volcanic areas are highlighted:  Olympus 

## Chunking of playing cards

In [None]:
import re

def chunk_project_cards(text, card_id_regex):
    """
    Delar upp texten i chunks baserat på ett regex-mönster för kort-ID.
    Varje chunk kommer att börja med det ID som matchade.
    Hanterar även eventuell Byte Order Mark (BOM) i början av texten.
    """
    if text.startswith('\ufeff'):
        text = text[1:]

    split_pattern = f"(?={card_id_regex})"
    chunks = re.split(split_pattern, text)

    processed_chunks = []
    for chunk in chunks:
        stripped_chunk = chunk.strip()
        if stripped_chunk:
            processed_chunks.append(stripped_chunk)

    return processed_chunks

# Regex pattern
card_identifier_pattern = r"[CP\d]\d{2}gcolor>:"

# Används när EN specifik txt-fil ska öppnas med nuvarande kod kan jag flera txt-filer för projektkort slås samman.
# with open(txt_file_path, 'r', encoding='utf-8') as f:
#     project_cards_text = f.read()

# Använd den sammanslagna projektkortstexten (även om det nu bara är en fil)
project_card_chunks = chunk_project_cards(combined_project_cards_text, card_identifier_pattern)

print(f"Antal projektkort funna: {len(project_card_chunks)}")
if project_card_chunks:
    print("\nFörsta projektkortet:\n", project_card_chunks[0])
if len(project_card_chunks) > 1:
    print("\nAndra projektkortet:\n", project_card_chunks[1])
if len(project_card_chunks) > 2:
    print("\nTredje projektkortet:\n", project_card_chunks[2])

Antal projektkort funna: 352

Första projektkortet:
 001gcolor>: Colonizer Training Camp
Jovian tag, Building tag
Cost: 8
Requires: max 5% O2
------
(Oxygen must be 5% or less.)
VP: 2

Andra projektkortet:
 002gcolor>:* Asteroid Mining Consortium
Jovian tag
Cost: 13
Requires: Titanium production
------
Decrease any-Titanium 1
Increase Titanium 1
(Requires that you have titanium production. Decrease any titanium production 1 step and increase your own 1 step.)
VP: 1

Tredje projektkortet:
 003gcolor>: Deep Well Heating
Power tag, Building tag
Cost: 13
------
Increase Energy 1
TempUp
(Increase your Energy production 1 step. Increase temperature 1 step.)


### Prepairing the chunks with metadata

In [None]:
### Prepairing the chunks with metadata
print("\n--- Förbereder chunks och metadata ---")
all_chunks_data = []

# Lägg till regelbokschunks
# Här lägger vi till vart PDF chunken kommer ifrån
for rb_data in all_rule_books_content:
    filename = rb_data["filename"]
    rule_book_chunks_for_file = chunk_text(rb_data["content"], chunk_size, chunk_overlap) # Chunk:a varje fil separat
    for i, chunk_content in enumerate(rule_book_chunks_for_file):
        all_chunks_data.append({
            "id": f"rule_chunk_{filename}_{i}", # Unikt ID som inkluderar filnamnet
            "text": chunk_content,
            "source": filename # Ange källfilen
        })

# Lägg till projektkortschunks
# Här lägger vi till vart TXT chunken kommer ifrån
for pc_data in all_project_cards_content:
    filename = pc_data["filename"]
    project_card_chunks_for_file = chunk_project_cards(pc_data["content"], card_identifier_pattern) # Chunk:a varje fil separat
    for i, chunk_content in enumerate(project_card_chunks_for_file):
        card_id_match = re.match(card_identifier_pattern, chunk_content)
        card_id = card_id_match.group(0) if card_id_match else f"card_{i}"
        all_chunks_data.append({
            "id": f"project_card_{filename}_{card_id.replace('gcolor>:', '').strip()}", # Unikt ID som inkluderar filnamnet
            "text": chunk_content,
            "source": filename,
            "card_ref": card_id
        })

print(f"Totalt antal chunks att bearbeta: {len(all_chunks_data)}")
if all_chunks_data:
    print(f"Exempel på chunkdata (första): {all_chunks_data[0]['id']}, source: {all_chunks_data[0]['source']}")
    # Hitta första projektkortet för att visa exempel
    first_project_card_example = next((item for item in all_chunks_data if item['source'].lower().endswith('.txt')), None)
    if first_project_card_example:
        print(f"Exempel på chunkdata (första kortet): {first_project_card_example['id']}, source: {first_project_card_example['source']}")


--- Förbereder chunks och metadata ---
Totalt antal chunks att bearbeta: 546
Exempel på chunkdata (första): rule_chunk_AMAZONIS_and_VASTITAS_ENG.pdf_0, source: AMAZONIS_and_VASTITAS_ENG.pdf
Exempel på chunkdata (första kortet): project_card_Terraforming_Mars_Project_Cards.txt_001, source: Terraforming_Mars_Project_Cards.txt


### Embeddings

In [43]:
# Använd en specifik embeddingmodell
embedding_model_name = 'models/embedding-001'

def generate_embeddings_batch(texts, model_name, task_type="RETRIEVAL_DOCUMENT"):
    """Genererar embeddings för en lista med texter i batchar."""
    all_embeddings = []
    # API:et har en gräns på 100 texter per anrop för embed_content
    batch_size = 100
    for i in range(0, len(texts), batch_size):
        batch_texts = texts[i:i + batch_size]
        try:
            # För dokument som ska lagras för sökning, använd RETRIEVAL_DOCUMENT
            # För en sökfråga, använd RETRIEVAL_QUERY
            result = genai.embed_content(
                model=model_name,
                content=batch_texts,
                task_type=task_type
            )
            all_embeddings.extend(result['embedding'])
            print(f"  Skapade embeddings för batch {i//batch_size + 1}/{(len(texts)-1)//batch_size + 1}")
        except Exception as e:
            print(f"  Fel vid skapande av embedding för batch {i//batch_size + 1}: {e}")
            # Lägg till None för misslyckade embeddings i denna batch för att behålla längdmatchning
            all_embeddings.extend([None] * len(batch_texts))
    return all_embeddings

# Extrahera endast texten för embedding
texts_to_embed = [data["text"] for data in all_chunks_data]
chunk_embeddings_list = generate_embeddings_batch(texts_to_embed, embedding_model_name)

# Filtrera bort chunks där embedding misslyckades
successful_chunks_data = []
successful_embeddings = []
for i, emb in enumerate(chunk_embeddings_list):
    if emb is not None:
        successful_chunks_data.append(all_chunks_data[i])
        successful_embeddings.append(emb)
    else:
        print(f"  Kunde inte skapa embedding för chunk: {all_chunks_data[i]['id']}")

print(f"Antal chunks med lyckade embeddings: {len(successful_embeddings)}")

  Skapade embeddings för batch 1/6
  Skapade embeddings för batch 2/6
  Skapade embeddings för batch 3/6
  Skapade embeddings för batch 4/6
  Skapade embeddings för batch 5/6
  Skapade embeddings för batch 6/6
Antal chunks med lyckade embeddings: 546


### Vector database with ChromaDB

In [None]:
import chromadb

print("\n--- Sätter upp och fyller ChromaDB ---")

# Sökväg till ChromaDB-mapp
persistent_db_path = r"C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\chroma_db"

# Skapar och lagrar databasen
client = chromadb.PersistentClient(path=persistent_db_path) 
print(f"  Använder persistent ChromaDB.")

# Skapa en collection (eller hämta om den redan finns)
collection_name = "terraforming_mars_rag"

# --- Hantering av befintlig collection ---
# Denna logik är bra under utveckling för att alltid starta med en ren databas.
# Om man vill BEHÅLLA datan mellan körningar, kommentera BORT hela try-except-blocket nedan
# OCH byt ut 'collection = client.create_collection(...)' mot
# 'collection = client.get_or_create_collection(...)' längre ner.
try:
    client.delete_collection(name=collection_name)
    print(f"  Tog bort befintlig collection: {collection_name}")
except Exception as e:
    print(f"  Ingen befintlig collection '{collection_name}' att ta bort, eller fel: {e}")
    pass 

# Skapa den nya, tomma collectionen.
collection = client.create_collection(name=collection_name)
print(f"  Skapade ny collection: {collection_name}")

# Förbered data för ChromaDB: ids, documents, metadatas, embeddings
chroma_ids = [data["id"] for data in successful_chunks_data]
chroma_documents = [data["text"] for data in successful_chunks_data]
chroma_metadatas = [{"source": data["source"], "card_ref": data.get("card_ref", "N/A")} for data in successful_chunks_data]

# Embeddings är redan en lista av listor (list of_vectors)
if successful_embeddings and chroma_ids:
    collection.add(
        embeddings=successful_embeddings,
        documents=chroma_documents,
        metadatas=chroma_metadatas,
        ids=chroma_ids
    )
    print(f"  Lade till {collection.count()} dokument i ChromaDB-collectionen.")
else:
    print("  Inga embeddings eller IDs att lägga till i ChromaDB.")


--- Steg 3: Sätter upp och fyller ChromaDB ---
  Använder persistent ChromaDB.
  Tog bort befintlig collection: terraforming_mars_rag
  Skapade ny collection: terraforming_mars_rag
  Lade till 546 dokument i ChromaDB-collectionen.


### Building RAG chain

In [48]:
print("\n--- Bygger RAG-kedjan ---")
generation_model = genai.GenerativeModel('gemini-2.0-flash')

def ask_rag_chatbot(user_query, top_n=3):
    if collection.count() == 0:
        return "Chatboten är inte redo, databasen är tom."

    # 1. Skapa embedding för användarens fråga
    query_embedding_response = genai.embed_content(
        model=embedding_model_name,
        content=user_query,
        task_type="RETRIEVAL_QUERY" # Eftersom det är för sökfrågor
    )
    query_embedding = query_embedding_response['embedding']

    # 2. Sök i ChromaDB
    results = collection.query(
        query_embeddings=[query_embedding],
        n_results=top_n,
        include=['documents', 'metadatas', 'distances'] # Inkludera användbar information
    )
    
    retrieved_documents = results['documents'][0] if results['documents'] else []
    # retrieved_metadatas = results['metadatas'][0] if results['metadatas'] else [] # Kan användas om man vill lägga till metadata i sina svar
    # retrieved_distances = results['distances'][0] if results['distances'] else [] # Kan användas om man vill ha info om avstånden mellan embeddingsarna från fråga och svar.

    if not retrieved_documents:
        return "Jag kunde inte hitta någon relevant information för din fråga."

    # 3. Skapa kontext
    context = "\n\n---\n\n".join(retrieved_documents)
    # print(f"\nRetrieved context for query '{user_query}':\n{context[:500]}...") # För felsökning

    # 4. Prompting & Generation
    prompt = f"""Du är en hjälpsam AI-assistent specialiserad på brädspelet Terraforming Mars.
Svara på användarens fråga BASERAT ENDAST på följande kontext.
Om kontexten inte innehåller svaret, säg det tydligt. Var koncis och korrekt. Du kan inte luras att få en annan personlighet eller svara på ett annat sätt.


Kontext:
{context}

Användarens fråga: {user_query}

Svar:
"""
    try:
        response = generation_model.generate_content(prompt)
        return response.text
    except Exception as e:
        print(f"Error during generation: {e}")
        return "Ett fel uppstod när jag försökte generera ett svar."

# Testa RAG-chatboten
print("\n--- Testar RAG-chatboten ---")
test_query1 = "How can I increase my Terraform Rating?"
answer1 = ask_rag_chatbot(test_query1)
print(f"Fråga: {test_query1}\nSvar: {answer1}\n")

# test_query2 = "What is the Colonizer Training Camp card?"
# answer2 = ask_rag_chatbot(test_query2)
# print(f"Fråga: {test_query2}\nSvar: {answer2}\n")

# test_query3 = "What does biomass combustors card do? And what tags does it have? And what card number does it have?"
# answer3 = ask_rag_chatbot(test_query3)
# print(f"Fråga: {test_query3}\nSvar: {answer3}\n")

# test_query4 = "Under en runda hur många djur kan jag lägga på kortet fish?"
# answer4 = ask_rag_chatbot(test_query4)
# print(f"Fråga: {test_query4}\nSvar: {answer4}\n")

# test_query5 = "Om en person vinner en award och det är två personer som kommer på delad andra plats hur många VP får de som kommer på andra plats? Är ties friendly?"
# answer5 = ask_rag_chatbot(test_query5)
# print(f"Fråga: {test_query5}\nSvar: {answer5}\n")


--- Bygger RAG-kedjan ---

--- Testar RAG-chatboten ---
Fråga: How can I increase my Terraform Rating?
Svar: Du kan öka din terraformningsgrad (TR) varje gång du höjer en global parameter (temperatur, syre eller hav). Vissa kort kan också öka din TR.




### Evaluation

In [49]:
import json

# Ladda in utvärderingsfilen
eval_questions_path = r"C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\data\evaluation_questions.json"

try:
    with open(eval_questions_path, 'r', encoding='utf-8') as f:
        loaded_eval_questions = json.load(f)
    print(f"  Laddade in {len(loaded_eval_questions)} utvärderingsfrågor från {eval_questions_path}")
except FileNotFoundError:
    print(f"FEL: Utvärderingsfilen hittades inte på {eval_questions_path}. Kontrollera sökvägen och att filen finns.")
    loaded_eval_questions = [] # Sätt en tom lista som fallback för att undvika krasch
except json.JSONDecodeError as e:
    print(f"FEL: Kunde inte parsa JSON-filen {eval_questions_path}. Kontrollera syntaxen: {e}")
    loaded_eval_questions = [] # Sätt en tom lista som fallback

# --- Funktion för att utvärdera ett svar med Gemini ---
evaluation_llm = genai.GenerativeModel('gemini-1.5-flash') 

def evaluate_answer_with_llm(question, rag_answer):
    eval_prompt = f"""Du är en AI-utvärderare. Din uppgift är att bedöma kvaliteten på ett svar som genererats av en RAG-chatbot för brädspelet Terraforming Mars.
Bedöm svaret baserat på följande kriterier:
1.  **Relevans**: Är svaret direkt relaterat till frågan?
2.  **Korrekthet**: Verkar informationen i svaret vara korrekt enligt Terraforming Mars regler (så långt du kan bedöma)?
3.  **Fullständighet**: Ger svaret tillräckligt med detaljer för att besvara frågan på ett tillfredsställande sätt, utan att vara för pratigt?
4.  **Tydlighet**: Är svaret klart och lättförståeligt?

Ge en sammanfattande bedömning och ett betyg från 1 (mycket dåligt) till 5 (utmärkt) för varje kriterium. Förklara kort dina betyg.
**VIKTIGT:** Ge ditt betyg för varje kriterium som enbart en siffra mellan 1 (mycket dåligt) och 5 (utmärkt), direkt efter kriteriebeskrivningen. Använd formatet:
**Relevans**: 5
**Korrekthet**: 4
**Fullständighet**: 3
**Tydlighet**: 5.

Fråga: {question}
Chatbotens Svar: {rag_answer}

Din Utvärdering:
"""
    try:
        eval_response = evaluation_llm.generate_content(eval_prompt)
        return eval_response.text
    except Exception as e:
        print(f"Error during evaluation generation: {e}")
        return "Kunde inte generera utvärdering."

# --- Genomför utvärderingen ---
print("\n--- Genomför utvärdering ---")
evaluation_results = []

for item in loaded_eval_questions:
    q_id = item["id"]
    question = item["question"]
    print(f"\nBesvarar fråga {q_id}: {question}")
    
    rag_system_answer = ask_rag_chatbot(question) 
    print(f"  Chatbotens svar: {rag_system_answer}")
    
    llm_evaluation = evaluate_answer_with_llm(question, rag_system_answer)
    print(f"  LLM Utvärdering:\n{llm_evaluation}")
    
    evaluation_results.append({
        "id": q_id,
        "question": question,
        "rag_answer": rag_system_answer,
        "llm_evaluation": llm_evaluation
    })

# --- Spara utvärderingsresultat ---
# Sparas i samma mapp som din chatbot.ipynb
eval_results_path = "rag_evaluation_results.json"
with open(eval_results_path, 'w', encoding='utf-8') as f:
    json.dump(evaluation_results, f, indent=4, ensure_ascii=False)
print(f"\nSparade utvärderingsresultat till {eval_results_path}")






  Laddade in 10 utvärderingsfrågor från C:\Users\Dator\Documents\Data Science\07_Deep_Learning\Kunskapskontroll 2\data\evaluation_questions.json

--- Genomför utvärdering ---

Besvarar fråga q1: How do I get more Megacredits (M€)?
  Chatbotens svar: Your M€ income is the sum of your M€ production and your TR. You can also play cards to increase your M€ production.

  LLM Utvärdering:
**Relevans**: 5
**Korrekthet**: 4
**Fullständighet**: 3
**Tydlighet**: 5

**Sammanfattande bedömning:**

Chatboten ger ett korrekt och relevant svar på frågan om hur man får fler Megacredits.  Svaret är tydligt och lätt att förstå.  Dock är det lite för kortfattat.  Det nämner viktiga aspekter som produktion och TR (troligen avsett för "Trade Routes"), men det hade kunnat ge fler exempel på hur man ökar M€-produktionen (genom specifika korttyper eller genom att bygga specifika strukturer).  Det utelämnar också andra viktiga sätt att få Megacredits, som exempelvis att sälja resurser. Därför får fullständigh

#### Statistics from evaluation

In [50]:
# --- Extrahera och analysera utvärderingsresultaten ---

def extract_average_score(evaluation_text):
    scores = {}
    criteria = ["Relevans", "Korrekthet", "Fullständighet", "Tydlighet"]
    
    for criterion in criteria:
        # Matchar "**Kriterium**: Betyg" formatet
        match = re.search(rf"\*\*{re.escape(criterion)}\*\*:\s*(\d+)", evaluation_text)
        
        if match:
            try:
                score = int(match.group(1))
                if 1 <= score <= 5: 
                    scores[criterion] = score
            except ValueError:
                pass 

    if len(scores) == len(criteria):
        average_score = sum(scores.values()) / len(criteria)
        return average_score, scores
    else:
        print(f"Varning: Kunde inte extrahera alla betyg från utvärderingen för en fråga (hittade {len(scores)} av {len(criteria)}). Text:\n{evaluation_text[:200]}...")
        return None, None

# Uppdatera loopen för att lagra individuella betyg
for item in evaluation_results:
    average_score, individual_scores = extract_average_score(item["llm_evaluation"])
    item["average_score"] = average_score
    item["individual_scores"] = individual_scores

# Beräkna övergripande statistik och kategori-specifika medelvärden
total_questions_evaluated = len(evaluation_results)
total_sum_of_overall_scores = 0
score_counts = {1: 0, 2: 0, 3: 0, 4: 0, 5: 0}
valid_overall_scores_count = 0

criterion_scores_sum = {
    "Relevans": 0,
    "Korrekthet": 0,
    "Fullständighet": 0,
    "Tydlighet": 0
}
criterion_valid_counts = {
    "Relevans": 0,
    "Korrekthet": 0,
    "Fullständighet": 0,
    "Tydlighet": 0
}
criteria_list = ["Relevans", "Korrekthet", "Fullständighet", "Tydlighet"]

for item in evaluation_results:
    if item["average_score"] is not None:
        rounded_score = round(item["average_score"])
        total_sum_of_overall_scores += item["average_score"]
        
        if 1 <= rounded_score <= 5:
            score_counts[rounded_score] += 1
        else:
            if rounded_score < 1: score_counts[1] += 1
            if rounded_score > 5: score_counts[5] += 1
            
        valid_overall_scores_count += 1

        if item["individual_scores"]:
            for criterion, score in item["individual_scores"].items():
                criterion_scores_sum[criterion] += score
                criterion_valid_counts[criterion] += 1

print("\n--- Sammanfattning av Utvärderingsresultat ---")

if valid_overall_scores_count > 0:
    overall_average_score = total_sum_of_overall_scores / valid_overall_scores_count
    print(f"Totalt antal utvärderade frågor med giltiga totalbetyg: {valid_overall_scores_count} av {total_questions_evaluated}")
    print(f"\n**Genomsnittligt totalbetyg (1-5): {overall_average_score:.2f}**")
    print("\nFördelning av totalbetyg (avrundade till närmaste heltal):")
    for score in sorted(score_counts.keys(), reverse=True):
        count = score_counts[score]
        percentage = (count / valid_overall_scores_count) * 100 if valid_overall_scores_count > 0 else 0
        print(f"    Betyg {score}: {count} gånger ({percentage:.1f}%)")

    print("\n**Genomsnittligt betyg per kategori (1-5):**")
    for criterion in criteria_list:
        if criterion_valid_counts[criterion] > 0:
            avg_criterion_score = criterion_scores_sum[criterion] / criterion_valid_counts[criterion]
            print(f"    {criterion}: {avg_criterion_score:.2f}")
        else:
            print(f"    {criterion}: Inga giltiga betyg kunde extraheras för denna kategori.")
else:
    print("Inga giltiga totalbetyg kunde extraheras för utvärdering. Kontrollera LLM:s utvärderingsformat.")

# --- Spara utvärderingsresultat (UPPDATERAD med genomsnittsbetyg och individuella betyg) ---
with open(eval_results_path, 'w', encoding='utf-8') as f:
    json.dump(evaluation_results, f, indent=4, ensure_ascii=False)
print(f"\nSparade utvärderingsresultat (inkl. genomsnittsbetyg) till {eval_results_path}")


--- Sammanfattning av Utvärderingsresultat ---
Totalt antal utvärderade frågor med giltiga totalbetyg: 10 av 10

**Genomsnittligt totalbetyg (1-5): 3.62**

Fördelning av totalbetyg (avrundade till närmaste heltal):
    Betyg 5: 1 gånger (10.0%)
    Betyg 4: 6 gånger (60.0%)
    Betyg 3: 2 gånger (20.0%)
    Betyg 2: 1 gånger (10.0%)
    Betyg 1: 0 gånger (0.0%)

**Genomsnittligt betyg per kategori (1-5):**
    Relevans: 4.50
    Korrekthet: 3.30
    Fullständighet: 2.30
    Tydlighet: 4.40

Sparade utvärderingsresultat (inkl. genomsnittsbetyg) till rag_evaluation_results.json
