# BAI-Assistent

Grundidee: Hilft bei der Erstellung von Zusammenfassungen, welche auf Basis unseren Zusammenfassungen und Vorlesungsfolien die Antworten generiert

#### Unsere Problemstellung
Während der Prüfungsvorbereitung sind vor allem Erstsemester Studenten überfordert, wie man beim Lernen vorgehen kann. Daher haben wir es als Lücke vor allem im BAI-Studiengang erkannt.

#### Use Cases: 
Ich möchte, dass mir der Lernassistent mir Fachbegriffe in ML und Einführung KI erklärt
Ich möchte gut auf die Prüfungen durch den Lernassistenten vorbereitet werden
-	Ich möchte Prüfungsfragen erhalten
-	Ich möchte, dass es Merksätze gibt
-	Ich möchte, dass die Erklärungen einfach sind
-	Ich möchte Hilfe/Beratung erhalten, wie ich mein Cheat Sheet gemäss Stoffabgrenzung aufstellen kann
Ich möchte schnelle und unlimitierte Antworten
(Ich möchte Prüfungsfragen vom Chatbot erhalten, damit ich mich gut auf die Prüfung vorbereiten kann)

##### Zielgruppe: 
BAI-Studenten im ersten Studienjahr, die Maschinelles Lernen und Einführung in die Künstliche Intelligenz belegen

##### KPIs: 
•	Antwortzeit < 5 Sekunden
•	Prüfungsnutzen > 70 % finden Quiz hilfreich
•	Fachliche Korrektheit >85%

Unsere Erwartungen: Fachbegriffe fragen, Unterschied zwischen Supervised und Unsupervised Learning, Was ist One Hot Encoding
Inhalte für den KI-Assistenten: Folien Unterricht, Zusammenfassungen, Stoffabgrenzung


#### Zusammenführung LLM und API

In [None]:
import os
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv

load_dotenv()

# --- Stelle sicher, dass dieser Key existiert ---
assert "GROQ_API_KEY_BAI" in os.environ, "GROQ_API_KEY fehlt in den Env Vars!"

# --- Initialisiere LLM explizit für OpenRouter ---
llm = ChatOpenAI(
    model="openai/gpt-oss-120b",   
    api_key=os.environ["GROQ_API_KEY_BAI"],
    base_url="https://api.groq.com/openai/v1",
    temperature=0.3,
)

print("Sende Test-Ping...")
try:
    msg = llm.invoke("Sag exakt: pong")
    print("Antworttyp:", type(msg))
    # msg ist i.d.R. ein AIMessage – gib Inhalt sicher aus:
    print("Inhalt:", getattr(msg, "content", msg))
except Exception as e:
    print("FEHLER beim LLM-Aufruf:", repr(e))


In [None]:
import os
import langchain
from dotenv import load_dotenv
load_dotenv()

from langchain_openai import ChatOpenAI


#LLM_MODEL = "openai/gpt-oss-20b:free"
LLM_MODEL = "openai/gpt-oss-120b"
LLM_TEMPERATURE = 0.4
BASE_URL = "https://api.groq.com/openai/v1"
OPENROUTER_API_KEY = os.getenv("GROQ_API_KEY_BAI")
USER_PROMPT="Ich verstehe GenAI nicht, kannst du das mir einfach erklären?"

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate


llm = ChatOpenAI(
    model=LLM_MODEL,
    temperature=LLM_TEMPERATURE,
    base_url=BASE_URL,
    api_key=OPENROUTER_API_KEY,
)

print(type(llm))


#### Kurz sicherstellen, ob API Key funktioniert

In [None]:
try:
    print(llm.invoke("Sag nur: pong").content)
except Exception as e:
    print(repr(e))

# Test 2: Env-Variablen sichtbar?
import os
print("OPENAI_API_KEY" in os.environ, os.environ.get("OPENAI_BASE_URL"))
print("GROQ_API_KEY_BAI" in os.environ)
print("OPENROUTER_API_KEY" in os.environ)

#### ChatPrompt Template

In [None]:
from langchain_core.prompts import ChatPromptTemplate

LERNASSISTENT_PROMPT = ChatPromptTemplate.from_messages([
    ("system",
     "Sprache: Deutsch. Rolle: FHNW-BAI-Lernassistent, erklärst wie eine geduldige Lehrperson. "
     "Nutze AUSSCHLIESSLICH den bereitgestellten CONTEXT (Folien/Skripte). "
     "Wenn Informationen fehlen oder die Frage nicht im CONTEXT abgedeckt ist, sage: "
     "\"Dazu habe ich im bereitgestellten Material nichts\" und schlage präzise nächste Schritte vor "
     "(z. B. welche Folie/Thema hochzuladen wäre). "
     "Ziel: Studierende effizient auf Prüfungen vorbereiten. "
     "Stil: aktiv, konkret, ohne Floskeln, keine Gender-Sonderzeichen (nutze z. B. 'Lehrperson'). "
     "Gib GENAU EINEN Lösungsvorschlag und EIN einfaches Beispiel. "
     "Formatiere strikt nach dem Schema unten. "
     "Halte dich an Terminologie aus dem CONTEXT. "
     "Keine externen Fakten, keine Spekulation. "
     "CONTEXT:\n{context}"),
    ("human",
     "FRAGE: {question}\n"
     "Erstelle die Antwort mit dieser Struktur:\n"
     "1) Kurzantwort (2-3 Sätze, prüfungsrelevant)\n"
     "2) Erklärung (max. 8 Sätze, schrittweise, mit Intuition)\n"
     "3) Beispiel (sehr einfach, mit kleinen Zahlen/konkretem Mini-Fall)\n"
     "4) Typische Prüfungsfehler (Bullets)\n"
     "5) Verständnis-Check (1-2 Kontrollfragen)\n"
     "6) Quellen (Dokumenttitel + Seiten/Abschnitt aus CONTEXT)\n")])

#### PDF Loader

In [None]:
from langchain_community.document_loaders import PyPDFLoader

# List of PDF file paths

#pdf_path = "Order pdf/SoMe Konzept.pdf"

#loader = PyPDFLoader(str(pdf_path))
#pages = loader.load()

pdf_files = [
    "data/pdfs/01 KI Ueberblick Teil 1.pdf",
    "data/pdfs/01 KI Ueberblick Teil 2.pdf",
    "data/pdfs/02_Problemloesen_als_Suche.pdf",
    "data/pdfs/03 Machine Learning_exam.pdf",
    "data/pdfs/03 Machine Learning.pdf",
    "data/pdfs/03-1 Wissensrepraesentation.pdf",
    "data/pdfs/03-2_Aussagenlogik.pdf",
    "data/pdfs/03-3_Praedikatenlogik.pdf",
    "data/pdfs/05 Deep Learning_exam.pdf",
    "data/pdfs/05 Deep Learning.pdf",
    "data/pdfs/06 GenAI LLMs.pdf"
]

# Load all documents
all_pages_pdf = []
for pdf in pdf_files:
    loader = PyPDFLoader(pdf)
    pages = loader.load()
    all_pages_pdf.extend(pages)

print(f"Loaded {len(all_pages_pdf)} pages from {len(pdf_files)} pdf documents.")


In [None]:
from langchain_text_splitters import RecursiveCharacterTextSplitter

# get both websites and pdfs together
all_docs = pages

# define the splitter and strategy
splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=100)
splits = splitter.split_documents(all_docs)

In [None]:
import numpy as np

lengths = [len(s.page_content) for s in splits]
print(f"Initial documents: {len(all_docs)}")
print(f"Total chunks: {len(splits)}")
print(f"Avg length: {np.mean(lengths):.1f}")
print(f"Min: {np.min(lengths)}, Max: {np.max(lengths)}")

In [None]:
from langchain_community.embeddings import HuggingFaceEmbeddings
from sentence_transformers import SentenceTransformer

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")


In [None]:
import faiss
from langchain_community.docstore.in_memory import InMemoryDocstore
from langchain_community.vectorstores import FAISS

embedding_dim = len(embeddings.embed_query("hello world"))
index = faiss.IndexFlatL2(embedding_dim)

vector_store = FAISS(
    embedding_function=embeddings,
    index=index,
    docstore=InMemoryDocstore(),
    index_to_docstore_id={},
    normalize_L2=True
)

vector_store.add_documents(documents=splits)

In [None]:
retriever = vector_store.as_retriever(search_type="similarity", search_kwargs={"k": 3})

In [None]:
docs = retriever.get_relevant_documents("Hashtags für Instagram")
for i, d in enumerate(docs, 1):
    print(f"--- Retrieved doc {i} ---")
    print(d.page_content[:400], "...\n")

In [None]:
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
output_parser = StrOutputParser()

# chain = (
#     {"context": retriever, "question": RunnablePassthrough()}
#     | FWO_PROMPT
#     | llm
#     | output_parser
# )

chain = (
{
    "context": retriever,
    "question": RunnablePassthrough(),
}
    | FWO_PROMPT
    | llm
    | StrOutputParser()
)


In [None]:
# from langchain_core.output_parsers import StrOutputParser

# USER_PROMPT="Generiere mir einen Post für die PubTour am 16. Oktober"

# result = chain.invoke("Generiere mir einen Post für die PubTour am 16. Oktober")
# print(result)

result = chain.invoke("Generiere mir einen Post für die PubTour am 16. Oktober")
print(result)

#result = chain.invoke(user_prompt)
#print(result)

## UI

In [None]:
import gradio as gr

def answer(question: str) -> str:
    # Kein LangSmith, einfach direkt die Chain ausführen
    try:
        response = chain.invoke(question)
        return response
    except Exception as e:
        return f"⚠️ Fehler bei der Verarbeitung: {e}"

# --- Gradio UI ---
demo = gr.Interface(
    fn=answer,
    inputs=gr.Textbox(label="Question", placeholder="Type your question here..."),
    outputs=gr.Textbox(label="Answer", lines=10),
    title="FWO Chatbot",
    description="Write a social media post based on the context provided.",
)

# if __name__ == "__main__":
demo.launch(share=True)

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=56a0a349-7f2e-43e5-8d52-5ded467f6e9c' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>