![Banner](banner.png)

## Vorbereitung: Einrichtung der Umgebung und Verbindung zur Oracle-Datenbank

Zu Beginn wird die Arbeitsumgebung eingerichtet und eine Verbindung zu einer Oracle-Datenbank hergestellt. Dies umfasst die Installation der notwendigen Python-Pakete und die Initialisierung des Oracle-Clients.

#### Installierte Pakete:
- `oracledb`: Wird benötigt, um eine Verbindung zu Oracle-Datenbanken herzustellen und SQL-Abfragen auszuführen.
- `ipython-sql`: Ermöglicht die Verwendung von SQL in Jupyter-Notebooks.
- `pandas`: Dient der Datenverarbeitung und -analyse. Hier wird es verwendet, um die Ergebnisse von SQL-Abfragen in DataFrames zu laden und zu verwalten.

#### Code-Details:
- Der Oracle-Client wird mit `oracledb.init_oracle_client` initialisiert, wobei das Verzeichnis für die Oracle-Bibliotheken angegeben wird.
- Die Umgebungsvariablen `HOST_NAME` und `PDB_NAME` werden genutzt, um den Connection String (`dsn`) für die Oracle-Datenbank zu erstellen. Diese enthält den Hostnamen und den Pluggable Database Name (PDB), die benötigt werden, um die Datenbank anzusprechen.
- Es wird eine Verbindung zur Oracle-Datenbank mit dem Benutzer `vector` und dem Passwort `vector` aufgebaut. Die Verbindungszeichenfolge kombiniert Host und PDB, die in den Umgebungsvariablen hinterlegt sind.


In [31]:
!pip install oracledb 
!pip install ipython-sql
!pip install pandas



## Datenbank Verbindung erzeugen
In diesem Beispiel wird eine Autonomous Database benutzt. Die verwendeten Packages DBMS_CLOUD, DBMS_CLOUD_AI und so weiter sind mittlerweile auch auf Oracle23ai und Oracle 19c nachinstallierbar.
https://oracle-base.com/articles/21c/dbms_cloud-installation


In [46]:
import oracledb
import pandas as pd
import os
import warnings
import time

warnings.filterwarnings('ignore')
pd.set_option('expand_frame_repr', False)
pd.options.display.max_colwidth = 800

d = '/home/jovyan/.jupyter/instantclient_23_5'
oracledb.init_oracle_client(lib_dir=d)
cs = '(description= (retry_count=20)(retry_delay=3)(address=(protocol=tcps)(port=1521)(host=adb.eu-frankfurt-1.oraclecloud.com))(connect_data=(service_name=gcea274ae857889_atp23ai_low.adb.oraclecloud.com))(security=(ssl_server_dn_match=yes)))'
print(cs)

(description= (retry_count=20)(retry_delay=3)(address=(protocol=tcps)(port=1521)(host=adb.eu-frankfurt-1.oraclecloud.com))(connect_data=(service_name=gcea274ae857889_atp23ai_low.adb.oraclecloud.com))(security=(ssl_server_dn_match=yes)))


In [47]:
connection = oracledb.connect(user='SH2', password='Welcome1234#', dsn=cs)
print(connection)

<oracledb.Connection to SH2@(description= (retry_count=20)(retry_delay=3)(address=(protocol=tcps)(port=1521)(host=adb.eu-frankfurt-1.oraclecloud.com))(connect_data=(service_name=gcea274ae857889_atp23ai_low.adb.oraclecloud.com))(security=(ssl_server_dn_match=yes)))>


## Vorab: Benutzer den Netzwerk Zugang zur KI erlauben
Sollte als admin-Benutzer erfolgen, daher nur zu Dokumentationszwecken

## Funktion fuer den KI Aufruf anlegen

In [50]:
sql = """
CREATE OR REPLACE FUNCTION rag_with_genai( rag_question in varchar2) return varchar2
AS
    l_url             VARCHAR2(400) := 'https://my.ollama.com/api/chat';
    req               utl_http.req;
    resp              utl_http.resp;
    body              VARCHAR2(4000);
    buffer            VARCHAR2(8192);
BEGIN
  -- das zu verwendende LLM - llama3.1:latest (7b) ist generisch, klein und schnell. 
  -- gemma3:12b ist etwas groesser und bietet bessere Antworten
  body := '{"model": "llama3.1:latest",'||

  -- den richtigen Prompt definieren: wie ist zu antworten und wie sehr soll sich die KI an die Wissensbasis halten 
  -- System-Anweisungen kommen in der Rolle "system", Benutzer-Anfragen in der Rolle "user"
  '"messages": [{"role": "system", "content": " '||
  'Your answers must begin with the phrase ''According to the information found in my database''.' ||
  'Please answer the following question only with information given in the provided DOCUMENTS"} ,' ||

   -- Die Wissensbasis könnte aus Daten aus relationalen Tabellen bestehen oder Dokument-Fragmente, die per Volltextsuche gefunden wurden
   -- Es darf auch sein, dass die Wissensbasis aus relationalen Daten und Abfragen stammt. Stammdaten zum Beispiel.
   -- Der Kürze halber hier hart codiert
   '{"role": "system", "content": "DOCUMENTS: It has been proven that men can get breast cancer too "} , ' ||
   '{"role": "system", "content": "DOCUMENTS: Male breast cancer is very rare "} , ' ||

   -- hier wird die Endbenutzer-Frage in den Prompt eingeflanscht
   '{"role": "user",  "content": "'|| rag_question ||'"}],' ||

   -- Tuning Parameter an den inference server, vorerst unbedingt auf streaming verzichten für eine vollständige Antwort
   '"stream": false, "options": {"use_mmap": true,"use_mlock": true,"num_thread": 8}}';

   -- Auch Datenbanken müssen manchmal über Proxies ins Internet, aber bei einem lokalen LLM eher nicht. Daher auskommentiert.
   -- utl_http.set_proxy('http://username:passwd@192.168.22.33:5678');

   -- der HTTP request wird konstruiert
   req := utl_http.begin_request(l_url, 'POST', 'HTTP/1.1');
   utl_http.set_header(req, 'Accept', '*/*');
   utl_http.set_header(req, 'Content-Type', 'application/json');
   utl_http.set_header(req, 'Content-Length', length(body));
   utl_http.write_text(req, body);

   -- nun wird der inference server aufgerufen und das Ergebnis ausgelesen
   resp := utl_http.get_response(req);
   BEGIN
     utl_http.read_text(resp, buffer);
   EXCEPTION
      WHEN utl_http.end_of_body THEN
        utl_http.end_response(resp);
   END;
   buffer := json_value (buffer, '$.message.content' returning varchar2);

   return (buffer);
END;
"""



tic = time.perf_counter()
with connection.cursor() as cursor:     
    cursor.execute(sql)
    if cursor.warning :
        print(cursor.warning)
    else :
        print("SQL execution successful")
toc = time.perf_counter()
print(f"Creating function took {toc - tic:0.4f} seconds")


SQL execution successful
Creating function took 0.0202 seconds


## SQL Funktion testen
Abfragetext eingeben, Funktion aufrufen

In [None]:
anfrage = input("Suchtext hier einfügen")
sql="""
select rag_with_genai(:anfrage) from dual
"""

with connection.cursor() as cursor:     
    cursor.execute(sql, anfrage=anfrage)
    res, =cursor.fetchone()
    print(res)

Suchtext hier einfügen koennen Maenner auch Brustkrebs bekommen ?
