# Implementierung von LangChain

### Was ist das? 

LangChain ist ein Framework, das LLMs (Large Language Models) in Workflows integriert und so erm√∂glicht, Modelle wie GPT zur Beantwortung komplexer Fragen oder zur Verarbeitung strukturierter Daten zu nutzen.

### Fragestellungen zum Projekt

üîπ Kann ein LLM (√ºber LangChain) eine faire Vorhersage treffen, ohne auf klassische ML-Methoden zur√ºckzugreifen?
üîπ Wie unterscheidet sich die Entscheidungslogik eines LLM von klassischen ML-Modellen?
üîπ Sind LLMs m√∂glicherweise selbst biased, wenn sie auf dem gleichen Datensatz arbeiten?
üîπ K√∂nnte LangChain genutzt werden, um faire Entscheidungen zu erkl√§ren oder Bias in ML-Modellen zu entdecken?

### Probleme

- GPTs werden auf Texten trainiert, die selbst Bias enthalten
- GPT arbeitet mit Sprache und nicht mit harten Zahlen wie ML-Modelle

### Vorgehen: 

- LLM als Vorhersage benutzen
LLM als Fairness-Analyst f√ºr das ML-Modell

In [None]:
# Test, ob der API-Key funktioniert
import os
from dotenv import load_dotenv
import openai

load_dotenv()

api_key = os.getenv("OPENAI_API_KEY")

if api_key:
    print("Dein API-Schl√ºssel wurde erfolgreich geladen")

else: 
    print("Error: API-Schl√ºssel nicht gefunden")

In [None]:
# Welche OpenAI-Modelle stehen mir zur Verf√ºgung
openai.api_key = os.getenv("OPENAI_API_KEY")

models = openai.models.list()

for model in models.data:
    print(model.id)

### ML vs. GPT - Kann GPT Vorhersagen besser oder fairer machen?

In [None]:
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate

# GPT-4-Modell initialisieren
llm = ChatOpenAI(model_name="gpt-3.5-turbo")

# GPT-4 ben√∂tigt am besten konsistenten und strukturierten Text
prompt = PromptTemplate(
    input_variables=["age", "sex", "education", "occupation"],
    template="Eine Person ist {age} Jahre alt, {sex}, hat {education} abgeschlossen und arbeitet als {occupation}. "
             "Wird diese Person mehr als 50.000‚Ç¨ im Jahr verdienen? Antworte mit Ja oder Nein."
)

# Definition einer Beispielperson
example_data = {
    "age": "35",
    "sex": "m√§nnlich",
    "education": "Master-Abschluss",
    "occupation": "Ingenieur"
}

# Prediction 
llm_input = prompt.format(**example_data)
prediction = llm.invoke(llm_input)

# Response 
print("GPT-3.5 Vorhersage:", prediction)