models.py

from transformers import GPT2TokenizerFast
import openai
import json

with open('./secrets.json') as file:
    secrets = json.loads(file.read())

openai.api_key = secrets["apiKey"]

class ChatGPTModel():
    def __init__(self):
        self.history = [
            {
                "role": "system",
                "content": "Clippy is an AI assistant"
            }
        ]
        self.tipModifier = ''

        self.tokenizer = GPT2TokenizerFast.from_pretrained("gpt2")
        self.sessionCost = 0

        # Define AI Options
        self.defaultConfig = {
            "engine": "gpt-3.5-turbo",
            "temperature": 0.75,
            "max_tokens": 128,
            "top_p": 1,
            "frequency_penalty": 0,
            "presence_penalty": 0,
            "useMemory": True
        }
        self.config = self.defaultConfig

        self.costPerKTokens = 0.002

    def reset(self):
        self.history = self.history[:1]

    def generateTip(self, prompt):
        try:
            completion = openai.Completion.create(engine=self.model, prompt='\n'.join(self.history))
            response = completion.choices[0].text
            response = response.strip()
        except openai.error.RateLimitError as e:
            response = "[RATELIMITED]\nOur server are overloaded!"

    def prompt(self, prompt):
        if not self.config["useMemory"]:
            self.reset()

        prompt = prompt.strip()
        self.history.append({
            "role": "user",
            "content": prompt
        })

        repetitions = 3
        while True:
            repetitions -= 1
            if (repetitions == 0):
                response = "[ERROR] Max Retries Exceeded"
                break

            try:
                promptTokenCount = len(self.tokenizer(self.history[-1]["content"])['input_ids'])
                completion = openai.ChatCompletion.create(
                    model=self.config["engine"],
                    messages=self.history, #prompt
                    temperature=self.config["temperature"],
                    max_tokens=self.config["max_tokens"],
                    top_p=self.config["top_p"],
                    frequency_penalty=self.config["frequency_penalty"],
                    presence_penalty=self.config["presence_penalty"],
                )
                #completion = openai.Completion.create(engine=self.model, prompt='\n'.join(self.history))
                responseText = completion.choices[0].message.content
                responseText = responseText.strip()

                self.history.append({
                    "role": "assistant",
                    "content": responseText
                })
                responseTokenCount = len(self.tokenizer(responseText)['input_ids'])
                totalTokenCount = promptTokenCount + responseTokenCount
                self.sessionCost += self.costPerKTokens * (totalTokenCount/1000)
                print("=========================")
                print("Prompt:", prompt)
                print("Response:", responseText)
                print("Total Tokens",totalTokenCount)
                print("Total Cost: $" + '{:.6f}'.format(self.sessionCost))
                print("=========================")
                break
            except openai.error.RateLimitError as e:
                responseText = "[RATELIMITED]\nOur server are overloaded! Please wait a bit."
                break
            except openai.error.InvalidRequestError as e:
                self.history = self.history[3:-3]
                print(e)
                exit()
            except Exception as e:
                print("Fatal Exception")
                print(e)
                exit()

        return responseText
    
class OpenAIModel():
    def __init__(self):
        self.history = ["Clippy is an AI assistant"]
        self.tipModifier = ''

        self.tokenizer = GPT2TokenizerFast.from_pretrained("gpt2")

        # Define AI Options
        self.defaultConfig = {
            "engine": "text-davinci-003",
            "temperature": 0.75,
            "max_tokens": 128,
            "top_p": 1,
            "frequency_penalty": 0,
            "presence_penalty": 0,
            "useMemory": True
        }
        self.config = self.defaultConfig

        self.costPerKTokens = 0.02

    def reset(self):
        self.history = self.history[:1]

    def generateTip(self, prompt):
        try:
            completion = openai.Completion.create(engine=self.model, prompt='\n'.join(self.history))
            response = completion.choices[0].text
            response = response.strip()
        except openai.error.RateLimitError as e:
            response = "[RATELIMITED]\nOur server are overloaded!"

    def prompt(self, prompt):
        if not self.config["useMemory"]:
            self.reset()

        prompt = prompt.strip()
        self.history.append("User: " + prompt)
        self.history.append("Response: ")

        repetitions = 3
        while True:
            repetitions -= 1
            if (repetitions == 0):
                response = "[ERROR] Max Retries Exceeded"
                break

            try:
                promptTokenCount = len(self.tokenizer('\n'.join(self.history))['input_ids'])
                completion = openai.Completion.create(
                    engine=self.config["engine"],
                    prompt='\n'.join(self.history), #prompt
                    temperature=self.config["temperature"],
                    max_tokens=self.config["max_tokens"],
                    top_p=self.config["top_p"],
                    frequency_penalty=self.config["frequency_penalty"],
                    presence_penalty=self.config["presence_penalty"],
                )
                #completion = openai.Completion.create(engine=self.model, prompt='\n'.join(self.history))
                response = completion.choices[0].text
                response = response.strip()

                self.history[-1] = "Response: " + response
                responseTokenCount = len(self.tokenizer(response)['input_ids'])
                totalTokenCount = promptTokenCount + responseTokenCount
                totalCost = totalTokenCount * (self.costPerKTokens/1000)
                print("=========================")
                print("Prompt:", prompt)
                print("Response:", response)
                print("Total Tokens",totalTokenCount)
                print("Total Cost: $" + '{:.6f}'.format(totalCost))
                print("=========================")
                break
            except openai.error.RateLimitError as e:
                response = "[RATELIMITED]\nOur server are overloaded! Please wait a bit."
                break
            except openai.error.InvalidRequestError as e:
                self.history = self.history[3:-3]
                print(e)
                exit()
            except Exception as e:
                print(e)
                exit()

        return response