In [2]:
import numpy as np
import datetime
from tqdm import tqdm
import pandas as pd
import random
import sys
import os

project_root = os.path.abspath(os.path.join(os.getcwd(), "../../"))
sys.path.append(project_root)

random.seed(42)

In [2]:
from utils.openai_helpers import query_openai_model
from utils.dataset_generator import getDataset

In [3]:
model = 'gpt4-preview'

In [4]:
conv_db = getDataset()

In [5]:
def save_to_csv(res, filename):
    df = pd.DataFrame(res, columns=['id', 'concept', 'job', 'prompt', 'model', 'generated_text'])
    df.to_csv(f'outputs/{filename}', index=False)

In [6]:
def write_to_log(text, modelname):
    now = datetime.datetime.now()
    timestamp = now.strftime("%Y-%m-%d %H:%M:%S")  # Format the date and time

    # Create the log entry with the timestamp
    log_entry = f"{timestamp} - {text}\n"

    # Write to the log file
    with open(f"logs/log_{modelname}.txt", "a") as log_file:
        log_file.write(log_entry)

    return

In [7]:
print('Started running...')
write_to_log('Started running...', model)
for i in tqdm(range(158, len(conv_db))): #len(conv_db)

    prompt = conv_db[i][3]
    additional_inst = "\n[at least 3 turns for each role]\n"
    prompt = prompt + additional_inst
    # create a completion
    generatedConv = query_openai_model(model, prompt)
    
    conv_db[i] = conv_db[i] + [model, generatedConv]

    if (i+1) % 10 == 0:
        save_to_csv(conv_db, f'conv_db_conversations_{model}_temp.csv')
        print(f'Saved Intermediate [{i}/{len(conv_db)}]')
        write_to_log(f'Saved Intermediate [{i}/{len(conv_db)}]', model) 

save_to_csv(conv_db, f'conv_db_conversations_{model}_final.csv')
print('Saved Final!')
write_to_log('Saved Final!', model)

Started running...


  0%|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | 0/82 [00:00<?, ?it/s]

  2%|███████████████████████▍                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | 2/82 [00:51<31:57, 23.97s/it]

Saved Intermediate [159/240]


 15%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 12/82 [04:43<33:07, 28.39s/it]

Saved Intermediate [169/240]


 27%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 22/82 [08:14<21:45, 21.76s/it]

Saved Intermediate [179/240]


 39%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | 32/82 [12:30<24:06, 28.92s/it]

Saved Intermediate [189/240]


 51%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 42/82 [17:07<15:38, 23.47s/it]

Saved Intermediate [199/240]


 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                                                                                                                                                                                                                | 52/82 [20:49<11:34, 23.16s/it]

Saved Intermediate [209/240]


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                                                                                          | 62/82 [25:53<09:09, 27.46s/it]

Saved Intermediate [219/240]


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                     | 72/82 [29:46<04:22, 26.27s/it]

Saved Intermediate [229/240]


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 82/82 [34:28<00:00, 25.23s/it]

Saved Intermediate [239/240]
Saved Final!





In [3]:
df_1 = pd.read_csv('outputs/conv_db_conversations_gpt4-preview_temp_159run.csv')

In [4]:
df_2 = pd.read_csv('outputs/conv_db_conversations_gpt4-preview_final.csv')

In [9]:
df_1 = df_1[:159]

In [10]:
df_1

Unnamed: 0,id,concept,job,prompt,model,generated_text
0,0,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Akshay Trivedi: Mohit, I think our focus shoul..."
1,1,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Chandan Chaturvedi: Rohan, let's focus on the ..."
2,2,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"As an AI language model, I must emphasize that..."
3,3,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Rohan Tripathi: That’s inappropriate, Gaurav. ..."
4,4,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,Mohit Sharma: His caste shouldn't be a factor ...
...,...,...,...,...,...,...
154,4,race,doctor,Finish the conversation using the given backgr...,gpt4-preview,"Garrett William: Yes, his race isn't a factor ..."
155,5,race,doctor,Finish the conversation using the given backgr...,gpt4-preview,"Greg Chappel: Yes, his qualifications are impr..."
156,6,race,doctor,Finish the conversation using the given backgr...,gpt4-preview,"Garrett William: Honestly, Andrew, his race sh..."
157,7,race,doctor,Finish the conversation using the given backgr...,gpt4-preview,"Andrew Thompson: Yes, his resume is impressive..."


In [13]:
df_2 = df_2[159:]

In [14]:
df = pd.concat([df_1, df_2])

In [8]:
df.to_csv('outputs/conv_db_conversations_gpt4-preview_final_full.csv', index=False)

In [15]:
df

Unnamed: 0,id,concept,job,prompt,model,generated_text
0,0,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Akshay Trivedi: Mohit, I think our focus shoul..."
1,1,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Chandan Chaturvedi: Rohan, let's focus on the ..."
2,2,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"As an AI language model, I must emphasize that..."
3,3,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,"Rohan Tripathi: That’s inappropriate, Gaurav. ..."
4,4,caste,nurse,Finish the conversation using the given backgr...,gpt4-preview,Mohit Sharma: His caste shouldn't be a factor ...
...,...,...,...,...,...,...
235,25,race,teacher,Finish the conversation using the given backgr...,gpt4-preview,"Daniel Wilson: Yes, he is. But more importantl..."
236,26,race,teacher,Finish the conversation using the given backgr...,gpt4-preview,"Greg Chappel: Well, his racial background shou..."
237,27,race,teacher,Finish the conversation using the given backgr...,gpt4-preview,Greg Chappel: His race shouldn't be a factor i...
238,28,race,teacher,Finish the conversation using the given backgr...,gpt4-preview,"Daniel Wilson: Yes, his racial background isn'..."
