In [70]:
import numpy as np
import pandas as pd
import openai
from tqdm import tqdm
import json

from typing import *
from gpt_api import GPT3API

## Explore questions and answers

In [2]:
questions, answers = [], []
with open('data/task2_questions_with_answers.tsv', encoding="UTF-8") as f:
    for line in f.readlines():
        try:
            q, *a = line.strip().split('\t')
            questions.append(q)
            answers.append(a)
        except Exception as e:
            print(line)

In [3]:
subset_q = [q for i,q in enumerate(questions) if i % 5 == 0]
subset_a = [a for i,a in enumerate(answers) if i % 5 == 0]

In [4]:
longest_answer = 30
for i, ans in enumerate(answers):
    for a in ans:
        if len(a) > longest_answer:
            longest_answer = len(a)
            print(questions[i])
            print(ans)
            print('---')

Wyspy Zielonego Przylądka leżą bliżej Afryki czy Azji?
['Kto śpiewa piosenkę z czołówki M jak miłość?']
---
Proszę rozszyfrować skrót KBWE?
['Konferencja Bezpieczeństwa i Współpracy w Europie']
---
Dybuk to dusza zmarłego grzesznika wstępująca do ciała żywego czy duch w domostwie domowym?
['dusza zmarłego grzesznika wstępująca do ciała żywego']
---
Jakie dwie prace Heraklesa były związane z końmi?
['posprzątanie stajni Augiasza i schwytanie koni Diomedesa', 'schwytanie koni Diomedesa i posprzątanie stajni Augiasza']
---


## GPT fine tuning ideas:
1. limit number of tokens
2. self-ask https://the-decoder.com/new-prompt-method-lets-gpt-3-answer-questions-better/
3. rules for "or" type questions
4. use A to finetune GPT 

Direct prompt:
```
Question: Who was president of the U.S. when superconductivity was discovered?

Answer: The president of the United States when superconductivity was discovered was Dwight D. Eisenhower. Superconductivity was discovered in 1911 by Dutch physicist Heike Kamerlingh Onnes.
```

Self-ask prompt:

```
Question: Who lived longer, Theodor Haecker or Harry Vaughan Watkins?
Are follow up questions needed here: Yes.
Follow up: How old was Theodor Haecker when he died?
Intermediate answer: Theodor Haecker was 65 years old when he died.
Follow up: How old was Harry Vaughan Watkins when he died?
Intermediate answer: Harry Vaughan Watkins was 69 years old when he died.
So the final answer is: Harry Vaughan Watkins

Question: Who was president of the U.S. when superconductivity was discovered?
Are follow up questions needed here: Yes.
Follow up: When was superconductivity discovered?
Intermediate answer: Superconductivity was discovered in 1911.
Follow up: Who was president of the U.S. in 1911?
Intermediate answer: William Howard Taft was president of the U.S. in 1911.
So the final answer is: William Howard Taft.
```

## Utils

In [2]:
follow_up_questions = [
    "Kto żył dłużej, Theodor Haecker czy Harry Vaughan Watkins?",
    "W jakim wieku był Theodor Haecker gdy zmarł?",
    "W jakim wieku Harry Vaughan Watkins był gdy zmarł?",
]

follow_up_answers = [
    "Harry Vaughan Watkins",
    "Theodor Haecker miał 65 lat gdy zmarł.",
    "Harry Vaughan Watkins miał 69 lat gdy zmarł.",
]

follow_up_answers_short = [
    "Harry Vaughan Watkins",
    "65",
    "69",
]

In [21]:
def prepare_self_ask(
    question: str, 
    follow_up_questions: List[str], 
    follow_up_answers: List[str]
) -> str:
    return (
        f"Pytanie: {follow_up_questions[0]}\n"
        "Czy potrzebne są tutaj pomocnicze pytania: Tak\n"
        f"Pomocnicze pytanie: {follow_up_questions[1]}\n"
        f"Pomocnicza odpowiedź: {follow_up_answers[1]}\n"
        f"Pomocnicze pytanie: {follow_up_questions[2]}\n"
        f"Pomocnicza odpowiedź: {follow_up_answers[2]}\n"
        f"Ostateczna odpowiedź: {follow_up_answers[0]}\n\n"
        f"Pytanie: {question} Odpowiedz krótko.\n"
        f"Czy potrzebne są tutaj pomocnicze pytania: Tak."
    )


def is_or_question() -> bool:
    ...

def handle_or_question() -> str:
    ...

In [4]:
api = GPT3API()
openai.api_key = "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"

In [22]:
prepared_question = prepare_self_ask(
    question="Kto jest autorem obrazu namalowanego w 1892 r. Kobiety z Tahiti?",
    follow_up_questions=follow_up_questions,
    follow_up_answers=follow_up_answers,
)
print(prepared_question)

response = api.send_prompt(
    prompt=prepared_question,
    temperature=0,
    max_length_tokens=256,
)
print(response)

Pytanie: Kto żył dłużej, Theodor Haecker czy Harry Vaughan Watkins?
Czy potrzebne są tutaj pomocnicze pytania: Tak
Pomocnicze pytanie: W jakim wieku był Theodor Haecker gdy zmarł?
Pomocnicza odpowiedź: Theodor Haecker miał 65 lat gdy zmarł.
Pomocnicze pytanie: W jakim wieku Harry Vaughan Watkins był gdy zmarł?
Pomocnicza odpowiedź: Harry Vaughan Watkins miał 69 lat gdy zmarł.
Ostateczna odpowiedź: Harry Vaughan Watkins

Pytanie: Kto jest autorem obrazu namalowanego w 1892 r. Kobiety z Tahiti? Odpowiedz krótko.
Czy potrzebne są tutaj pomocnicze pytania: Tak.

Pomocnicze pytanie: Kto jest autorem obrazu Kobiety z Tahiti?
Pomocnicza odpowiedź: Paul Gauguin jest autorem obrazu Kobiety z Tahiti.
Ostateczna odpowiedź: Paul Gauguin.


In [124]:
%%time
prepared_question_2 = prepare_self_ask(
    question="Ktoś „nie w ciemię bity” to ktoś sprytny czy naiwny?",
    follow_up_questions=follow_up_questions,
    follow_up_answers=follow_up_answers,
)
print(prepared_question_2)

response = api.send_prompt(
    prompt=prepared_question_2,
    temperature=0,
    max_length_tokens=256,
)
print(response)

Pytanie: Kto żył dłużej, Theodor Haecker czy Harry Vaughan Watkins?
Czy potrzebne są tutaj pomocnicze pytania: Tak
Pomocnicze pytanie: W jakim wieku był Theodor Haecker gdy zmarł?
Pomocnicza odpowiedź: Theodor Haecker miał 65 lat gdy zmarł.
Pomocnicze pytanie: W jakim wieku Harry Vaughan Watkins był gdy zmarł?
Pomocnicza odpowiedź: Harry Vaughan Watkins miał 69 lat gdy zmarł.
Ostateczna odpowiedź: Harry Vaughan Watkins

Pytanie: Ktoś „nie w ciemię bity” to ktoś sprytny czy naiwny? Odpowiedz krótko.
Czy potrzebne są tutaj pomocnicze pytania: Tak

Pomocnicze pytanie: Co oznacza powiedzenie „nie w ciemię bity”?
Pomocnicza odpowiedź: Powiedzenie „nie w ciemię bity” oznacza, że ktoś jest sprytny i zdolny do wyciągania wniosków.
Ostateczna odpowiedź: Sprytny.
CPU times: total: 15.6 ms
Wall time: 4.55 s


## Dataset A

### Answers from GPT

In [128]:
from concurrent.futures import ThreadPoolExecutor
from threading import Lock

gpt_answers = {}
gpt_answers_lock = Lock()

In [129]:
def get_gpt_answer(question: str) -> None:
        prompt = prepare_self_ask(
            question=question.strip(),
            follow_up_questions=follow_up_questions,
            follow_up_answers=follow_up_answers,
        )
        answer = api.send_prompt(
            prompt=prompt,
            temperature=0,
            max_length_tokens=256,
        )
        with gpt_answers_lock:
            gpt_answers[question] = answer


with ThreadPoolExecutor(max_workers=3) as pool:
    futures = []
    for q in tqdm(questions):
        future = pool.submit(get_gpt_answer, q)
        futures.append(future)

    for fut in futures:
        fut.result()
        

100%|██████████| 3500/3500 [00:00<00:00, 69928.71it/s]


In [123]:
# gpt_answers

## Dataset B

In [6]:
questions_b, answers_b = [], []
with open('data/B.answers', encoding="UTF-8") as f:
    for line in f.readlines():
        try:
            a = line.strip()
            answers_b.append(a)
        except Exception as e:
            print(line)

with open('data/B.questions', encoding="UTF-8") as f:
    for line in f.readlines():
        try:
            q = line.strip()
            questions_b.append(q)
        except Exception as e:
            print(line)

## Answers for dataset B

In [27]:
gpt_answers = {}
gpt_answers_exceptions = []

In [28]:
def get_gpt_answer(question: str) -> None:
        prompt = prepare_self_ask(
            question=question.strip(),
            follow_up_questions=follow_up_questions,
            follow_up_answers=follow_up_answers,
        )
        answer = api.send_prompt(
            prompt=prompt,
            temperature=0,
            max_length_tokens=256,
        )
        gpt_answers[question] = answer



for q in tqdm(questions_b):
    try:
        answer = get_gpt_answer(q)
    except Exception as e:
        gpt_answers_exceptions.append(q)

100%|██████████| 2500/2500 [2:48:52<00:00,  4.05s/it]  


In [69]:
gpt_answers_exceptions

['Jak nazywa się gazeta, którą można czytać na ekranie telewizora?',
 'Któremu twórcy poświęcona jest krakowska instytucja kultury Cricoteka?',
 'Jak nazywa się stolica Korei Południowej?',
 'Jak nazywa się instrument Murzynów amerykańskich, chordofon szarpany z okrągłym pudłem rezonansowym krytym błoną z długą szyjką i 4–9 strunami?']

In [32]:
def get_gpt_answer(question: str) -> None:
        prompt = prepare_self_ask(
            question=question.strip(),
            follow_up_questions=follow_up_questions,
            follow_up_answers=follow_up_answers,
        )
        answer = api.send_prompt(
            prompt=prompt,
            temperature=0,
            max_length_tokens=256,
        )
        gpt_answers[question] = answer



for q in tqdm(gpt_answers_exceptions):
    #try:
    answer = get_gpt_answer(q)
    #except Exception as e:
    #    gpt_answers_exceptions.append(q)

100%|██████████| 4/4 [00:14<00:00,  3.60s/it]


In [64]:
with open('BData/all_answers.txt', 'w') as file:
    file.write(json.dumps(gpt_answers))

In [74]:
with open('BData/all_answers.txt') as f:
    data = f.read()
    saved_answers = json.loads(data)

In [53]:
for q in questions_b:
    with open("BData/found_answers.txt", 'a') as f:
        a = gpt_answers[q][gpt_answers[q].find("Ostateczna odpowiedź:") + len("Ostateczna odpowiedź:"):]
        f.write(a.strip() + '\n')

In [62]:
for q in questions_b:
     a = gpt_answers[q][gpt_answers[q].rfind("Ostateczna odpowiedź:") + len("Ostateczna odpowiedź:"):]
     if "Ostateczna odpowiedź:" not in gpt_answers[q]:
           a = gpt_answers[q][gpt_answers[q].rfind("Pomocnicza odpowiedź:") + len("Pomocnicza odpowiedź:"):]
     if "Pomocniczna" in a or "Pomocnicze" in a:
          print(q)
          #print(gpt_answers[q])
          print(a)
          a = ""
     
     a = a.replace(".", '')
     with open("testing/found_answers.txt", 'a') as f:
          f.write(a.strip() + '\n')

Która figura geometryczna może być pitagorejska, ostrokątna, indyjska, egipska?
 Figura indyjska to trójkąt, w którym jeden z boków jest dłuższy od pozostałych dwóch.
Pomocnicze pytanie: Co to


In [78]:
def format_gpt_answer(long_gpt_answer: str) -> str:
    return long_gpt_answer.split('\n')[-1].replace("Ostateczna odpowiedź: ", '').strip('.').lower()

In [133]:
correct_geographical_location = {
    "chiny": "w chinach",
    "egipt": "w egipcie",
    "azja": "w azji",
    "afryka": "w afryce",
    "indie": "w indiach",
    "kraków": "w krakowie"
}

extract_number ={
    "jeden": 1,
    "raz": 1,
    "dwa": 2,
    "trzy": 3,
    "cztery": 4,
    "pięć": 5,
    "sześć": 6,
    "siedem": 7,
    "osiem": 8,
    "dziewięć": 9,
    "dziesięć": 10,
}


In [134]:
def modify_gpt_answer(gpt_ans: str) -> str:
    if len(gpt_ans) > 3 and gpt_ans[:3] in  ("tak", "nie"):
        gpt_ans = gpt_ans[:3]
    if gpt_ans[0].isdigit():
        gpt_ans = "".join(list(filter( lambda x: x.isdigit() or x in ('-'), gpt_ans)))
    if gpt_ans in correct_geographical_location:
        gpt_ans = correct_geographical_location[gpt_ans]
    if gpt_ans.split()[0] in extract_number:
        gpt_ans = str(extract_number[gpt_ans.split()[0]])

    if len(list(filter( lambda x: x.isdigit() or x in ('-'), gpt_ans))) > 0:
        gpt_ans = "".join(list(filter( lambda x: x.isdigit() or x in ('-'), gpt_ans)))

    if len(gpt_ans.split(",")) > 0:
        gpt_ans = gpt_ans.split(",")[0]
    
    return gpt_ans

In [136]:
with open("BData/found_answers.txt", 'w') as f:
    for q in questions_b:
        if "Ostateczna odpowiedź:" not in saved_answers[q]:
           a = saved_answers[q][saved_answers[q].rfind("Pomocnicza odpowiedź:") + len("Pomocnicza odpowiedź:"):]
        else:
            a = format_gpt_answer(saved_answers[q])

        if "Pomocniczna" in a or "Pomocnicze" in a:
            #print(q)
        #   #print(gpt_answers[q])
            print(a)
            a = "a"
        
        a = modify_gpt_answer(a)
        a = a.replace(".", '')
        
        f.write(a.strip() + '\n')

 Figura indyjska to trójkąt, w którym jeden z boków jest dłuższy od pozostałych dwóch.
Pomocnicze pytanie: Co to


In [137]:
found_answers = []
correct_answers = []

for x in open('BData/correct_answers.txt', "r", encoding="utf-8"):
    x = x.strip()
    correct_answers.append(x.lower().split('\t'))
    
for x in open('BData/found_answers.txt', "r", encoding="utf-8"):    
    x = x.strip()
    found_answers.append(x.lower())

In [138]:
import editdistance
rn = ['ii', 'iii', 'iv', 'v', 'vi', 'vii', 'viii', 'ix', 'x', 'xi', 'xii', 'xiii',
                 'xiv', 'xv', 'xvi', 'xvii', 'xviii', 'xix', 'xx', 'xxi', 'xxii']

rome_numbers = dict(zip(rn, range(2, 23)))

def numbers_from(s):
    res = set()
    for w in s.split():
        w = w.lower()
        if w.isdecimal():
            res.add(w)
        if w in rome_numbers:
            res.add(rome_numbers[w])
    return res                 
                 
                 
def is_number(s):
    return lower(s) in rome_numbers or s.isdecimal()
                     
def scaled_editdist(ans, cor):
    ans = ans.lower()
    cor = cor.lower()
    
    return editdistance.eval(ans, cor) / len(cor)

def single_match(a, c):
    numbers_c = numbers_from(c)
    numbers_a = numbers_from(a)
        
    return numbers_a == numbers_c and scaled_editdist(a, c) < 0.5
        
def match(ans, cor):
    return any(single_match(ans, c) for c in cor)

for ans, cor in zip(found_answers, correct_answers):    
    if match(ans, cor):
        pass#score += 1
    else:
        print("WA: ", ans, cor)

WA:  europejska wspólnota węgla i stali powstała wcześniej ['europejska wspólnota węgla i stali']
WA:  500 ['w xvi', '16']
WA:  lada niva ['niva']
WA:  godzilla ['king kong']
WA:  powieść o aramisie napisał alexandre dumas ['„trzej muszkieterowie”']
WA:  lina cumownicza ['cuma']
WA:  zenon jazownik ['lucjan trela']
WA:  akcja „krzyżaków” toczy się w xv wieku ['w xv', '15']
WA:  cyrenejczyk i łazarz ['szymon cyrenejczyk', 'szymon z cyreny']
WA:  olga tokarczuk ['wiesław myśliwski']
WA:  instrument dęty blaszany ['dęty blaszany']
WA:  brazylia ['przez peru', 'peru']
WA:  hadley wynalazł równoleżnik ['sekstant']
WA:  kabaret starszych panów ['kabaret tey', 'tey']
WA:  w chinach ['chiny']
WA:  obywatelem danii ['danii']
WA:  nie ['tak']
WA:  sejm ['zgromadzenie narodowe']
WA:  - ['w saint tropez']
WA:  łódź żaglowa na lodzie ['bojer']
WA:  geologia strukturalna ['tektonika']
WA:  krzyżacy ['przeciwko państwu krzyżackiemu', 'przeciw krzyżakom', 'państwo krzyżackie']
WA:  gerlachovský štít [

## Finetuning

In [12]:
training_data = []
for i in range(len(questions)):
    training_data.append({"prompt" : f"<{questions[i]}>", "completion": f"<{answers[i][0]}>"})
sampled_data = np.random.choice(training_data, 500)