Zdobyliśmy transkrypcję nagrań z kilku rozmów, które mogą być dla nas interesujące. Wszystkie pośrednio lub bezpośrednio dotyczą Rafała. Niestety dane, które posiadamy, są dosłownie poszatkowane. Wiemy, że wszystkich rozmów było 5 sztuk. Wiemy także z logów, jakim zdaniem rozpoczyna i kończy się każda rozmowa. Dodatkowo dowiedzieliśmy się, że podczas rozmowy padają pewne sprzeczne ze sobą informacje. Trzeba zweryfikować, który z rozmówców jest kłamcą i wykluczyć jego wersję podawanych nam danych. Mając zgromadzoną wszelką potrzebną wiedzę, pozostaje nam jedynie udzielenie odpowiedzi na pytania od Centrali. Być może przydadzą Ci się dane z folderu z taktami (”facts”) z poprzednich zadań. Nazwa zadania to “phone”.

Oto dane, na których pracujemy:

https://centrala.ag3nts.org/data/TUTAJ-KLUCZ/phone.json

Lista pytań od centrali:

https://centrala.ag3nts.org/data/TUTAJ-KLUCZ/phone_questions.json

Oczekiwany format odpowiedzi do centrali

{
  "01":"zwięzła odpowiedź",
  "02":"zwięzła odpowiedź",
  "03":"zwięzła odpowiedź",
  "04":"zwięzła odpowiedź",
  "05":"zwięzła odpowiedź",
  "06":"zwięzła odpowiedź",
}


Co należy zrobić w zadaniu?

Pobierz JSON-a z transkrypcją rozmów i odbuduj strukturę każdej z konwersacji

Możesz spróbować wywnioskować, jak mają na imię poszczególne postacie. Przyda Ci się to przy odpowiadaniu na pytania

Niektóre osoby odwołują się do pewnych faktów, ale jedna osoba ściemnia - która? Konieczne tutaj będzie odwołanie się albo do wiedzy powszechnej, albo do folderu z faktami

Pobierz listę pytań z centrali i spróbuj na nie odpowiedzieć.

Jedno z pytań wymaga porozmawiania z API, pobrania odpowiedzi i wrzucenia jej do jednego z pól w answer.

Gdy wszystkie dane będą już skompletowane, odeślij je do centrali jako zadanie “phone”

Jeśli odpowiedzi będą poprawne, otrzymasz flagę w odpowiedzi od centrali

🚨 UWAGA 🚨: nie wszystkie informacje podane są w tekście. Niektóre należy uzyskać z “faktów” z poprzednich zadań. W każdej rozmowie uczestniczą tylko dwie osoby, które wypowiadają się naprzemiennie. Imiona rozmówców są unikalne, więc jeśli np. Stefan pojawia się w pierwszej i piątej rozmowie, to jest to ten sam Stefan.

To zadanie (jak wszystkie inne) można wykonać na wiele różnych sposobów. Ideałem byłoby napisanie takiego kodu i takiego zbioru promptów, aby napisana przez Ciebie aplikacja samodzielnie była w stanie odpowiedzieć na pytania centrali, samodzielnie pozyskać potrzebne fakty, samodzielnie ocenić prawdziwość napotkanych informacji oraz samodzielnie porozmawiać w odpowiedni sposób z podanym API. To jest oczywiście wersja “MAX”. Początkowo sugerujemy zrobienie wersji, która po prostu działa.

🛟 POMOC 🛟

Pierwsza część zadania polegająca na poprawnym ułożeniu kolejności wypowiedzi w dialogach może wymagać bardzo zaawansowanego prompt engineeringu lub nietypowego podejścia do problemu (np. iteracyjnie składanie rozmów, zdanie po zdaniu, a nie od razu całości). Jeśli po wielu próbach stracisz nadzieję, że da się to zrobić lub zaczniesz wypowiadać się niczym Rafał w nagraniach, to w celu zachowania Twojego zdrowia psychicznego, poniżej publikujemy już posortowane rozmowy. Dzięki nim możesz przejść do dalszej części zadania, pomijając tę część (zdekoduj base64).

In [2]:
import requests
import os
import json
from dotenv import load_dotenv

load_dotenv()

personal_api_key = os.getenv("PERSONAL_API_KEY")

In [3]:
file = requests.get(f"https://centrala.ag3nts.org/data/{personal_api_key}/phone.json")
# Add encoding parameter to requests to ensure proper character handling
file.encoding = 'utf-8'
with open("phone.json", encoding="utf-8", mode="w") as f:
    f.write(file.text)

In [4]:
questions = requests.get(f"https://centrala.ag3nts.org/data/{personal_api_key}/phone_questions.json")
questions.encoding = 'unicode_escape'
print(questions.text)


{
    "01": "Jeden z rozmówców skłamał podczas rozmowy. Kto to był?",
    "02": "Jaki jest prawdziwy endpoint do API podany przez osobę, która NIE skłamała?",
    "03": "Jakim przezwiskiem określany jest chłopak Barbary?",
    "04": "Jakie dwie osoby rozmawiają ze sobą w pierwszej rozmowie? Podaj ich imiona",
    "05": "Co odpowiada poprawny endpoint API po wysłaniu do niego hasła w polu "password" jako JSON?",
    "06": "Jak ma na imię osoba, która dostarczyła dostęp do API, ale nie znała do niego hasła, jednak nadal pracuje nad jego zdobyciem?"
}


In [5]:
import openai
client = openai.OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

In [6]:
talk_to_fit = json.loads(file.text)["reszta"]

print(json.dumps(talk_to_fit, indent=4))

[
    "- no ja nie mog\u0119... ale to spokojnie przyjmujesz. Po prostu \"s\u0142ysza\u0142em\"? Go\u015bcia ju\u017c nie ma! Nie \u017cyje! Oni chyba [*niezrozumia\u0142e d\u017awi\u0119ki*] i go\u015b\u0107 nie \u017cyje! [*niezrozumia\u0142e d\u017awi\u0119ki*] wi\u0119c musimy [*trzaski*] wi\u0119c [*trzaski*] bo dron [*trzaski*]",
    "- tak. Dos\u0142ownie przed chwil\u0105 rozmawia\u0142em, gdy zadzwoni\u0142e\u015b, ale nic od niego nie wydoby\u0142a",
    "- Nie wiem. Siedz\u0119 nad tymi warstwami ju\u017c\u00a0od kilku dni i powiem Ci, \u017ce on musia\u0142 u\u017cywa\u0107 technologii z przysz\u0142o\u015bci, bo nasze LLM-y s\u0105 zbyt wolne, aby przej\u015b\u0107 kolejne warstwy weryfikacji. Bez skoku w czasie i pomocy Zygfryda chyba si\u0119\u00a0nie uda",
    "- Dobra. Uznajmy, \u017ce wiedzia\u0142 o nadajniku. A zosta\u0142y jakie\u015b\u00a0Twoje \u015blady w jaskini jak tam by\u0142a\u015b? mog\u0105 si\u0119\u00a0zorientowa\u0107, \u017c\u0119 go odwiedza\u0142a\u

In [7]:
with open("prompt.md", "r") as f:
    prompt = f.read()
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "system", "content": prompt}, {"role": "user", "content": json.dumps(talk_to_fit)}]
)

print(response.choices[0].message.content)

```json
{
    "01": "Samuel kłamał.",
    "02": "https://rafal.ag3nts.org/510bc",
    "03": "Nauczyciel",
    "04": "Zygfryd, Barbara",
    "05": "Nie mogę odpowiedzieć na to pytanie bez danych.",
    "06": "Samuel"
}
```


In [8]:
# Extract the JSON content from the response
response_content = response.choices[0].message.content

# Find the JSON block between triple backticks
import re
json_match = re.search(r'```json\s*(.*?)\s*```', response_content, re.DOTALL)

if json_match:
    json_str = json_match.group(1)
    answer = json.loads(json_str)

print(json.dumps(answer, indent=4))

{
    "01": "Samuel k\u0142ama\u0142.",
    "02": "https://rafal.ag3nts.org/510bc",
    "03": "Nauczyciel",
    "04": "Zygfryd, Barbara",
    "05": "Nie mog\u0119 odpowiedzie\u0107 na to pytanie bez danych.",
    "06": "Samuel"
}


In [9]:
answer_json = {
    "task": "phone",
    "apikey": personal_api_key,
    "answer": answer
}
answer_url = "https://centrala.ag3nts.org/report"
answer_response = requests.post(answer_url, json=answer_json)
print(answer_response.request.body.decode('unicode-escape'))  # Displays the request body

# Assuming `login_response` is the response object from the login request
print("Status Code:", answer_response.status_code)  # Displays the status code (e.g., 200)
print("Response Body:", answer_response.text.encode('utf-8').decode('unicode-escape'))       # Displays the response content as a string

{"task": "phone", "apikey": "1400cbf0-b7dd-49ab-9342-6ad8fd26ba69", "answer": {"01": "Samuel kłamał.", "02": "https://rafal.ag3nts.org/510bc", "03": "Nauczyciel", "04": "Zygfryd, Barbara", "05": "Nie mogę odpowiedzieć na to pytanie bez danych.", "06": "Samuel"}}
Status Code: 400
Response Body: {
    "code": -350,
    "message": "Answer for question 02 is incorrect"
}


In [10]:
def ai_web_tool(endpoint, password):
    response = requests.post(endpoint, json={"password": password})
    return response.text, response.status_code



In [11]:
api_web_tool = ai_web_tool("https://rafal.ag3nts.org/b46c3","NONOMNISMORIAR")
print(api_web_tool)

('{\n    "code": 0,\n    "message": "0330171265a738aabdb453021d9b7ced",\n    "hint": "This token changes every minute!"\n}', 200)


In [12]:
def decide_to_use_api(answer_attempt):
    decision = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "system", "content": "You are a helpful assistant that decides whether to use an API or not. You are given an answer attempt and you need to decide whether to use an API or not If there is an API endpoint in the answer attempt, use it. Answer only with 'yes' or 'no'."}, {"role": "user", "content": str(answer_attempt)}]
    )
    return decision.choices[0].message.content


In [13]:
decision = decide_to_use_api("Ciepła kawa")
print(decision)



no


In [14]:
def try_answer(answer_attempt):
    answer_json = {
        "task": "phone",
        "apikey": personal_api_key,
        "answer": answer_attempt
    }
    response = requests.post(answer_url, json=answer_json)
    return response.text, response.status_code

def get_ai_suggestion(current_answers, feedback, context):
    # Create a prompt for the AI
    # Keep track of previously tried wrong answers
    if not hasattr(get_ai_suggestion, 'wrong_answers_cache'):
        get_ai_suggestion.wrong_answers_cache = {}

    # Create cache key from current answers
    cache_key = json.dumps(current_answers, sort_keys=True)
    api_response = None
    if decide_to_use_api(current_answers) == "yes":
        api_response, status_code = ai_web_tool("https://rafal.ag3nts.org/b46c3","NONOMNISMORIAR")
        # Handle api_response as a string since it appears to be returned as a string
        api_response = f"API endpoint response (if available): {api_response}"
    
    re_propmpt = f"""
    Given these current answers:
    {json.dumps(current_answers, indent=2)}

    And this feedback from the server:
    {feedback}

    {api_response}

    The context of the conversation is:
    {context}

    Suggest improvements to make the answers more accurate. Focus on what might be wrong based on the feedback.
    Provide your suggestion as a JSON object with the same structure as the current answers.
    Only suggest changes if you have a strong reason to believe the current answer is incorrect.
    Avoid suggesting answers that were previously tried and failed.
    """

    response = client.chat.completions.create(
        model="gpt-4",
        messages=[
            {"role": "system", "content": prompt},
            {"role": "user", "content": re_propmpt, "context": context}
        ]
    )
    
    try:
        # Extract JSON from the response
        suggestion_text = response.choices[0].message.content
        # Find JSON block in the response
        json_start = suggestion_text.find('{')
        json_end = suggestion_text.rfind('}') + 1
        if json_start >= 0 and json_end > json_start:
            suggestion_json = json.loads(suggestion_text[json_start:json_end])
            return suggestion_json
    except Exception as e:
        print(f"Error parsing AI suggestion: {e}")
        return current_answers

    return current_answers

def search_answers_with_ai():
    # Initial answers
    current_answer = answer
    max_attempts = 7
    attempt = 0
    
    while attempt < max_attempts:
        print(f"\nAttempt {attempt + 1}/{max_attempts}")
        print("Current answers:", json.dumps(current_answer, indent=2))
        
        # Try current answers
        response_text, status = try_answer(current_answer)
        print(f"Server response: {response_text}")
        
        # If we got a success response, break
        if "flg" in response_text.lower():
            print("All answers are correct!")
            break

        # Get AI suggestion for improvements
        suggested_answers = get_ai_suggestion(current_answer, response_text, talk_to_fit)
        
        # Update answers that changed
        changes_made = False
        for key in suggested_answers:
            if suggested_answers[key] != current_answer[key]:
                print(f"Updating {key}: {current_answer[key]} -> {suggested_answers[key]}")
                current_answer[key] = suggested_answers[key]
                changes_made = True
        
        # If no changes were suggested, break to avoid infinite loop
        if not changes_made:
            print("No more suggestions for improvements")
            break
            
        attempt += 1
    
    return current_answer

# Run the AI-assisted search
improved_answer = search_answers_with_ai()
print("\nFinal answers:")
print(json.dumps(improved_answer, indent=2))



Attempt 1/10
Current answers: {
  "01": "Samuel k\u0142ama\u0142.",
  "02": "https://rafal.ag3nts.org/510bc",
  "03": "Nauczyciel",
  "04": "Zygfryd, Barbara",
  "05": "Nie mog\u0119 odpowiedzie\u0107 na to pytanie bez danych.",
  "06": "Samuel"
}
Server response: {
    "code": -350,
    "message": "Answer for question 02 is incorrect"
}
Updating 02: https://rafal.ag3nts.org/510bc -> https://rafal.ag3nts.org/b46c3

Attempt 2/10
Current answers: {
  "01": "Samuel k\u0142ama\u0142.",
  "02": "https://rafal.ag3nts.org/b46c3",
  "03": "Nauczyciel",
  "04": "Zygfryd, Barbara",
  "05": "Nie mog\u0119 odpowiedzie\u0107 na to pytanie bez danych.",
  "06": "Samuel"
}
Server response: {
    "code": -350,
    "message": "Answer for question 04 is incorrect"
}
Updating 04: Zygfryd, Barbara -> Barbara, Samuel

Attempt 3/10
Current answers: {
  "01": "Samuel k\u0142ama\u0142.",
  "02": "https://rafal.ag3nts.org/b46c3",
  "03": "Nauczyciel",
  "04": "Barbara, Samuel",
  "05": "Nie mog\u0119 odpowied

In [16]:
print(json.dumps(improved_answer, indent=2))

{
  "01": "Samuel k\u0142ama\u0142.",
  "02": "https://rafal.ag3nts.org/b46c3",
  "03": "Nauczyciel",
  "04": "Barbara, Samuel",
  "05": "aa59416b3b1bbeac32a5b293c29e44b2",
  "06": "Tomasz"
}


In [36]:
manual_answer = json.loads(response.choices[0].message.content)
manual_answer["06"] = "Aleksander"
print(manual_answer)
try_answer(manual_answer)

{'01': 'Samuel kłamał.', '02': 'https://rafal.ag3nts.org/b46c3', '03': 'Nauczyciel', '04': 'Barbara, Samuel', '05': 'aa59416b3b1bbeac32a5b293c29e44b2', '06': 'Aleksander'}


('{\n    "code": 0,\n    "message": "{{FLG:MYKINGDOM}}"\n}', 200)