In [45]:
from google.cloud import bigquery
import pandas as pd

In [46]:

time = '2025-06-29'
SQL_QUERY =  f"""
SELECT
  sso_id,additional_info,campaign_details,campaign_name,platform,event_time,record_type
FROM
  `htz-common.raw_data.requests` 
WHERE
  TIMESTAMP_TRUNC(event_time, DAY) >= TIMESTAMP('{time}')
  AND page_type = 'Chatbot'
  AND campaign_name in ('response answer','open question')
  -- AND sso_id IS NOT NULL
ORDER BY
  event_time DESC;
"""
client = bigquery.Client()
query_job = client.query(SQL_QUERY)

results = query_job.result() 
df = results.to_dataframe()
# add index
df['index'] = df.index
df['event_time_temp'] = df['event_time'].dt.strftime('%Y-%m-%d %H:%M')
df['event_time'] = df['event_time'].dt.strftime('%Y-%m-%d %H:%M:%S')
df = df.drop_duplicates(subset=['sso_id', 'campaign_details','event_time'], keep='last')
response = df[df['campaign_name'] == 'response answer'].drop_duplicates(subset=['sso_id','campaign_details'], keep='last')
df_f = pd.concat([df[df['campaign_name'] == 'open question'], response], ignore_index=True)
df_f = df_f.drop(columns=['event_time_temp'])
print(df_f.shape[0])
df_f = df_f.reset_index(drop=True)
df = df_f.copy()
df.head(2)



152


Unnamed: 0,sso_id,additional_info,campaign_details,campaign_name,platform,event_time,record_type,index
0,6985707979,"[{'key': 'session_id', 'value': '6'}]",מה לגבי סרט ריגול?,open question,Desktop,2025-06-29 13:27:29,action,3
1,8010962861,"[{'key': 'session_id', 'value': '146'}]",סרט מתח באמזון פריים,open question,Desktop,2025-06-29 13:02:34,action,6


In [47]:
# preprocess the data

df['parsed_data'] = df['additional_info'].apply(lambda x: {item['key']: item['value'] for item in x})
# add index to parsed data
expanded_df = pd.json_normalize(df['parsed_data'].tolist())

expanded_df = expanded_df.drop(columns=['sso_id'])
df_cleaned = df.drop(columns=['additional_info', 'parsed_data'])
df = pd.concat([df_cleaned, expanded_df], axis=1)
df['id'] = df['sso_id'].astype(str) + '_' + df['session_id'].astype(str)

df.head(2)

Unnamed: 0,sso_id,campaign_details,campaign_name,platform,event_time,record_type,index,session_id,total_time,rag_speed,...,article_ids_1,error,remaining_user_messages,troll_triggered,conversation_key,genres,regenerate,media_type,streaming_platforms,id
0,6985707979,מה לגבי סרט ריגול?,open question,Desktop,2025-06-29 13:27:29,action,3,6,,,...,,,,,,,,,,6985707979_6
1,8010962861,סרט מתח באמזון פריים,open question,Desktop,2025-06-29 13:02:34,action,6,146,,,...,,,,,,,,,,8010962861_146


In [48]:
df['id'].value_counts().sort_values(ascending=False).head(10)

id
8010962861_141     15
9037014398_4       14
8010962861_140     14
366578086115_15    10
9037046938_113      9
9037014398_12       8
8010962861_144      6
6985707979_6        5
5092504451_2        5
9037014398_18       5
Name: count, dtype: int64

In [56]:
def parse_conversation(ids:str,time:bool) -> str:
    """
    Parse the conversation from the DataFrame based on the provided id.
    """
    conversation = df[df['id'] == ids]
    conversation = conversation.sort_values(by='event_time', ascending=True)
    if conversation.empty:
        return "No conversation found for this ID."
    
    conversation_text = []
    for _, row in conversation.iterrows():
        if row['campaign_name'] == 'open question':
            if time:
                text = f"{row['event_time']} - USER: {row['campaign_details']}"
            else:
                text = f"USER: {row['campaign_details']}"
        elif row['campaign_name'] == 'response answer':
            if time:
                text = f"{row['event_time']} - LLM: {row['campaign_details']}"
            else:
                text = f"LLM: {row['campaign_details']}"
        conversation_text.append(text)
    
    return "\n".join(conversation_text)

txt = parse_conversation('9037014398_4', True)
print(txt)

2025-06-29 12:14:42 - LLM: <strong>גילי איזיקוביץ</strong> ממליצה על <strong>בלאק הוק דאון: הקרב במוגדישו</strong>, סדרה תיעודית בנטפליקס שמתארת את הקרב האיום במוגדישו ב-1993, שהפך למלכודת דם ואש. הסדרה, שמציגה עדויות ונקודות מבט מגוונות, מציעה התבוננות מרתקת על האירועים הטראומטיים וכיצד שינו את תפיסת המלחמה. <strong>חן חדד</strong> ממליצה על <strong>הטבעונית הרעה: תהילה, מרמה, בריחה</strong> (Bad Vegan: Fame.Fraud. Fugitives), גם היא סדרה דוקומנטרית בנטפליקס. הסדרה עוקבת אחר סיפורה המטורף של שפית סלבריטאית מצליחה שהואשמה בהונאה, גניבת שכר עובדים ונמלטה מהמשטרה, כשלטענתה נפלה קורבן לגזלייטינג.האם תרצו המלצות נוספות על סדרות דוקומנטריות בנטפליקס, או אולי סדרה בז'אנר אחר?
2025-06-29 12:16:46 - USER: כבר ראיתי את הסדרות האלה. אפשר עוד?
2025-06-29 12:16:51 - LLM: <strong>גילי איזיקוביץ</strong> ממליצה על <strong>סיפוריו של דור</strong>, סדרה דוקומנטרית מרגשת בנטפליקס שיצר מרטין סקורסזה. הסדרה עוסקת במרכיבי היסוד של חיינו כמו אהבה, חלומות, מאבקים ועבודה, מנקודת מבטם של אנשים שונים בעשור השמ

In [52]:
from pydantic import BaseModel, Field

class ReviewChat(BaseModel):
    quality: int = Field(..., description="Quality rating of the chat conversation, from 1 to 5, where 1 is poor and 5 is excellent.")
    feedback: str = Field(..., description="Feedback on the chat conversation.")
    politeness: int = Field(..., description="Politeness rating of the LLM response, from 1 to 5, where 1 is rude and 5 is polite.")
    knowledge_from_RAG: bool = Field(..., description="Whether the LLM response used knowledge from RAG (True or False).")
    answer_relevance: int = Field(..., description="Relevance of the LLM response to the user's question, from 1 to 5, where 1 is not relevant and 5 is highly relevant.")
    not_reveal_system_info: bool = Field(..., description="Whether the LLM response did not reveal any system information (True or False).")
    


In [53]:
from google import genai
import os

model_name = "gemini-2.5-pro"
system_instruction = """
You are an LLM as a judge designed to test the quality of the output of a RAG-based chatbot for movie and series recommendations. 
You will receive parameters for examining the conversation between the user and the language model, 
and you must return an answer as to whether the correspondence meets the criteria you received.
"""

client = genai.Client(api_key=os.environ.get("GOOGLE_API_KEY"))
temp = client.models.generate_content(
    model=model_name,
    contents=txt,
                config={
            'response_mime_type': 'application/json',
            'response_schema': ReviewChat,
            'system_instruction': system_instruction,
        },
)



In [54]:
temp.parsed

ReviewChat(quality=2, feedback="המודל נכשל בתגובה הראשונית והחזיר 'None' במקום תשובה. זהו כישלון משמעותי. עם זאת, בכל הפעמים שלאחר מכן, כאשר המשתמש ביקש המלצות נוספות, המודל סיפק תשובות טובות, רלוונטיות, מנומסות ועשה שימוש בידע מ-RAG על ידי ציטוט מבקרי קולנוע ספציפיים.", politeness=5, knowledge_from_RAG=True, answer_relevance=5, not_reveal_system_info=False)

In [55]:
temp.parsed.feedback

"המודל נכשל בתגובה הראשונית והחזיר 'None' במקום תשובה. זהו כישלון משמעותי. עם זאת, בכל הפעמים שלאחר מכן, כאשר המשתמש ביקש המלצות נוספות, המודל סיפק תשובות טובות, רלוונטיות, מנומסות ועשה שימוש בידע מ-RAG על ידי ציטוט מבקרי קולנוע ספציפיים."