In [3]:
import os
from langchain.docstore.document import Document
from langchain_community.vectorstores import FAISS
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from file_utils import get_docs_for_plan, pdf_to_text, clean_and_split,sentencewise_translate, temp_get_docs_for_plan
from models import get_embedding_model, get_gemini_llm, get_claude_llm, get_mistral_llm, get_commandR_llm
from RAG import get_answer, get_answer_foreach_doc, diffrent_question_rephrasing, get_top_k_by_count
import pandas as pd
import time
import pandas as pd
from itertools import chain
import torch
import dotenv

dotenv.load_dotenv()
device = 'cuda' if torch.cuda.is_available() else 'cpu'
device


'cpu'

# read data

In [4]:
data = pd.read_csv('shpan.csv')
data[["pl_number", 'pl_name']].head()

Unnamed: 0,pl_number,pl_name
0,101-0253286,תוספת שטחי בניה עיקריים עבור מרפסות מקורות בתנאים
1,101-0209593,רכבת קלה בירושלים - קו ירוק
2,101-0699561,"כביש 396, בין צומת כרם להדסה"
3,101-0721050,"מתחם הוג'יטק-שינוי הבנוי המאושר בתכנית 6394, ג..."
4,תתל/ 108/ סעיף-78-77,מסילת רכבת בירושלים


# - convret and split each plane - from file_utils.py 
# - and do embedding for each plane and save it in db

In [7]:
embedding_model = get_embedding_model()

if os.path.exists("faiss_index"):
    db = FAISS.load_local("faiss_index", embedding_model)
else:
    all_docs = []
    for i, row in data.iterrows():
        files_text = (pdf_to_text(doc) for doc in temp_get_docs_for_plan(row['pl_number']))

        # for each doc, clean and split to chunks
        files_cleand_chunks = [clean_and_split(text, row['pl_number']) for text in files_text]
        flattened_documents = list(chain(*files_cleand_chunks))

        # print(f"Found {len(flattened_documents)} documents for {row['pl_number']}")
        if len(flattened_documents) == 0:
            continue
        all_docs.extend(flattened_documents)
    db = FAISS.from_documents(all_docs, embedding_model)
    db.save_local("faiss_index")

# try our program with gemini that uses one chunk that the retrival return and ask the model one question

In [8]:
if os.path.exists("result_n1_k0_gemini_binary.csv"):
    df_gemini_n1_k0 = pd.read_csv("result_n1_k0_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=60)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=0, model=llm, verbose=False, multiprocess=4)

    # save the result
    df_gemini_n1_k0 = pd.DataFrame(result)
    df_gemini_n1_k0.to_csv('result_n1_k0_gemini_binary.csv', index=False)

In [23]:
df_gemini_n1_k0['pl_name'] = data['pl_name']
df_gemini_n1_k0[df_gemini_n1_k0['answer']=='כן']

# df_gemini_n1_k0['answer'].value_counts()

Unnamed: 0,pl_number,answer,chunks,pl_name
31,101-0252619,כן,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ...",תוספת בניה בקומת מרתף והכשרת עבירת בניה למרפסת...
133,101-0339010,כן,['יעודי קרקע ושימושים 4.\n מגורים ומסחר 4.1\nש...,"הרחבת מבנה מסחרי ברח' אורוגואי 31, קרית היובל,..."
180,101-0345298,כן,"['תנאים למתן היתרי בניה 6.9\n(\'מרתפי חניה, מת...",אור גנים
271,101-0917013,כן,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ...",רחוב אורוגוואי 18 ירושלים - תוספת זכויות בניה
372,101-1112010,כן,"['הקיים. הבנייה באבן נסורה, חלקה, ללא סיתות, א...","הרחבת יח""ד קיימות - אורוגוואי 18 ירושלים"
429,101-0845842,כן,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ...","תוספות בניה בכל קומות הבניין לשם הרחבות יח""ד, ..."
466,101-1072545,כן,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ...","הרחבת יח""ד ברחוב אורגוואי 44, קריית היובל, ירו..."
469,101-1059435,כן,['דרך מוצעת 4.2\nשימושים4.2.1\n - דרך כהגדרתה ...,"הרחבות יח""ד קיימות ברח' אורוגואי 50א' ירושלים"


as we can see the model is not able to answer the question - not all the planes in uruguay he say yes and the one that he say yes is not in uruguay

# try our program with gemini that uses 3 chunkS that the retrival return and ask the model one question

In [10]:
if os.path.exists("result_n3_k0_gemini_binary.csv"):
    df_gemini_n3_k0 = pd.read_csv("result_n3_k0_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=60)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=3, num_rephrasings=0, model=llm, verbose=False, multiprocess=4)

    # save the result
    df_gemini_n3_k0 = pd.DataFrame(result)
    df_gemini_n3_k0.to_csv('result_n3_k0_gemini_binary.csv', index=False)

In [11]:
df_gemini_n3_k0[df_gemini_n3_k0['answer']=='כן']

df_gemini_n3_k0['answer'].value_counts()

answer
אין ברשותי מספיק מידע.                                                                             338
No document found                                                                                  168
לא                                                                                                  20
כן                                                                                                   8
אין ברשותי מספיק מידע                                                                                5
אין ברשותי מספיק מידע כדי לענות על השאלה.                                                            4
אין ברשותי מספיק מידע. הקטעים שסופקו אינם מזכירים את רחוב אורוגוואי בהקשר לבנייה המתוכננת.           1
אין ברשותי מספיק מידע כדי לקבוע האם הבנייה המתוכננת היא ברחוב אורוגוואי.                             1
הקטעים שסופקו אינם מכילים מידע על רחוב אורוגוואי, לכן אין ברשותי מספיק מידע כדי לענות על השאלה.      1
אין ברשותי מספיק מידע כדי לקבוע אם הבנייה המתוכננת היא ברחוב אורוג

as we can see the model is not able to answer the question - not all the planes in uruguay he say yes and the one that he say yes is not in uruguay

# try our program with gemini that uses 5 chunkS that the retrival return and ask the model one question

In [12]:
if os.path.exists("result_n5_k0_gemini_binary.csv"):
    df_gemini_n5_k0 = pd.read_csv("result_n5_k0_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=60)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=5, num_rephrasings=0, model=llm, verbose=False, multiprocess=4)

    # save the result
    df_gemini_n5_k0 = pd.DataFrame(result)
    df_gemini_n5_k0.to_csv('result_n5_k0_gemini_binary.csv', index=False)

In [13]:

df_gemini_n5_k0[df_gemini_n5_k0['answer']=='כן']

df_gemini_n5_k0['answer'].value_counts()

answer
אין ברשותי מספיק מידע.                                                                                                                          300
No document found                                                                                                                               168
לא                                                                                                                                               28
אין ברשותי מספיק מידע כדי לענות על השאלה.                                                                                                        14
כן                                                                                                                                                8
אין ברשותי מספיק מידע                                                                                                                             6
אין ברשותי מספיק מידע כדי לקבוע אם הבנייה המתוכננת היא ברחוב אורוגוואי.                                  

as we can see the model is not able to answer the question - not all the planes in uruguay he say yes and the one that he say yes is not in uruguay

In [14]:
if os.path.exists("result_n1_k5_gemini_binary.csv"):
    df_gemini_n1_k5 = pd.read_csv("result_n1_k5_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=60)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=5, model=llm, verbose=False, multiprocess=4)

    # save the result
    df_gemini_n1_k5 = pd.DataFrame(result)
    df_gemini_n1_k5.to_csv('result_n1_k5_gemini_binary.csv', index=False)

In [15]:
df_gemini_n1_k5[df_gemini_n1_k5['answer']=='כן']

df_gemini_n1_k5['answer'].value_counts()

answer
אין ברשותי מספיק מידע.    301
No document found         168
אין ברשותי מספיק מידע      52
לא                         18
כן                          8
Name: count, dtype: int64

In [16]:
if os.path.exists("result_n1_k10_gemini_binary.csv"):
    df_gemini_n1_k10 = pd.read_csv("result_n1_k10_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=60)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=10, model=llm, verbose=False, multiprocess=4)

    # save the result
    df_gemini_n1_k10 = pd.DataFrame(result)
    df_gemini_n1_k10.to_csv('result_n1_k10_gemini_binary.csv', index=False)

In [17]:
df_gemini_n1_k10[df_gemini_n1_k10['answer']=='כן']

df_gemini_n1_k10['answer'].value_counts()

answer
אין ברשותי מספיק מידע.    298
No document found         168
אין ברשותי מספיק מידע      54
לא                         20
כן                          7
Name: count, dtype: int64

# try the same with claude

In [18]:
# read file if exists and if not create it
if os.path.exists('result_n1_k5_claude_binary.csv'):
    df = pd.read_csv('result_n1_k5_claude_binary.csv')
else:
    llm = get_claude_llm()
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=5, model=llm, verbose=False, multiprocess=False)
    # save the result
    df = pd.DataFrame(result)
    df.to_csv('result_n1_k5_claude_binary.csv', index=False)
df

KeyboardInterrupt: 

dont succseed to get the answer that we want(we told him to answer yes or no but he say too much information that we cant summarize)

# try the same with commandR+

In [19]:
if os.path.exists("result_n3_k10_commandR_binary.csv"):
    df = pd.read_csv("result_n3_k10_commandR_binary.csv")
else:
    llm = get_commandR_llm(rate_limit=10)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=0, model=llm, verbose=False, multiprocess=False)

    # save the result
    df = pd.DataFrame(result)
    df.to_csv('result_n3_k10_commandR_binary.csv', index=False)

In [20]:
df['answer'].value_counts()
df[(df['answer']=='כן')| (df['answer']=='כן.')]

Unnamed: 0,pl_number,answer,chunks
31,101-0252619,כן.,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ..."
115,101-0387019,כן.,['\'מגורים א 4.1\nתאום תשתיות עם מהנדס הועדה ה...
133,101-0339010,כן.,['יעודי קרקע ושימושים 4.\n מגורים ומסחר 4.1\nש...
158,101-0205674,כן.,['הגדרות בתכנית 1.9\n \nלא רלוונטי\nכל מונח אש...
180,101-0345298,כן.,"['תנאים למתן היתרי בניה 6.9\n(\'מרתפי חניה, מת..."
265,101-0750851,כן.,['יעודי קרקע ושימושים 4.\n \'מגורים ב 4.1\nשימ...
270,101-0596270,כן.,['\'מגורים ד 4.1\n10 . נקודת פליטת האוויר ממער...
271,101-0917013,כן.,"['- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכנ..."
346,101-1010560,כן.,['יעודי קרקע ושימושים 4.\n \'מגורים ב 4.1\nשימ...
372,101-1112010,כן.,"['הקיים. הבנייה באבן נסורה, חלקה, ללא סיתות, א..."


dont succseed to get the answer that we want - he say yes but the plane is not in uruguay

# try the same with misteral 7

In [21]:
if os.path.exists("result_n3_k10_mistral_binary.csv"):
    df = pd.read_csv("result_n3_k10_mistral_binary.csv")
else:
    llm = get_mistral_llm()
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    # try to get the answer just on one plane
    result = get_answer_foreach_doc(question, db, data[:1], num_docs=1, num_rephrasings=0, model=llm, verbose=True, multiprocess=False)

    # save the result
    df = pd.DataFrame(result)
    df.to_csv('result_n3_k10_mistral_binary.csv', index=False)
df

ValidationError: 1 validation error for LlamaCpp
__root__
  Could not load Llama model from path: models/mistral-7b-instruct-v0.1.Q4_K_M.gguf. Received error Model path does not exist: models/mistral-7b-instruct-v0.1.Q4_K_M.gguf (type=value_error)

In [None]:
import re
def parse_answer(ans):
    # get the answer from the string
    reg1 = r'.*התשובה היא:?\s*"?(כן|לא|אין ברשותי מספיק מידע)"?.*'
    reg2 = r'.*התשובה היא "?(כן|לא|אין ברשותי מספיק מידע)"?.*'
    reg3 = r'.*\n.*(כן|לא|אין ברשותי מספיק מידע).*'
    match = re.match(reg1, ans)
    match2 = re.match(reg2, ans)
    match3 = re.match(reg3, ans)
    if match:
        return match.group(1)
    elif match2:
        return match2.group(1)
    # elif match3:
        # return match3.group(1)
    else:
        return ans

df['answer_parsed'] = df['answer'].apply(parse_answer)
df['answer_parsed'].value_counts()

df[df['answer_parsed']=='כן']['answer'].values[0]

In [None]:
# if os.path.exists("result_n1_k0_gemini_binar
#                   if os.path.exists("result_n3_k0_gemini_binary.csv"):
#     df = pd.read_csv("result_n3_k0_gemini_binary.csv")
# else:
#     llm = get_gemini_llm(rate_limit=True)
#     question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
#     result = get_answer_foreach_doc(question, db, data, num_docs=3, num_rephrasings=0, model=llm, verbose=True, multiprocess=False)

#     # save the result
#     df = pd.DataFrame(result)
#     df.to_csv('result_n3_k0_gemini_binary.csv', index=False)y.csv"):
#     df = pd.read_csv("result_n1_k0_gemini_binary.csv")
# else:
#     llm = get_gemini_llm(rate_limit=60)
#     question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
#     result = get_answer_foreach_doc(question, db, data, num_docs=1, num_rephrasings=0, model=llm, verbose=True, multiprocess=False)

#     # save the result
#     df = pd.DataFrame(result)
#     df.to_csv('result_n1_k0_gemini_binary.csv', index=False)

In [8]:
# if os.path.exists("result_n3_k0_gemini_binary.csv"):
#     df = pd.read_csv("result_n3_k0_gemini_binary.csv")
# else:
#     llm = get_gemini_llm(rate_limit=True)
#     question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
#     result = get_answer_foreach_doc(question, db, data, num_docs=3, num_rephrasings=0, model=llm, verbose=True, multiprocess=False)

#     # save the result
#     df = pd.DataFrame(result)
#     df.to_csv('result_n3_k0_gemini_binary.csv', index=False)

['האם הבניה המתוכננת היא ברחוב אורוגוואי?']
0s document: אין ברשותי מספיק מידע.
1s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


2s document: אין ברשותי מספיק מידע.
3s document: אין ברשותי מספיק מידע.
4s document: No document found
5s document: אין ברשותי מספיק מידע.
6s document: אין ברשותי מספיק מידע.
7s document: No document found
8s document: אין ברשותי מספיק מידע.
9s document: No document found
10s document: No document found
11s document: אין ברשותי מספיק מידע.
12s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.
Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 4.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


13s document: אין ברשותי מספיק מידע
14s document: No document found
15s document: No document found
16s document: No document found
17s document: No document found
18s document: אין ברשותי מספיק מידע.
19s document: אין ברשותי מספיק מידע.
20s document: No document found
21s document: No document found
22s document: אין ברשותי מספיק מידע.
23s document: No document found
24s document: אין ברשותי מספיק מידע.
25s document: No document found
26s document: No document found
27s document: אין ברשותי מספיק מידע.
28s document: No document found
29s document: No document found
30s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


31s document: כן
32s document: No document found
33s document: No document found
34s document: No document found
35s document: אין ברשותי מספיק מידע.
36s document: אין ברשותי מספיק מידע.
37s document: No document found
38s document: No document found
39s document: No document found
40s document: No document found
41s document: No document found
42s document: No document found
43s document: אין ברשותי מספיק מידע.
44s document: אין ברשותי מספיק מידע.
45s document: אין ברשותי מספיק מידע
46s document: No document found
47s document: No document found
48s document: אין ברשותי מספיק מידע.
49s document: אין ברשותי מספיק מידע.
50s document: No document found
51s document: אין ברשותי מספיק מידע.
52s document: אין ברשותי מספיק מידע.
53s document: No document found
54s document: אין ברשותי מספיק מידע.
55s document: No document found
56s document: No document found
57s document: No document found
58s document: לא
59s document: No document found
60s document: אין ברשותי מספיק מידע.
61s document: No

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


111s document: אין ברשותי מספיק מידע.
112s document: No document found
113s document: No document found
114s document: אין ברשותי מספיק מידע.
115s document: אין ברשותי מספיק מידע.
116s document: No document found
117s document: אין ברשותי מספיק מידע.
118s document: אין ברשותי מספיק מידע.
119s document: אין ברשותי מספיק מידע.
120s document: אין ברשותי מספיק מידע.
121s document: אין ברשותי מספיק מידע.
122s document: אין ברשותי מספיק מידע.
123s document: אין ברשותי מספיק מידע.
124s document: No document found
125s document: אין ברשותי מספיק מידע.
126s document: אין ברשותי מספיק מידע.
127s document: No document found
128s document: אין ברשותי מספיק מידע.
129s document: אין ברשותי מספיק מידע.
130s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


131s document: אין ברשותי מספיק מידע.
132s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


133s document: כן
134s document: אין ברשותי מספיק מידע.
135s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


136s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


137s document: אין ברשותי מספיק מידע.
138s document: אין ברשותי מספיק מידע.
139s document: אין ברשותי מספיק מידע
140s document: אין ברשותי מספיק מידע.
141s document: אין ברשותי מספיק מידע.
142s document: אין ברשותי מספיק מידע.
143s document: אין ברשותי מספיק מידע.
144s document: לא
145s document: אין ברשותי מספיק מידע.
146s document: אין ברשותי מספיק מידע.
147s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


148s document: אין ברשותי מספיק מידע
149s document: אין ברשותי מספיק מידע.
150s document: אין ברשותי מספיק מידע.
151s document: אין ברשותי מספיק מידע.
152s document: אין ברשותי מספיק מידע.
153s document: אין ברשותי מספיק מידע.
154s document: אין ברשותי מספיק מידע.
155s document: אין ברשותי מספיק מידע.
156s document: No document found
157s document: אין ברשותי מספיק מידע.
158s document: אין ברשותי מספיק מידע.
159s document: No document found
160s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


161s document: אין ברשותי מספיק מידע.
162s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


163s document: אין ברשותי מספיק מידע.
164s document: לא
165s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


166s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


167s document: אין ברשותי מספיק מידע.
168s document: אין ברשותי מספיק מידע.
169s document: אין ברשותי מספיק מידע.
170s document: אין ברשותי מספיק מידע
171s document: אין ברשותי מספיק מידע.
172s document: אין ברשותי מספיק מידע.
173s document: אין ברשותי מספיק מידע.
174s document: לא
175s document: אין ברשותי מספיק מידע.
176s document: אין ברשותי מספיק מידע.
177s document: אין ברשותי מספיק מידע
178s document: אין ברשותי מספיק מידע.
179s document: אין ברשותי מספיק מידע.
180s document: כן
181s document: אין ברשותי מספיק מידע.
182s document: אין ברשותי מספיק מידע.
183s document: אין ברשותי מספיק מידע.
184s document: No document found
185s document: No document found
186s document: אין ברשותי מספיק מידע.
187s document: אין ברשותי מספיק מידע.
188s document: אין ברשותי מספיק מידע.
189s document: אין ברשותי מספיק מידע.
190s document: אין ברשותי מספיק מידע.
191s document: אין ברשותי מספיק מידע.
192s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


193s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


194s document: לא
195s document: אין ברשותי מספיק מידע.
196s document: אין ברשותי מספיק מידע.
197s document: אין ברשותי מספיק מידע.
198s document: לא
199s document: אין ברשותי מספיק מידע.
200s document: אין ברשותי מספיק מידע.
201s document: אין ברשותי מספיק מידע.
202s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


203s document: אין ברשותי מספיק מידע.
204s document: אין ברשותי מספיק מידע.
205s document: אין ברשותי מספיק מידע.
206s document: אין ברשותי מספיק מידע.
207s document: אין ברשותי מספיק מידע.
208s document: אין ברשותי מספיק מידע.
209s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


210s document: אין ברשותי מספיק מידע.
211s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


212s document: אין ברשותי מספיק מידע.
213s document: אין ברשותי מספיק מידע.
214s document: אין ברשותי מספיק מידע.
215s document: אין ברשותי מספיק מידע.
216s document: אין ברשותי מספיק מידע.
217s document: אין ברשותי מספיק מידע.
218s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


219s document: אין ברשותי מספיק מידע.
220s document: אין ברשותי מספיק מידע.
221s document: לא
222s document: אין ברשותי מספיק מידע.
223s document: אין ברשותי מספיק מידע.
224s document: אין ברשותי מספיק מידע.
225s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


226s document: אין ברשותי מספיק מידע.
227s document: השאלה אינה ניתנת למענה מהקטעים שסופקו.
228s document: אין ברשותי מספיק מידע.
229s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


230s document: אין ברשותי מספיק מידע.
231s document: אין ברשותי מספיק מידע.
232s document: אין ברשותי מספיק מידע.
233s document: אין ברשותי מספיק מידע.
234s document: אין ברשותי מספיק מידע.
235s document: אין ברשותי מספיק מידע.
236s document: No document found
237s document: אין ברשותי מספיק מידע.
238s document: אין ברשותי מספיק מידע.
239s document: אין ברשותי מספיק מידע.
240s document: אין ברשותי מספיק מידע.
241s document: אין ברשותי מספיק מידע


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


242s document: אין ברשותי מספיק מידע.
243s document: No document found
244s document: אין ברשותי מספיק מידע
245s document: לא
246s document: אין ברשותי מספיק מידע.
247s document: אין ברשותי מספיק מידע
248s document: אין ברשותי מספיק מידע.
249s document: אין ברשותי מספיק מידע.
250s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


251s document: אין ברשותי מספיק מידע.
252s document: לא
253s document: אין ברשותי מספיק מידע.
254s document: אין ברשותי מספיק מידע.
255s document: לא
256s document: אין ברשותי מספיק מידע
257s document: לא
258s document: אין ברשותי מספיק מידע.
259s document: אין ברשותי מספיק מידע.
260s document: אין ברשותי מספיק מידע.
261s document: אין ברשותי מספיק מידע.
262s document: אין ברשותי מספיק מידע.
263s document: אין ברשותי מספיק מידע.
264s document: אין ברשותי מספיק מידע.
265s document: אין ברשותי מספיק מידע.
266s document: אין ברשותי מספיק מידע.
267s document: לא
268s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


269s document: אין ברשותי מספיק מידע.
270s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


271s document: כן
272s document: אין ברשותי מספיק מידע.
273s document: אין ברשותי מספיק מידע.
274s document: אין ברשותי מספיק מידע.
275s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.
Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 4.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


276s document: אין ברשותי מספיק מידע.
277s document: אין ברשותי מספיק מידע.
278s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


279s document: אין ברשותי מספיק מידע.
280s document: אין ברשותי מספיק מידע.
281s document: אין ברשותי מספיק מידע
282s document: אין ברשותי מספיק מידע.
283s document: אין ברשותי מספיק מידע.
284s document: אין ברשותי מספיק מידע.
285s document: אין ברשותי מספיק מידע.
286s document: אין ברשותי מספיק מידע.
287s document: אין ברשותי מספיק מידע.
288s document: לא
289s document: אין ברשותי מספיק מידע.
290s document: אין ברשותי מספיק מידע.
291s document: אין ברשותי מספיק מידע.
292s document: אין ברשותי מספיק מידע.
293s document: אין ברשותי מספיק מידע.
294s document: אין ברשותי מספיק מידע.
295s document: לא
296s document: No document found
297s document: אין ברשותי מספיק מידע.
298s document: No document found
299s document: אין ברשותי מספיק מידע.
300s document: אין ברשותי מספיק מידע.
301s document: אין ברשותי מספיק מידע.
302s document: לא
303s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


304s document: אין ברשותי מספיק מידע.
305s document: אין ברשותי מספיק מידע.
306s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


307s document: אין ברשותי מספיק מידע.
308s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


309s document: אין ברשותי מספיק מידע.
310s document: אין ברשותי מספיק מידע.
311s document: אין ברשותי מספיק מידע.
312s document: No document found
313s document: אין ברשותי מספיק מידע.
314s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
315s document: אין ברשותי מספיק מידע.
316s document: אין ברשותי מספיק מידע.
317s document: אין ברשותי מספיק מידע.
318s document: אין ברשותי מספיק מידע.
319s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


320s document: אין ברשותי מספיק מידע.
321s document: No document found
322s document: אין ברשותי מספיק מידע.
323s document: אין ברשותי מספיק מידע.
324s document: אין ברשותי מספיק מידע.
325s document: אין ברשותי מספיק מידע.
326s document: אין ברשותי מספיק מידע.
327s document: אין ברשותי מספיק מידע.
328s document: אין ברשותי מספיק מידע.
329s document: לא
330s document: אין ברשותי מספיק מידע.
331s document: אין ברשותי מספיק מידע
332s document: אין ברשותי מספיק מידע.
333s document: אין ברשותי מספיק מידע.
334s document: No document found
335s document: No document found
336s document: אין ברשותי מספיק מידע.
337s document: אין ברשותי מספיק מידע.
338s document: לא
339s document: לא
340s document: אין ברשותי מספיק מידע.
341s document: אין ברשותי מספיק מידע.
342s document: אין ברשותי מספיק מידע.
343s document: אין ברשותי מספיק מידע כדי לענות על שאלתך. המסמך לא מציין את שם הרחוב של הבנייה המתוכננת.
344s document: לא
345s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


346s document: אין ברשותי מספיק מידע.
347s document: No document found
348s document: אין ברשותי מספיק מידע.
349s document: No document found
350s document: אין ברשותי מספיק מידע.
351s document: אין ברשותי מספיק מידע.
352s document: אין ברשותי מספיק מידע.
353s document: No document found
354s document: No document found
355s document: No document found
356s document: No document found
357s document: No document found
358s document: No document found
359s document: No document found
360s document: No document found
361s document: No document found
362s document: No document found
363s document: No document found
364s document: No document found
365s document: No document found
366s document: No document found
367s document: No document found
368s document: No document found
369s document: No document found
370s document: No document found
371s document: No document found
372s document: No document found
373s document: No document found
374s document: No document found
375s document: No 

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


389s document: אין ברשותי מספיק מידע.
390s document: אין ברשותי מספיק מידע.
391s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


392s document: כן
393s document: אין ברשותי מספיק מידע.
394s document: אין ברשותי מספיק מידע
395s document: אין ברשותי מספיק מידע.
396s document: אין ברשותי מספיק מידע.
397s document: אין ברשותי מספיק מידע.
398s document: אין ברשותי מספיק מידע.
399s document: אין ברשותי מספיק מידע.
400s document: אין ברשותי מספיק מידע.
401s document: אין ברשותי מספיק מידע.
402s document: אין ברשותי מספיק מידע.
403s document: No document found
404s document: No document found
405s document: No document found
406s document: No document found
407s document: No document found
408s document: No document found
409s document: No document found
410s document: No document found
411s document: No document found
412s document: No document found
413s document: No document found
414s document: No document found
415s document: No document found
416s document: No document found
417s document: No document found
418s document: No document found
419s document: No document found
420s document: אין ברשותי מספיק מידע.
421s

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


438s document: אין ברשותי מספיק מידע.
439s document: לא
440s document: אין ברשותי מספיק מידע
441s document: אין ברשותי מספיק מידע.
442s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


443s document: אין ברשותי מספיק מידע.
444s document: אין ברשותי מספיק מידע.
445s document: אין ברשותי מספיק מידע.
446s document: אין ברשותי מספיק מידע.
447s document: אין ברשותי מספיק מידע.
448s document: אין ברשותי מספיק מידע.
449s document: לא
450s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


451s document: לא
452s document: אין ברשותי מספיק מידע.
453s document: לא


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


454s document: אין ברשותי מספיק מידע.
455s document: אין ברשותי מספיק מידע.
456s document: אין ברשותי מספיק מידע.
457s document: אין ברשותי מספיק מידע.
458s document: אין ברשותי מספיק מידע.
459s document: אין ברשותי מספיק מידע.
460s document: אין ברשותי מספיק מידע.
461s document: אין ברשותי מספיק מידע.
462s document: אין ברשותי מספיק מידע.
463s document: אין ברשותי מספיק מידע.
464s document: אין ברשותי מספיק מידע.
465s document: אין ברשותי מספיק מידע.
466s document: כן
467s document: אין ברשותי מספיק מידע.
468s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
469s document: כן


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


470s document: אין ברשותי מספיק מידע.
471s document: אין ברשותי מספיק מידע.
472s document: אין ברשותי מספיק מידע.
473s document: No document found
474s document: No document found
475s document: No document found
476s document: No document found
477s document: No document found
478s document: No document found
479s document: No document found
480s document: No document found
481s document: No document found
482s document: No document found
483s document: No document found
484s document: No document found
485s document: No document found
486s document: No document found
487s document: No document found
488s document: No document found
489s document: No document found
490s document: אין ברשותי מספיק מידע.
491s document: אין ברשותי מספיק מידע.
492s document: אין ברשותי מספיק מידע.
493s document: אין ברשותי מספיק מידע.
494s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


495s document: אין ברשותי מספיק מידע.
496s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


497s document: אין ברשותי מספיק מידע.
498s document: אין ברשותי מספיק מידע.
499s document: אין ברשותי מספיק מידע.
500s document: אין ברשותי מספיק מידע.
501s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


502s document: אין ברשותי מספיק מידע.
503s document: אין ברשותי מספיק מידע.
504s document: לא
505s document: אין ברשותי מספיק מידע.
506s document: No document found
507s document: אין ברשותי מספיק מידע.
508s document: אין ברשותי מספיק מידע.
509s document: No document found
510s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
511s document: אין ברשותי מספיק מידע.
512s document: No document found
513s document: אין ברשותי מספיק מידע.
514s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


515s document: אין ברשותי מספיק מידע.
516s document: אין ברשותי מספיק מידע.
517s document: אין ברשותי מספיק מידע.
518s document: אין ברשותי מספיק מידע.
519s document: אין ברשותי מספיק מידע.
520s document: אין ברשותי מספיק מידע
521s document: אין ברשותי מספיק מידע.
522s document: לא
523s document: אין ברשותי מספיק מידע.
524s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


525s document: אין ברשותי מספיק מידע.
526s document: אין ברשותי מספיק מידע.
527s document: אין ברשותי מספיק מידע.
528s document: No document found
529s document: אין ברשותי מספיק מידע.
530s document: אין ברשותי מספיק מידע
531s document: אין ברשותי מספיק מידע.
532s document: אין ברשותי מספיק מידע.
533s document: אין ברשותי מספיק מידע.
534s document: אין ברשותי מספיק מידע.
535s document: אין ברשותי מספיק מידע.
536s document: אין ברשותי מספיק מידע.
537s document: לא
538s document: אין ברשותי מספיק מידע. הקטעים שסופקו מתייחסים לשינוי קווי בניין ברחוב עוזיאל, אך אינם מציינים את כתובת הבנייה המתוכננת.
539s document: אין ברשותי מספיק מידע
540s document: אין ברשותי מספיק מידע כדי לענות על השאלה.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


541s document: אין ברשותי מספיק מידע.
542s document: אין ברשותי מספיק מידע


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


543s document: אין ברשותי מספיק מידע.
544s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


545s document: אין ברשותי מספיק מידע.
546s document: אין ברשותי מספיק מידע.


In [10]:
df[df['answer']=='כן']

Unnamed: 0,pl_number,answer,chunks
31,101-0252619,כן,"[- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכני..."
133,101-0339010,כן,[יעודי קרקע ושימושים 4.\n מגורים ומסחר 4.1\nשי...
180,101-0345298,כן,"[תנאים למתן היתרי בניה 6.9\n('מרתפי חניה, מתקנ..."
271,101-0917013,כן,"[- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכני..."
392,101-0977165,כן,[דרך מוצעת 4.2\n \n1 .. תוואי הדרכים רוחבן ו...
424,101-1194000,כן,[יעודי קרקע ושימושים 4.\n מגורים4.1\nשימושים4....
429,101-0845842,כן,"[- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכני..."
466,101-1072545,כן,"[- חוק התכנון והבניה, התשכ""ה1965\nהוראות התכני..."
469,101-1059435,כן,[דרך מוצעת 4.2\nשימושים4.2.1\n - דרך כהגדרתה ב...


In [11]:
if os.path.exists("result_n5_k0_gemini_binary.csv"):
    df = pd.read_csv("result_n5_k0_gemini_binary.csv")
else:
    llm = get_gemini_llm(rate_limit=True)
    question = "האם הבניה המתוכננת היא ברחוב אורוגוואי?"
    result = get_answer_foreach_doc(question, db, data, num_docs=5, num_rephrasings=0, model=llm, verbose=True, multiprocess=False)

    # save the result
    df = pd.DataFrame(result)
    df.to_csv('result_n5_k0_gemini_binary.csv', index=False)

['האם הבניה המתוכננת היא ברחוב אורוגוואי?']
0s document: אין ברשותי מספיק מידע.
1s document: No document found
2s document: אין ברשותי מספיק מידע.
3s document: אין ברשותי מספיק מידע.
4s document: No document found
5s document: אין ברשותי מספיק מידע.
6s document: אין ברשותי מספיק מידע.
7s document: No document found
8s document: אין ברשותי מספיק מידע.
9s document: No document found
10s document: No document found
11s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


12s document: אין ברשותי מספיק מידע.
13s document: אין ברשותי מספיק מידע.
14s document: No document found
15s document: No document found
16s document: No document found
17s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


18s document: אין ברשותי מספיק מידע.
19s document: אין ברשותי מספיק מידע.
20s document: No document found
21s document: No document found
22s document: אין ברשותי מספיק מידע.
23s document: No document found
24s document: אין ברשותי מספיק מידע.
25s document: No document found
26s document: No document found
27s document: אין ברשותי מספיק מידע.
28s document: No document found
29s document: No document found
30s document: No document found
31s document: כן
32s document: No document found
33s document: No document found
34s document: No document found
35s document: אין ברשותי מספיק מידע.
36s document: אין ברשותי מספיק מידע.
37s document: No document found
38s document: No document found
39s document: No document found
40s document: No document found
41s document: No document found
42s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


43s document: אין ברשותי מספיק מידע. המסמכים לא מתייחסים לרחוב אורוגוואי.
44s document: אין ברשותי מספיק מידע.
45s document: אין ברשותי מספיק מידע.
46s document: No document found
47s document: No document found
48s document: אין ברשותי מספיק מידע.
49s document: לא
50s document: No document found
51s document: אין ברשותי מספיק מידע.
52s document: אין ברשותי מספיק מידע.
53s document: No document found
54s document: אין ברשותי מספיק מידע.
55s document: No document found
56s document: No document found
57s document: No document found
58s document: אין ברשותי מספיק מידע.
59s document: No document found
60s document: אין ברשותי מספיק מידע.
61s document: No document found
62s document: No document found
63s document: No document found
64s document: No document found
65s document: No document found
66s document: No document found
67s document: No document found
68s document: No document found
69s document: אין ברשותי מספיק מידע.
70s document: אין ברשותי מספיק מידע.
71s document: No document f

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


129s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
130s document: אין ברשותי מספיק מידע.
131s document: אין ברשותי מספיק מידע.
132s document: אין ברשותי מספיק מידע.
133s document: כן


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


134s document: אין ברשותי מספיק מידע.
135s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


136s document: לא
137s document: אין ברשותי מספיק מידע.
138s document: אין ברשותי מספיק מידע.
139s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


140s document: אין ברשותי מספיק מידע.
141s document: אין ברשותי מספיק מידע.
142s document: אין ברשותי מספיק מידע.
143s document: אין ברשותי מספיק מידע.
144s document: אין ברשותי מספיק מידע.
145s document: אין ברשותי מספיק מידע.
146s document: אין ברשותי מספיק מידע.
147s document:  אין ברשותי מספיק מידע.
148s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
149s document: אין ברשותי מספיק מידע.
150s document: לא
151s document: אין ברשותי מספיק מידע.
152s document: אין ברשותי מספיק מידע.
153s document: אין ברשותי מספיק מידע.
154s document: אין ברשותי מספיק מידע.
155s document: אין ברשותי מספיק מידע.
156s document: No document found


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


157s document: אין ברשותי מספיק מידע.
158s document: אין ברשותי מספיק מידע.
159s document: No document found
160s document: לא
161s document: אין ברשותי מספיק מידע.
162s document: אין ברשותי מספיק מידע.
163s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


164s document: אין ברשותי מספיק מידע.
165s document: אין ברשותי מספיק מידע.
166s document: אין ברשותי מספיק מידע.
167s document: לא
168s document: אין ברשותי מספיק מידע.
169s document: אין ברשותי מספיק מידע.
170s document: אין ברשותי מספיק מידע.
171s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


172s document: אין ברשותי מספיק מידע.
173s document: אין ברשותי מספיק מידע.
174s document: אין ברשותי מספיק מידע.
175s document: אין ברשותי מספיק מידע.
176s document: אין ברשותי מספיק מידע.
177s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
178s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
179s document: אין ברשותי מספיק מידע.
180s document: כן
181s document: אין ברשותי מספיק מידע.
182s document: אין ברשותי מספיק מידע.
183s document: אין ברשותי מספיק מידע.
184s document: No document found
185s document: No document found
186s document: אין ברשותי מספיק מידע. המסמך מתייחס למגרש מסחרי במורדות מלחה, ירושלים, אך אינו מציין את שם הרחוב שבו ממוקם המגרש.
187s document: אין ברשותי מספיק מידע.
188s document: אין ברשותי מספיק מידע.
189s document: אין ברשותי מספיק מידע.
190s document: אין ברשותי מספיק מידע.
191s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


192s document: אין ברשותי מספיק מידע.
193s document: אין ברשותי מספיק מידע.
194s document: אין ברשותי מספיק מידע.
195s document: אין ברשותי מספיק מידע.
196s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
197s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
198s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
199s document: אין ברשותי מספיק מידע.
200s document: אין ברשותי מספיק מידע.
201s document: אין ברשותי מספיק מידע.
202s document: אין ברשותי מספיק מידע.
203s document: אין ברשותי מספיק מידע
204s document: אין ברשותי מספיק מידע.
205s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


206s document: אין ברשותי מספיק מידע.
207s document: אין ברשותי מספיק מידע.
208s document: לא
209s document: אין ברשותי מספיק מידע.
210s document: אין ברשותי מספיק מידע.
211s document: אין ברשותי מספיק מידע.
212s document: אין ברשותי מספיק מידע.
213s document: אין ברשותי מספיק מידע.
214s document: אין ברשותי מספיק מידע.
215s document: אין ברשותי מספיק מידע.
216s document: אין ברשותי מספיק מידע.
217s document: אין ברשותי מספיק מידע.
218s document: אין ברשותי מספיק מידע.
219s document: לא
220s document: אין ברשותי מספיק מידע.
221s document: לא
222s document: אין ברשותי מספיק מידע.
223s document: אין ברשותי מספיק מידע.
224s document: אין ברשותי מספיק מידע.
225s document: No document found
226s document: אין ברשותי מספיק מידע.
227s document: אין ברשותי מספיק מידע
228s document: אין ברשותי מספיק מידע כדי לענות על השאלה. המסמך עוסק בתוכנית בניה ברחוב בורוכוב 3, אך אינו מזכיר את רחוב אורוגוואי.
229s document: אין ברשותי מספיק מידע.
230s document: אין ברשותי מספיק מידע.
231s document: אין ברשו

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


246s document: לא
247s document: אין ברשותי מספיק מידע.
248s document: אין ברשותי מספיק מידע.
249s document: אין ברשותי מספיק מידע.
250s document: לא
251s document: אין ברשותי מספיק מידע.
252s document: לא
253s document: אין ברשותי מספיק מידע.
254s document: לא
255s document: אין ברשותי מספיק מידע.
256s document: אין ברשותי מספיק מידע.
257s document: לא
258s document: אין ברשותי מספיק מידע.
259s document: אין ברשותי מספיק מידע.
260s document: אין ברשותי מספיק מידע.
261s document: אין ברשותי מספיק מידע.
262s document: לא
263s document: אין ברשותי מספיק מידע.
264s document: אין ברשותי מספיק מידע.
265s document: אין ברשותי מספיק מידע.
266s document: אין ברשותי מספיק מידע כדי לקבוע אם הבניה המתוכננת היא ברחוב אורוגוואי.
267s document: לא


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


268s document: אין ברשותי מספיק מידע.
269s document: אין ברשותי מספיק מידע.
270s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


271s document: כן
272s document: אין ברשותי מספיק מידע.
273s document: אין ברשותי מספיק מידע.
274s document: אין ברשותי מספיק מידע.
275s document: אין ברשותי מספיק מידע.
276s document: אין ברשותי מספיק מידע.
277s document: אין ברשותי מספיק מידע.
278s document: No document found
279s document: אין ברשותי מספיק מידע.
280s document: אין ברשותי מספיק מידע.
281s document: אין ברשותי מספיק מידע.
282s document: אין ברשותי מספיק מידע.
283s document: אין ברשותי מספיק מידע.
284s document: אין ברשותי מספיק מידע.
285s document: אין ברשותי מספיק מידע.
286s document: אין ברשותי מספיק מידע.
287s document: אין ברשותי מספיק מידע כדי לקבוע האם הבניה המתוכננת היא ברחוב אורוגוואי.
288s document: לא
289s document: אין ברשותי מספיק מידע.
290s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
291s document: אין ברשותי מספיק מידע.
292s document: אין ברשותי מספיק מידע.
293s document: אין ברשותי מספיק מידע.
294s document: אין ברשותי מספיק מידע.
295s document: אין ברשותי מספיק מידע.
296s document: No document 

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


297s document: אין ברשותי מספיק מידע.
298s document: No document found
299s document: אין ברשותי מספיק מידע.
300s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
301s document: אין ברשותי מספיק מידע.
302s document: אין ברשותי מספיק מידע.
303s document: אין ברשותי מספיק מידע.
304s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
305s document: אין ברשותי מספיק מידע.
306s document: אין ברשותי מספיק מידע.
307s document: אין ברשותי מספיק מידע.
308s document: No document found
309s document: אין ברשותי מספיק מידע.
310s document: אין ברשותי מספיק מידע.
311s document: אין ברשותי מספיק מידע.
312s document: No document found
313s document: לא
314s document: אין ברשותי מספיק מידע.
315s document: אין ברשותי מספיק מידע.
316s document: אין ברשותי מספיק מידע.
317s document: אין ברשותי מספיק מידע.
318s document: אין ברשותי מספיק מידע.
319s document: אין ברשותי מספיק מידע.
320s document: אין ברשותי מספיק מידע.
321s document: No document found
322s document: אין ברשותי מספיק מידע.
323s document:

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.
Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 4.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


352s document: אין ברשותי מספיק מידע.
353s document: No document found
354s document: No document found
355s document: No document found
356s document: No document found
357s document: No document found
358s document: No document found
359s document: No document found
360s document: No document found
361s document: No document found
362s document: No document found
363s document: No document found
364s document: No document found
365s document: No document found
366s document: No document found
367s document: No document found
368s document: No document found
369s document: No document found
370s document: No document found
371s document: No document found
372s document: No document found
373s document: No document found
374s document: No document found
375s document: No document found
376s document: No document found
377s document: No document found
378s document: No document found
379s document: No document found
380s document: No document found
381s document: No document found
382s 

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


425s document: אין ברשותי מספיק מידע.
426s document: אין ברשותי מספיק מידע.
427s document: אין ברשותי מספיק מידע.
428s document: לא
429s document: כן
430s document: אין ברשותי מספיק מידע.
431s document: אין ברשותי מספיק מידע.
432s document: No document found
433s document: אין ברשותי מספיק מידע
434s document: אין ברשותי מספיק מידע.
435s document: אין ברשותי מספיק מידע.
436s document: אין ברשותי מספיק מידע.
437s document: אין ברשותי מספיק מידע.
438s document: אין ברשותי מספיק מידע.
439s document: אין ברשותי מספיק מידע.
440s document: אין ברשותי מספיק מידע.
441s document: אין ברשותי מספיק מידע.
442s document: אין ברשותי מספיק מידע.
443s document: אין ברשותי מספיק מידע.
444s document: אין ברשותי מספיק מידע.
445s document: אין ברשותי מספיק מידע.
446s document: אין ברשותי מספיק מידע.
447s document: אין ברשותי מספיק מידע.
448s document: אין ברשותי מספיק מידע.
449s document: לא
450s document: No document found
451s document: לא
452s document: אין ברשותי מספיק מידע.
453s document: לא
454s docu

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


519s document: לא
520s document: אין ברשותי מספיק מידע
521s document: אין ברשותי מספיק מידע.
522s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
523s document: אין ברשותי מספיק מידע.
524s document: אין ברשותי מספיק מידע.
525s document: לא
526s document: אין ברשותי מספיק מידע.
527s document: אין ברשותי מספיק מידע.
528s document: No document found
529s document: אין ברשותי מספיק מידע.
530s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


531s document: אין ברשותי מספיק מידע.
532s document: אין ברשותי מספיק מידע.
533s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
534s document: אין ברשותי מספיק מידע.
535s document: אין ברשותי מספיק מידע.
536s document: אין ברשותי מספיק מידע.
537s document: אין ברשותי מספיק מידע.
538s document: לא
539s document: אין ברשותי מספיק מידע כדי לענות על השאלה.
540s document: אין ברשותי מספיק מידע.
541s document: אין ברשותי מספיק מידע
542s document: אין ברשותי מספיק מידע.
543s document: אין ברשותי מספיק מידע.
544s document: אין ברשותי מספיק מידע.
545s document: אין ברשותי מספיק מידע.


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised DeadlineExceeded: 504 Deadline Exceeded.


546s document: לא


In [1]:
import pandas as pd
from file_utils import get_docs_for_plan, pdf_to_text, clean_and_split,sentencewise_translate, temp_get_docs_for_plan, clean_text
data = pd.read_csv('shpan.csv')
pl_nums = data['pl_number'].sort_values().unique()
files_text = {pl_num:"\n".join([clean_text(pdf_to_text(doc)) for doc in temp_get_docs_for_plan(pl_num)]) for pl_num in pl_nums}


In [4]:
filtered_docs = [id for id, txt in files_text.items() if len(txt.strip()) > 0]
len(filtered_docs)

379