In [5]:
import os
from gdrive import GoogleDriveDownloader as gdd

# Define the directories and Google Drive file IDs
SAMPLE_DIRECTORY = r'data\processed\all_split.pkl'
PERSIST_DIRECTORY = r'data\processed\vector_db'

# Replace these with the actual file IDs from Google Drive
SAMPLE_FILE_ID = r'https://drive.google.com/drive/folders/16sTPt066YDV22P55rh3awt2jQWZiOHLD?usp=sharing'
PERSIST_FILE_ID = r'https://drive.google.com/file/d/1Og61VJzOMM8AJbhlsymWfJa3B9xxY-fW/view?usp=sharing'

# Function to download a file if it doesn't exist
def download_file(file_id, destination):
    if not os.path.exists(destination):
        os.makedirs(os.path.dirname(destination), exist_ok=True)
        print(f"Downloading {destination} from Google Drive...")
        gdd.download_file_from_google_drive(file_id=file_id, dest_path=destination, unzip=False)
    else:
        print(f"{destination} already exists.")

# Check if SAMPLE_DIRECTORY exists and download if not
if not os.path.exists(SAMPLE_DIRECTORY):
    print(f"{SAMPLE_DIRECTORY} does not exist.")
    download_file(SAMPLE_FILE_ID, SAMPLE_DIRECTORY)
else:
    print(f"{SAMPLE_DIRECTORY} exists.")

# Check if PERSIST_DIRECTORY exists and create it if not
if not os.path.exists(PERSIST_DIRECTORY):
    print(f"{PERSIST_DIRECTORY} does not exist. Creating it now...")
    os.makedirs(PERSIST_DIRECTORY, exist_ok=True)
else:
    print(f"{PERSIST_DIRECTORY} exists.")


data\processed\all_split.pkl exists.
data\processed\vector_db exists.


In [1]:
# app.py

from models.predict_model import  Predict
import os

google_api_key = os.getenv('GOOGLE_API_KEY')

if not google_api_key:
    raise ValueError("Did not find google_api_key, please add an environment variable `GOOGLE_API_KEY` which contains it, or pass `google_api_key` as a named parameter.")


# Initialize the RAG model
predict = Predict(google_api_key)



  from tqdm.autonotebook import tqdm, trange


In [2]:
predict.get_chunk_by_index(35000)

Document(metadata={'source': 'Sports\\2500.txt'}, page_content='هولندا تسحق إيطاليا بثلاثية وتوجه رسالة شديدة اللهجةلقن المنتخب الهولندي نظيره الايطالي بطل العالم درسا في فنون اللعبة عندما سحقه بثلاثية نظيفة على ملعب ستاد دو سويس في بيرن في الجولة الاولى من منافسات المجموعة الثالثة ضمن نهائيات كأس اوروبا 2008 لكرة وسجل رود فان نيستلروي (26) وويسلي شنايدر (31) وجيوفاني فان برونكهورست (79) الاهداف.واستحق المنتخب الهولندي الفوز لأنه كان الافضل طيلة المباراة وقدم عرضا رائعا اكد من خلاله سعيه لإحراز اللقب الثاني في البطولة القارية بعد الاول عام 1988 بقيادة الثلاثي الذهبي فرانك رايكارد ورود خوليت وماركو فان باستن مدرب المنتخب البرتقالي حاليا.وهو الفوز الاول لهولندا على ايطاليا منذ 30 عاما وتحديدا منذ تغلبها عليها 2-1 في كأس العالم عام ،1978 وثأرت بالتالي لخروجها من دور الاربعة لبطولة كأس اوروبا لعام 2000 على يد ايطاليا بركلات الترجيح.كما هو الفوز الثالث لهولندا على ايطاليا مقابل 7 هزائم و6 تعادلات. وكانت المباراة هي الرسمية الاولى بين المنتخبين منذ عام 2000 والثالثة في المسابقة القارية بعد ا

In [3]:
question = 'من هو المدير الفني لبايرن ميونيخ حامل لقب الدوري الألماني لكرة القدم'

predict.test_retriever(question)


[Document(metadata={'source': 'Sports\\5657.txt'}, page_content='يلتقي غامبا اوساكا مع اوراوا رد دايموندز حامل اللقب في قمة يابانية اليوم الاربعاء في ذهاب نصف نهائي دوري ابطال آسيا لكرة القدم.ويلعب في مباراة ذهاب نصف النهائي الثانية اديلاييد يونايتد الاسترالي مع بونيودكور الاوزبكستاني.وكان الدور نصف النهائي للبطولة خلا من الفرق العربية بعد خروج آخر ممثلين لها وهما القادسية الكويتي والكرامة السوري امام اوراوا وغامبا اوساكا بالتحديد على التوالي.'),
 Document(metadata={'source': 'Sports\\1614.txt'}, page_content='يسعى كل من نابولي الإيطالي وبوروسيا دورتموند الألماني إلى حجز بطاقته إلى الدور الثاني من مسابقة الدوري الأوروبي (يوروبا ليغ) لكرة القدم اليوم الخميس في الجولة الرابعة. ويستضيف نابولي ميدتيلاند الدنماركي في المجموعة الرابعة ويطمح دورتموند لتحقيق الهدف ذاته امام غابالا الأذربيجاني. ويبحث ليفربول بقيادة مدربه الجديدالألماني يورغن كلوب عن الفوز أمام روبين كازان الروسي، ويلتقي في المجموعة ذاتها سيون السويسري مع بوردو الفرنسي.'),
 Document(metadata={'source': 'Sports\\3815.txt'}, page_

In [4]:

print(predict.get_answer( question))

Generating answer...
Answer generated:
مدير الفني لبايرن ميونيخ حامل لقب الدوري الألماني لكرة القدم هو يوب هاينكس. 

هل لديك أسئلة أخرى؟ 

