In [1]:
# Import required modules
# استيراد الوحدات المطلوبة
import sys
sys.path.append('src')

from src.server_manager import ServerManager
from src.data_manager import DataManager
from src.hadith_crawler import HadithCrawler

## Initialize Components
## تهيئة المكونات

First, we need to initialize our components with the appropriate configuration.
- Server Manager: Needs the path to the API server
- Data Manager: Needs the directory for storing data
- Hadith Crawler: Combines both managers and adds crawling configuration

أولاً، نحتاج إلى تهيئة مكوناتنا مع الإعدادات المناسبة.
- مدير الخادم: يحتاج إلى مسار خادم API
- مدير البيانات: يحتاج إلى مجلد لتخزين البيانات
- زاحف الأحاديث: يجمع بين المديرين ويضيف إعدادات الزحف

In [2]:
# Initialize server manager
# تهيئة مدير الخادم
server_manager = ServerManager(
    server_path="dorar-hadith-api",  # Path to the API server
    port=5000  # Default port
)

# Initialize data manager
# تهيئة مدير البيانات
data_manager = DataManager(
    data_dir="."  # Current directory for data files
)

# Initialize hadith crawler
# تهيئة زاحف الأحاديث
crawler = HadithCrawler(
    server_manager=server_manager,
    data_manager=data_manager,
    max_id=88430,  # Maximum hadith ID to process
    batch_size=70  # Number of requests before server restart
)

## Start Crawling Process
## بدء عملية الزحف

Now we can start the crawling process. The crawler will:
- Automatically manage the server
- Save progress regularly
- Handle errors and retries
- Show progress with a progress bar

الآن يمكننا بدء عملية الزحف. سيقوم الزاحف بـ:
- إدارة الخادم تلقائياً
- حفظ التقدم بشكل منتظم
- معالجة الأخطاء والمحاولات
- عرض التقدم مع شريط التقدم

In [4]:
try:
    # Start crawling
    # بدء الزحف
    crawler.crawl_hadith_explanations()
except KeyboardInterrupt:
    print("\n\n⚠️ Program stopped manually.")
    print("⚠️ تم إيقاف البرنامج يدوياً.")
    print("\n✓ Data has already been saved automatically.")
    print("✓ تم حفظ البيانات تلقائياً.")
    print(f"\n✅ Last processed hadith ID: {data_manager.load_last_id()}")
    print(f"✅ آخر معرف حديث تمت معالجته: {data_manager.load_last_id()}")
    print(f"\n✅ Number of saved explanations: {len(data_manager.load_existing_data())}")
    print(f"✅ عدد الشروحات المحفوظة: {len(data_manager.load_existing_data())}")

Starting process from hadith ID: 866
Number of previously saved explanations: 0
Number of recorded successful hadiths: 0


Processing hadiths:   0%|          | 11/87565 [00:03<8:20:36,  2.91it/s, Found=0, Skipped=0, Failed=11, Current=876]



⚠️ Program stopped manually.
⚠️ تم إيقاف البرنامج يدوياً.

✓ Data has already been saved automatically.
✓ تم حفظ البيانات تلقائياً.

✅ Last processed hadith ID: 865
✅ آخر معرف حديث تمت معالجته: 865

✅ Number of saved explanations: 0
✅ عدد الشروحات المحفوظة: 0



