In [28]:
# استيراد جميع المكتبات اللازمة
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_california_housing
import ipywidgets as widgets
from IPython.display import display, clear_output
import warnings
warnings.filterwarnings('ignore')

# تهيئة الرسوم البيانية
%matplotlib inline
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['axes.grid'] = True
plt.rcParams['grid.alpha'] = 0.3

print("✅ تم استيراد جميع المكتبات بنجاح")

✅ تم استيراد جميع المكتبات بنجاح


In [29]:
# تحميل بيانات كاليفورنيا للإسكان
data = fetch_california_housing()
df = pd.DataFrame(data.data, columns=data.feature_names)

# تعديل البيانات حسب المتطلبات الجديدة
# 1. تحويل الأسعار إلى نطاق 1000-100000
df['Price'] = data.target
price_min_original = df['Price'].min()
price_max_original = df['Price'].max()

# تحويل النطاق من [min, max] إلى [1000, 100000]
df['Price_Dollars'] = 1000 + (df['Price'] - price_min_original) * (100000 - 1000) / (price_max_original - price_min_original)

# 2. تحويل الأعمدة إلى أعداد صحيحة
df['AveRooms'] = df['AveRooms'].round().astype(int)  # عدد الغرف (رقم صحيح)
df['AveBedrms'] = df['AveBedrms'].round().astype(int)  # عدد غرف النوم (رقم صحيح)
df['AveOccup'] = df['AveOccup'].round().astype(int)  # متوسط الأفراد لكل منزل (رقم صحيح)
df['HouseAge'] = df['HouseAge'].round().astype(int)  # عمر المنزل (رقم صحيح)
df['Population'] = df['Population'].round().astype(int)  # عدد السكان (رقم صحيح)

# عرض معلومات عن البيانات المعدلة
print("🔍 شكل البيانات:", df.shape)
print(f"\n💰 نطاق الأسعار الجديد: ${df['Price_Dollars'].min():,.0f} - ${df['Price_Dollars'].max():,.0f}")

print("\n📊 عينة من البيانات المعدلة:")
print(df[['AveRooms', 'AveBedrms', 'AveOccup', 'HouseAge', 'Price_Dollars']].head())

print("\n📈 الإحصاءات الوصفية للبيانات المعدلة:")
print(df[['AveRooms', 'AveBedrms', 'AveOccup', 'HouseAge', 'Price_Dollars']].describe())

🔍 شكل البيانات: (20640, 10)

💰 نطاق الأسعار الجديد: $1,000 - $100,000

📊 عينة من البيانات المعدلة:
   AveRooms  AveBedrms  AveOccup  HouseAge  Price_Dollars
0         7          1         3        41   90324.371858
1         6          1         2        21   71116.409829
2         8          1         3        52   69810.023464
3         6          1         3        52   67605.496472
4         6          1         2        52   67789.207055

📈 الإحصاءات الوصفية للبيانات المعدلة:
           AveRooms     AveBedrms      AveOccup      HouseAge  Price_Dollars
count  20640.000000  20640.000000  20640.000000  20640.000000   20640.000000
mean       5.424806      1.045203      3.075727     28.639486   40162.364019
std        2.491940      0.474395     10.387242     12.585558   23554.884251
min        1.000000      0.000000      1.000000      1.000000    1000.000000
25%        4.000000      1.000000      2.000000     18.000000   22351.456283
50%        5.000000      1.000000      3.000000     

In [30]:
# إنشاء واجهة لإدخال السعر مع النطاق الجديد
price_slider = widgets.IntSlider(
    value=50000,
    min=1000,
    max=100000,
    step=1000,
    description='السعر المطلوب ($):',
    continuous_update=False,
    readout_format='d'
)

tolerance_slider = widgets.FloatSlider(
    value=0.1,
    min=0.05,
    max=0.3,
    step=0.05,
    description='نسبة التفاوت:',
    continuous_update=False,
    readout_format='.0%'
)

num_results_slider = widgets.IntSlider(
    value=5,
    min=1,
    max=20,
    step=1,
    description='عدد النتائج:',
    continuous_update=False
)

search_button = widgets.Button(description="ابحث عن منازل", button_style='success')
output = widgets.Output()

print("🏠 أدخل السعر المطلوب للبحث عن المنازل المناسبة:")
print("💰 نطاق الأسعار المتاح: 1,000$ إلى 100,000$")
display(price_slider)
display(tolerance_slider)
display(num_results_slider)
display(search_button)
display(output)

🏠 أدخل السعر المطلوب للبحث عن المنازل المناسبة:
💰 نطاق الأسعار المتاح: 1,000$ إلى 100,000$


IntSlider(value=50000, continuous_update=False, description='السعر المطلوب ($):', max=100000, min=1000, step=1…

FloatSlider(value=0.1, continuous_update=False, description='نسبة التفاوت:', max=0.3, min=0.05, readout_format…

IntSlider(value=5, continuous_update=False, description='عدد النتائج:', max=20, min=1)

Button(button_style='success', description='ابحث عن منازل', style=ButtonStyle())

Output()

In [31]:
# تعريف دالة البحث
def on_search_button_clicked(b):
    with output:
        clear_output()

        # الحصول على قيم الإدخال
        target_price = price_slider.value
        tolerance = tolerance_slider.value
        num_results = num_results_slider.value

        # حساب نطاق الأسعار المقبول
        lower_bound = target_price * (1 - tolerance)
        upper_bound = target_price * (1 + tolerance)

        # البحث عن المنازل في النطاق السعري
        filtered_houses = df[
            (df['Price_Dollars'] >= lower_bound) &
            (df['Price_Dollars'] <= upper_bound)
        ].copy()

        # إذا لم نجد نتائج، نبحث عن الأقرب
        if len(filtered_houses) == 0:
            print("⚠️ لم يتم العثور على منازل في النطاق السعري المحدد.")
            print("🔍 نبحث عن المنازل الأقرب للسعر المطلوب...")

            # حساب الفرق عن السعر المطلوب
            df['Price_Difference'] = abs(df['Price_Dollars'] - target_price)
            closest_houses = df.nsmallest(num_results, 'Price_Difference')

            display_results(closest_houses, target_price, False)
        else:
            # إذا وجدنا نتائج، نعرضها
            if len(filtered_houses) > num_results:
                filtered_houses = filtered_houses.sample(num_results)

            display_results(filtered_houses, target_price, True)

# دالة لعرض النتائج
def display_results(houses_df, target_price, in_range):
    if in_range:
        print(f"✅ تم العثور على {len(houses_df)} منزل في النطاق السعري المطلوب")
    else:
        print(f"🔍 هذه أقرب {len(houses_df)} منزل للسعر المطلوب")

    print(f"💰 السعر المطلوب: ${target_price:,.0f}")
    print("=" * 80)

    # عرض كل منزل مع تفاصيله
    for i, (idx, house) in enumerate(houses_df.iterrows()):
        print(f"\n🏠 المنزل #{i+1}:")
        print(f"   السعر: ${house['Price_Dollars']:,.0f}")
        print(f"   متوسط الدخل في المنطقة: {house['MedInc']:.2f}")
        print(f"   عمر المنزل: {house['HouseAge']:.0f} سنة")
        print(f"   عدد الغرف: {house['AveRooms']:.0f}")
        print(f"   عدد غرف النوم: {house['AveBedrms']:.0f}")
        print(f"   عدد السكان في المنطقة: {house['Population']:,.0f}")
        print(f"   متوسط الأفراد لكل منزل: {house['AveOccup']:.0f}")
        print(f"   الموقع: ({house['Latitude']:.2f}, {house['Longitude']:.2f})")
        print("-" * 40)

    # رسم بياني يوضح توزيع الأسعار
    plt.figure(figsize=(12, 6))

    # رسم توزيع جميع الأسعار
    plt.hist(df['Price_Dollars'], bins=50, alpha=0.7, label='جميع المنازل')

    # رسم خط للسعر المطلوب
    plt.axvline(x=target_price, color='red', linestyle='--', linewidth=2, label='السعر المطلوب')

    # رسم نطاق التفاوت
    plt.axvspan(target_price * (1 - tolerance_slider.value),
                target_price * (1 + tolerance_slider.value),
                alpha=0.3, color='green', label='نطاق البحث')

    # تحديد المنازل الموجودة في النتائج
    if len(houses_df) > 0:
        plt.scatter(houses_df['Price_Dollars'],
                   [100] * len(houses_df),  # وضع نقاط عند قيمة ثابتة على المحور y
                   color='red', s=50, zorder=5, label='النتائج')

    plt.xlabel('السعر ($)')
    plt.ylabel('عدد المنازل')
    plt.title('توزيع أسعار المنازل والنتائج')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.show()

    # رسم خريطة للمنازل الناتجة
    if len(houses_df) > 0:
        plt.figure(figsize=(10, 8))
        scatter = plt.scatter(houses_df['Longitude'], houses_df['Latitude'],
                             c=houses_df['Price_Dollars'], cmap='viridis',
                             s=houses_df['AveRooms']*20, alpha=0.7)
        plt.colorbar(scatter, label='السعر ($)')
        plt.xlabel('خط الطول')
        plt.ylabel('خط العرض')
        plt.title('الموقع الجغرافي للمنازل الناتجة')
        plt.grid(True, alpha=0.3)

        # إضافة annotations للأسعار
        for idx, row in houses_df.iterrows():
            plt.annotate(f"${row['Price_Dollars']:,.0f}",
                        (row['Longitude'], row['Latitude']),
                        xytext=(5, 5), textcoords='offset points',
                        fontsize=8, alpha=0.8)

        plt.show()

# ربط دالة البحث بالزر
search_button.on_click(on_search_button_clicked)

In [32]:
# إضافة خيارات تصفية إضافية
print("\n🎛️ خيارات تصفية إضافية (اختياري):")

# تصفية بعدد الغرف (قيم صحيحة الآن)
rooms_slider = widgets.IntSlider(
    value=int(df['AveRooms'].min()),
    min=int(df['AveRooms'].min()),
    max=int(df['AveRooms'].max()),
    step=1,
    description='الحد الأدنى للغرف:',
    continuous_update=False,
    disabled=True
)

rooms_toggle = widgets.Checkbox(
    value=False,
    description='تفعيل تصفية الغرف'
)

def on_rooms_toggle_change(change):
    rooms_slider.disabled = not change['new']

rooms_toggle.observe(on_rooms_toggle_change, names='value')

# تصفية بعدد غرف النوم (قيم صحيحة الآن)
bedrooms_slider = widgets.IntSlider(
    value=int(df['AveBedrms'].min()),
    min=int(df['AveBedrms'].min()),
    max=int(df['AveBedrms'].max()),
    step=1,
    description='الحد الأدنى لغرف النوم:',
    continuous_update=False,
    disabled=True
)

bedrooms_toggle = widgets.Checkbox(
    value=False,
    description='تفعيل تصفية غرف النوم'
)

def on_bedrooms_toggle_change(change):
    bedrooms_slider.disabled = not change['new']

bedrooms_toggle.observe(on_bedrooms_toggle_change, names='value')

# تصفية بعمر المنزل (قيم صحيحة الآن)
age_slider = widgets.IntSlider(
    value=int(df['HouseAge'].min()),
    min=int(df['HouseAge'].min()),
    max=int(df['HouseAge'].max()),
    step=1,
    description='الحد الأدنى للعمر:',
    continuous_update=False,
    disabled=True
)

age_toggle = widgets.Checkbox(
    value=False,
    description='تفعيل تصفية العمر'
)

def on_age_toggle_change(change):
    age_slider.disabled = not change['new']

age_toggle.observe(on_age_toggle_change, names='value')

display(widgets.HBox([rooms_toggle, rooms_slider]))
display(widgets.HBox([bedrooms_toggle, bedrooms_slider]))
display(widgets.HBox([age_toggle, age_slider]))

# تحديث دالة البحث لتشمل التصفية الإضافية
def on_search_button_clicked_enhanced(b):
    with output:
        clear_output()

        # الحصول على قيم الإدخال
        target_price = price_slider.value
        tolerance = tolerance_slider.value
        num_results = num_results_slider.value

        # تطبيق التصفية الأساسية بالسعر
        lower_bound = target_price * (1 - tolerance)
        upper_bound = target_price * (1 + tolerance)
        filtered_houses = df[
            (df['Price_Dollars'] >= lower_bound) &
            (df['Price_Dollars'] <= upper_bound)
        ].copy()

        # تطبيق التصفية الإضافية بعدد الغرف إذا كانت مفعلة
        if rooms_toggle.value:
            filtered_houses = filtered_houses[filtered_houses['AveRooms'] >= rooms_slider.value]

        # تطبيق التصفية الإضافية بعدد غرف النوم إذا كانت مفعلة
        if bedrooms_toggle.value:
            filtered_houses = filtered_houses[filtered_houses['AveBedrms'] >= bedrooms_slider.value]

        # تطبيق التصفية الإضافية بعمر المنزل إذا كانت مفعلة
        if age_toggle.value:
            filtered_houses = filtered_houses[filtered_houses['HouseAge'] >= age_slider.value]

        # إذا لم نجد نتائج، نبحث عن الأقرب
        if len(filtered_houses) == 0:
            print("⚠️ لم يتم العثور على منازل تطابق معايير البحث.")
            print("🔍 نبحث عن المنازل الأقرب للسعر المطلوب...")

            # حساب الفرق عن السعر المطلوب
            df['Price_Difference'] = abs(df['Price_Dollars'] - target_price)

            # تطبيق التصفية الإضافية على جميع البيانات للبحث عن الأقرب
            all_houses = df.copy()
            if rooms_toggle.value:
                all_houses = all_houses[all_houses['AveRooms'] >= rooms_slider.value]
            if bedrooms_toggle.value:
                all_houses = all_houses[all_houses['AveBedrms'] >= bedrooms_slider.value]
            if age_toggle.value:
                all_houses = all_houses[all_houses['HouseAge'] >= age_slider.value]

            if len(all_houses) > 0:
                closest_houses = all_houses.nsmallest(num_results, 'Price_Difference')
                display_results(closest_houses, target_price, False)
            else:
                print("❌ لا توجد منازل تطابق معايير التصفية الإضافية.")
        else:
            # إذا وجدنا نتائج، نعرضها
            if len(filtered_houses) > num_results:
                filtered_houses = filtered_houses.sample(num_results)

            display_results(filtered_houses, target_price, True)

# إعادة ربط دالة البحث المحسنة
search_button.on_click(on_search_button_clicked_enhanced)


🎛️ خيارات تصفية إضافية (اختياري):


HBox(children=(Checkbox(value=False, description='تفعيل تصفية الغرف'), IntSlider(value=1, continuous_update=Fa…

HBox(children=(Checkbox(value=False, description='تفعيل تصفية غرف النوم'), IntSlider(value=0, continuous_updat…

HBox(children=(Checkbox(value=False, description='تفعيل تصفية العمر'), IntSlider(value=1, continuous_update=Fa…