In [15]:
# استيراد جميع المكتبات اللازمة
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_california_housing
import ipywidgets as widgets
from IPython.display import display, clear_output
import warnings
warnings.filterwarnings('ignore')

# تهيئة الرسوم البيانية
%matplotlib inline
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['axes.grid'] = True
plt.rcParams['grid.alpha'] = 0.3

print("✅ تم استيراد جميع المكتبات بنجاح")

✅ تم استيراد جميع المكتبات بنجاح


In [20]:
# تحميل بيانات كاليفورنيا الأصلية وتحويلها لليمن
data = fetch_california_housing()
df_california = pd.DataFrame(data.data, columns=data.feature_names)
df_california['Price'] = data.target

print("📊 البيانات الأصلية من كاليفورنيا:")
print(f"عدد المنازل: {len(df_california)}")

# تحويل البيانات لتناسب اليمن
def adapt_to_yemen_housing(df):
    yemen_df = df.copy()

    # تحويل الأسعار إلى الريال اليمني (سعر صرف تقريبي: 1 دولار = 250 ريال)
    exchange_rate = 250

    # تحويل السعر إلى ريال يمني مع تعديل النطاق
    yemen_min_price = 5000000  # 50 مليون ريال
    yemen_max_price = 500000000  # 500 مليون ريال

    # تحويل النطاق مع الحفاظ على التوزيع النسبي
    current_min = df['Price'].min()
    current_max = df['Price'].max()

    yemen_df['Price_YER'] = yemen_min_price + (df['Price'] - current_min) * \
                           (yemen_max_price - yemen_min_price) / (current_max - current_min)

    # تحويل متوسط الدخل لليمن
    yemen_df['AverageIncome_YER'] = df['MedInc'] * 100 * exchange_rate

    # تحويل الأرقام إلى صحيحة
    yemen_df['AveRooms'] = yemen_df['AveRooms'].round().astype(int)
    yemen_df['AveBedrms'] = yemen_df['AveBedrms'].round().astype(int)
    yemen_df['AveOccup'] = yemen_df['AveOccup'].round().astype(int)
    yemen_df['HouseAge'] = yemen_df['HouseAge'].round().astype(int)
    yemen_df['Population'] = yemen_df['Population'].round().astype(int)

    # إضافة معلومات عن اليمن
    yemen_df['City'] = np.random.choice(['صنعاء', 'عدن', 'تعز', 'حضرموت', 'الحديدة', 'إب', 'مأرب'],
                                       size=len(yemen_df),
                                       p=[0.3, 0.2, 0.15, 0.1, 0.1, 0.1, 0.05])

    yemen_df['PropertyType'] = np.random.choice(['شقة', 'فيلا', 'منزل شعبي', 'عمارة'],
                                              size=len(yemen_df),
                                              p=[0.4, 0.2, 0.3, 0.1])

    yemen_df['Furnished'] = np.random.choice([0, 1], size=len(yemen_df), p=[0.7, 0.3])

    return yemen_df

# تطبيق التحويل
df = adapt_to_yemen_housing(df_california)

print("🇾🇪 بيانات اليمن بعد التحويل:")
print(f"💰 نطاق الأسعار: {df['Price_YER'].min():,.0f} - {df['Price_YER'].max():,.0f} ريال يمني")
print(f"🏠 عدد المنازل: {len(df)}")

# عرض توزيع المدن
print("\n🏙️ توزيع المنازل على المدن:")
city_counts = df['City'].value_counts()
for city, count in city_counts.items():
    print(f"   {city}: {count} منزل")

📊 البيانات الأصلية من كاليفورنيا:
عدد المنازل: 20640
🇾🇪 بيانات اليمن بعد التحويل:
💰 نطاق الأسعار: 5,000,000 - 500,000,000 ريال يمني
🏠 عدد المنازل: 20640

🏙️ توزيع المنازل على المدن:
   صنعاء: 6145 منزل
   عدن: 4095 منزل
   تعز: 3080 منزل
   حضرموت: 2102 منزل
   إب: 2099 منزل
   الحديدة: 2097 منزل
   مأرب: 1022 منزل


In [21]:
# إنشاء واجهة البحث المخصصة لليمن
price_slider = widgets.IntSlider(
    value=150000000,
    min=int(df['Price_YER'].min()),
    max=int(df['Price_YER'].max()),
    step=1000000,
    description='السعر المطلوب (ريال):',
    continuous_update=False,
    readout_format='d'
)

tolerance_slider = widgets.FloatSlider(
    value=0.1,
    min=0.05,
    max=0.3,
    step=0.05,
    description='نسبة التفاوت:',
    continuous_update=False,
    readout_format='.0%'
)

num_results_slider = widgets.IntSlider(
    value=5,
    min=1,
    max=20,
    step=1,
    description='عدد النتائج:',
    continuous_update=False
)

# خيارات التصفية الإضافية لليمن
city_dropdown = widgets.Dropdown(
    options=['جميع المدن'] + list(df['City'].unique()),
    value='جميع المدن',
    description='المدينة:'
)

property_type_dropdown = widgets.Dropdown(
    options=['جميع الأنواع'] + list(df['PropertyType'].unique()),
    value='جميع الأنواع',
    description='نوع العقار:'
)

furnished_toggle = widgets.Checkbox(value=False, description='مفروش فقط')

search_button = widgets.Button(description="🔍 ابحث عن منازل في اليمن", button_style='success')
output = widgets.Output()

print("🏠 نظام البحث عن المنازل في اليمن")
print("💰 أدخل السعر المطلوب بالريال اليمني:")
display(price_slider)
display(tolerance_slider)
display(num_results_slider)
display(widgets.HBox([city_dropdown, property_type_dropdown]))
display(furnished_toggle)
display(search_button)
display(output)

🏠 نظام البحث عن المنازل في اليمن
💰 أدخل السعر المطلوب بالريال اليمني:


IntSlider(value=150000000, continuous_update=False, description='السعر المطلوب (ريال):', max=500000000, min=50…

FloatSlider(value=0.1, continuous_update=False, description='نسبة التفاوت:', max=0.3, min=0.05, readout_format…

IntSlider(value=5, continuous_update=False, description='عدد النتائج:', max=20, min=1)

HBox(children=(Dropdown(description='المدينة:', options=('جميع المدن', 'الحديدة', 'مأرب', 'حضرموت', 'تعز', 'عد…

Checkbox(value=False, description='مفروش فقط')

Button(button_style='success', description='🔍 ابحث عن منازل في اليمن', style=ButtonStyle())

Output()

In [22]:
# دوال البحث والعرض المخصصة لليمن - النسخة المصححة
def yemen_housing_search(b):
    with output:
        clear_output()

        # جمع معايير البحث
        target_price = price_slider.value
        tolerance = tolerance_slider.value
        num_results = num_results_slider.value
        selected_city = city_dropdown.value
        selected_type = property_type_dropdown.value
        furnished_only = furnished_toggle.value

        # حساب نطاق السعر (يجب تعريفه هنا)
        lower_bound = target_price * (1 - tolerance)
        upper_bound = target_price * (1 + tolerance)

        # تطبيق التصفيات
        filtered_houses = df[
            (df['Price_YER'] >= lower_bound) &
            (df['Price_YER'] <= upper_bound)
        ].copy()

        if selected_city != 'جميع المدن':
            filtered_houses = filtered_houses[filtered_houses['City'] == selected_city]

        if selected_type != 'جميع الأنواع':
            filtered_houses = filtered_houses[filtered_houses['PropertyType'] == selected_type]

        if furnished_only:
            filtered_houses = filtered_houses[filtered_houses['Furnished'] == 1]

        # عرض النتائج - نمرر lower_bound و upper_bound للدالة
        if len(filtered_houses) == 0:
            print("⚠️ لم يتم العثور على منازل تطابق معايير البحث.")
            print("🔍 نعرض أقرب المنازل للسعر المطلوب...")
            df['Price_Difference'] = abs(df['Price_YER'] - target_price)
            results = df.nsmallest(num_results, 'Price_Difference')
            display_yemen_results(results, target_price, False, lower_bound, upper_bound)
        else:
            if len(filtered_houses) > num_results:
                filtered_houses = filtered_houses.sample(num_results)
            display_yemen_results(filtered_houses, target_price, True, lower_bound, upper_bound)

def display_yemen_results(houses_df, target_price, in_range, lower_bound, upper_bound):
    if in_range:
        print(f"✅ تم العثور على {len(houses_df)} منزل يطابق معايير البحث")
    else:
        print(f"🔍 أقرب {len(houses_df)} منزل للسعر المطلوب")

    print(f"💰 السعر المطلوب: {target_price:,.0f} ريال يمني")
    print("=" * 70)

    for i, (idx, house) in enumerate(houses_df.iterrows()):
        print(f"\n🏠 المنزل #{i+1} - {house['City']}")
        print(f"   📍 نوع العقار: {house['PropertyType']}")
        print(f"   💰 السعر: {house['Price_YER']:,.0f} ريال يمني")
        print(f"   🛏️ عدد الغرف: {house['AveRooms']} غرفة")
        print(f"   🛌 عدد غرف النوم: {house['AveBedrms']} غرفة")
        print(f"   👥 عدد الأفراد: {house['AveOccup']} فرد")
        print(f"   🏗️ عمر العقار: {house['HouseAge']} سنة")
        print(f"   🛋️ مفروش: {'نعم' if house['Furnished'] == 1 else 'لا'}")
        print(f"   💵 متوسط دخل المنطقة: {house['AverageIncome_YER']:,.0f} ريال/شهر")
        print(f"   👥 عدد سكان المنطقة: {house['Population']:,.0f} نسمة")
        print("-" * 50)

    # رسم بياني لتوزيع الأسعار - الآن يمكن استخدام lower_bound و upper_bound
    plt.figure(figsize=(12, 6))
    plt.hist(df['Price_YER'], bins=30, alpha=0.7, color='skyblue', label='جميع المنازل')
    plt.axvline(target_price, color='red', linestyle='--', linewidth=2, label='السعر المطلوب')
    plt.axvspan(lower_bound, upper_bound, alpha=0.3, color='green', label='نطاق البحث')

    if len(houses_df) > 0:
        plt.scatter(houses_df['Price_YER'], [50] * len(houses_df),
                   color='red', s=100, marker='o', label='النتائج')

    plt.xlabel('السعر (ريال يمني)')
    plt.ylabel('عدد المنازل')
    plt.title('توزيع أسعار المنازل في اليمن')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.ticklabel_format(style='plain', axis='x')
    plt.show()

    # رسم خريطة توزيع المنازل
    if len(houses_df) > 0:
        plt.figure(figsize=(10, 8))

        # ألوان لأنواع العقارات
        colors = {'شقة': 'blue', 'فيلا': 'green', 'منزل شعبي': 'orange', 'عمارة': 'red'}

        for prop_type, color in colors.items():
            subset = houses_df[houses_df['PropertyType'] == prop_type]
            if len(subset) > 0:
                plt.scatter(subset['Longitude'], subset['Latitude'],
                           c=color, s=subset['Price_YER']/1000000,
                           alpha=0.6, label=prop_type, edgecolors='black')

        plt.xlabel('خط الطول')
        plt.ylabel('خط العرض')
        plt.title('توزيع المنازل الناتجة على الخريطة')
        plt.legend()
        plt.grid(True, alpha=0.3)
        plt.show()

# ربط الدالة بالزر
search_button.on_click(yemen_housing_search)

print("✅ النظام جاهز للبحث في المنازل اليمنية")

✅ النظام جاهز للبحث في المنازل اليمنية


In [23]:
# حفظ بيانات اليمن وعرض الإحصائيات
df.to_csv('yemen_housing_data.csv', index=False)

print("🇾🇪 إحصائيات بيانات المنازل في اليمن:")
print("=" * 50)

stats = {
    'إجمالي عدد المنازل': len(df),
    'أقل سعر': f"{df['Price_YER'].min():,.0f} ريال",
    'أعلى سعر': f"{df['Price_YER'].max():,.0f} ريال",
    'متوسط السعر': f"{df['Price_YER'].mean():,.0f} ريال",
    'أكثر المدن توفراً': df['City'].mode().iloc[0],
    'أكثر أنواع العقارات شيوعاً': df['PropertyType'].mode().iloc[0],
    'نسبة المنازل المفروشة': f"{df['Furnished'].mean()*100:.1f}%"
}

for key, value in stats.items():
    print(f"📊 {key}: {value}")

print(f"\n💾 تم حفظ البيانات في ملف 'yemen_housing_data.csv'")
print("\n🎯 تعليمات الاستخدام:")
print("1. حرك منزلق السعر لاختيار الميزانية")
print("2. اضبط نسبة التفاوت لزيادة أو تقليل نطاق البحث")
print("3. اختر المدينة ونوع العقار إذا أردت")
print("4. انقر على 'ابحث عن منازل في اليمن'")
print("5. استمتع بالنتائج والرسوم البيانية!")

🇾🇪 إحصائيات بيانات المنازل في اليمن:
📊 إجمالي عدد المنازل: 20640
📊 أقل سعر: 5,000,000 ريال
📊 أعلى سعر: 500,000,000 ريال
📊 متوسط السعر: 200,811,820 ريال
📊 أكثر المدن توفراً: صنعاء
📊 أكثر أنواع العقارات شيوعاً: شقة
📊 نسبة المنازل المفروشة: 30.2%

💾 تم حفظ البيانات في ملف 'yemen_housing_data.csv'

🎯 تعليمات الاستخدام:
1. حرك منزلق السعر لاختيار الميزانية
2. اضبط نسبة التفاوت لزيادة أو تقليل نطاق البحث
3. اختر المدينة ونوع العقار إذا أردت
4. انقر على 'ابحث عن منازل في اليمن'
5. استمتع بالنتائج والرسوم البيانية!
