In [None]:
# שלבים 1–7: בניית מודל וחיזוי ידני על עבירות בנייה

# שלב 1: טעינת ספריות
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

from google.colab import drive
drive.mount('/content/drive')

# שלב 2: טעינת הקובץ
file_path = '/content/drive/My Drive/פרויקט גמר/merged_df.csv'
df = pd.read_csv(file_path)

# שלב 3: הסרת עמודות לא רלוונטיות
columns_to_drop = [
    'Case', 'Year_1', 'Year_2', 'Update_Photo_Date_1', 'Update_Photo_Date_2',
    'administrative_to_administrative','intelligence_to_intelligence',
    'Type_1', 'Type_2', 'Potential_Type_1', 'Potential_Type_2',
    'Planning_Area', 'Local_Authority', 'City', 'Block', 'Parcel',
    'X_1', 'X_2', 'Y_1', 'Y_2', 'Local_land_designation',
    'Prevantion', 'Defence', 'Vatmal', 'Tzvir', 'Return'
]
df = df.drop(columns=columns_to_drop, errors='ignore')


מודל רנדום פורסט

In [None]:
# שלב 4: הפרדת 10 הרשומות האחרונות לשלב 7
df_main = df.iloc[:-10].copy()
df_future = df.iloc[-10:].copy()

# הפרדת תכונות (X) ותוצאה (y)
X = df_main.drop(columns=['intelligence_to_administrative'])
y = df_main['intelligence_to_administrative']

# שלב 5: פיצול הדאטה לאימון ובדיקה
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

# שלב 6: אימון המודל ומדידת ביצועים
rf_model = RandomForestClassifier(random_state=42)
rf_model.fit(X_train, y_train)

y_pred = rf_model.predict(X_test)
y_proba = rf_model.predict_proba(X_test)[:, 1]

accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
auc = roc_auc_score(y_test, y_proba)

print("\n✅ המודל אומן בהצלחה!")
print(f"\n📊 Accuracy: {accuracy:.2f}")
print(f"🎯 Precision: {precision:.2f}")
print(f"🔍 Recall: {recall:.2f}")
print(f"⚖️ F1 Score: {f1:.2f}")
print(f"📈 AUC: {auc:.2f}")

# שלב 7: ממשק ידני להזנת תיק חדש
import numpy as np

# רשימת הפיצ'רים (עמודות שנשארו)
feature_names = X.columns.tolist()

print("\n📝 הזן ערכים לרשומה חדשה:")
user_input = []
for feature in feature_names:
    val = input(f"{feature}: ")
    try:
        user_input.append(float(val))
    except:
        print("⚠️ ערך לא תקין. נסה שוב.")
        val = input(f"{feature}: ")
        user_input.append(float(val))

# יצירת DataFrame עם שורה אחת
user_df = pd.DataFrame([user_input], columns=feature_names)

# תחזית על הקלט
prediction = rf_model.predict(user_df)[0]
probability = rf_model.predict_proba(user_df)[0][1]

print("\n📊 תוצאה:")
if prediction == 1:
    print(f"✔️ המודל חוזה שהתיק יתפתח למנהלי (בהסתברות של {probability:.2f})")
else:
    print(f"❌ המודל חוזה שהתיק לא יתפתח למנהלי (בהסתברות של {probability:.2f})")
00

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).

✅ המודל אומן בהצלחה!

📊 Accuracy: 0.78
🎯 Precision: 0.68
🔍 Recall: 0.54
⚖️ F1 Score: 0.60
📈 AUC: 0.81

📝 הזן ערכים לרשומה חדשה:
Kal_Kashiah_1: 0
Kal_Kashiah_2: 0
city_erea: 1
jewish_e: 0
District_Center: 0
District_Jerusalem: 0
District_North: 1
District_South: 0
Quarter_Update_1_Q1: 0
Quarter_Update_1_Q2: 0
Quarter_Update_1_Q3: 0
Quarter_Update_1_Q4: 0
Quarter_Update_2_Q1: 1
Quarter_Update_2_Q2: 0
Quarter_Update_2_Q3: 0
Quarter_Update_2_Q4: 1
Potential_Type_1_Grouped_Buildings: 1
Potential_Type_1_Grouped_Construction Stages: 0
Potential_Type_1_Grouped_Fences and Nets: 0
Potential_Type_1_Grouped_Infrastructure and Roads: 0
Potential_Type_1_Grouped_Other: 0
Potential_Type_2_Grouped_Buildings: 1
Potential_Type_2_Grouped_Construction Stages: 0
Potential_Type_2_Grouped_Fences and Nets: 0
Potential_Type_2_Grouped_Infrastructure and Roads: 0
Potential_Type_2_Group

In [None]:
# 🔍 שלב ניתוח: אילו שדות הכי חשובים למודל

importances = rf_model.feature_importances_
feature_importance = pd.DataFrame({
    'Feature': X.columns,
    'Importance': importances
}).sort_values(by='Importance', ascending=False)

print("\n📊 חשיבות הפיצ'רים (Top 10):")
print(feature_importance.head(10))


NameError: name 'rf_model' is not defined

אני מנסה לייבא את זה לגיטהאב

In [9]:
import os
from getpass import getpass

# === הגדרות ===
repo_url = "https://github.com/Noa-Ashtamker/Building-Violations-Predictions.git"
file_path = "/content/drive/MyDrive/פרויקט גמר/RandomForest.ipynb"
commit_message = "העלאה מקולאב לגיטהאב"

# === טוקן אבטחה ===
token = getpass("הדביקי כאן את ה-Token שלך מגיטהאב:")

# === כתובת מאובטחת עם הטוקן ===
secure_url = repo_url.replace("https://", f"https://{token}@")

# === קונפיגורציה בסיסית ===
!git config --global user.email "your@email.com"
!git config --global user.name "Noa Ashtamker"

# === clone של הרפוזיטורי
!git clone "{secure_url}"

# === העתקת הקובץ
repo_name = repo_url.split('/')[-1].replace('.git', '')
!cp "{file_path}" "{repo_name}/"

# === ביצוע git push
%cd "{repo_name}"
!git add .
!git commit -m "{commit_message}"
!git push origin main



הדביקי כאן את ה-Token שלך מגיטהאב:··········
Cloning into 'Building-Violations-Predictions'...
remote: Enumerating objects: 7, done.[K
remote: Counting objects: 100% (7/7), done.[K
remote: Compressing objects: 100% (5/5), done.[K
remote: Total 7 (delta 1), reused 0 (delta 0), pack-reused 0 (from 0)[K
Receiving objects: 100% (7/7), 473.63 KiB | 3.67 MiB/s, done.
Resolving deltas: 100% (1/1), done.
cp: cannot stat '/content/drive/MyDrive/פרויקט גמר/RandomForest.ipynb': No such file or directory
/content/Building-Violations-Predictions/Building-Violations-Predictions/Building-Violations-Predictions
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
Everything up-to-date


מודל עצי החלטה

In [None]:
# לאחר איפוס, נטען מחדש את הקובץ ונריץ את מודל עץ ההחלטה

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

from google.colab import drive
drive.mount('/content/drive')

# שלב 2: טעינת הקובץ
file_path = '/content/drive/My Drive/פרויקט גמר/merged_df.csv'
df = pd.read_csv(file_path)


# הסרת עמודות לא רלוונטיות
columns_to_drop = [
    'Case', 'Year_1', 'Year_2', 'Update_Photo_Date_1', 'Update_Photo_Date_2',
    'administrative_to_administrative', 'intelligence_to_intelligence',
    'Type_1', 'Type_2', 'Potential_Type_1', 'Potential_Type_2',
    'Planning_Area', 'Local_Authority', 'City', 'Block', 'Parcel',
    'X_1', 'X_2', 'Y_1', 'Y_2', 'Local_land_designation',
    'Prevantion', 'Defence', 'Vatmal', 'Tzvir', 'Return'
]
df = df.drop(columns=columns_to_drop, errors='ignore')

# הפרדת עשרת הרשומות האחרונות לשלב 7
df_main = df.iloc[:-10].copy()
df_future = df.iloc[-10:].copy()

# הפרדת X ו-y
X = df_main.drop(columns=['intelligence_to_administrative'])
y = df_main['intelligence_to_administrative']

# פיצול הדאטה
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

# אימון מודל עץ החלטה
tree_model = DecisionTreeClassifier(random_state=42)
tree_model.fit(X_train, y_train)

# הערכת ביצועים
y_pred = tree_model.predict(X_test)
y_proba = tree_model.predict_proba(X_test)[:, 1]

metrics = {
    "Accuracy": accuracy_score(y_test, y_pred),
    "Precision": precision_score(y_test, y_pred),
    "Recall": recall_score(y_test, y_pred),
    "F1 Score": f1_score(y_test, y_pred),
    "AUC": roc_auc_score(y_test, y_proba)
}

metrics_df = pd.DataFrame.from_dict(metrics, orient='index', columns=["Decision Tree Score"])
metrics_df


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


Unnamed: 0,Decision Tree Score
Accuracy,0.761985
Precision,0.658754
Recall,0.495979
F1 Score,0.565893
AUC,0.763767
