<div style="direction: rtl; white-space: pre-wrap; line-height: 1.5;">

🔹 **پیش‌بینی زمان انجام پروژه‌های IT با استفاده از یادگیری ماشین (ML)**

---

### ✅ **خلاصه پروژه:**

این پروژه بر پیش‌بینی مدت‌زمان موردنیاز برای تکمیل پروژه‌های IT تمرکز دارد. با استفاده از تکنیک‌های یادگیری ماشین، هدف این است که با توجه به ویژگی‌هایی مثل نوع پروژه، تعداد اعضای تیم، تکنولوژی مورد استفاده، تجربه تیم و ... مدت زمان تخمینی برای اتمام پروژه را پیش‌بینی کنیم.

---

### 📌 **جزئیات پروژه:**

* **نوع پروژه:** Regression (پیش‌بینی مقدار پیوسته)
* **ورودی‌ها (احتمالی):**

  * نوع پروژه (Web, App, Backend, API و ...)
  * تعداد افراد در تیم
  * تجربه اعضا
  * تکنولوژی‌های مورد استفاده
  * سابقه انجام پروژه‌های مشابه
* **خروجی:** پیش‌بینی تعداد روز یا ساعت مورد نیاز برای تکمیل پروژه
* **مراحل کلی:**

  1. دریافت و بررسی داده‌ها
  2. پاک‌سازی و پیش‌پردازش داده‌ها
  3. انتخاب ویژگی‌ها (Feature Selection)
  4. انتخاب مدل‌های اولیه (مثل Linear Regression، Decision Tree، XGBoost)
  5. ارزیابی مدل‌ها با متریک‌هایی مثل MAE, RMSE
  6. مستندسازی نتایج

---

### 🔍 بررسی تناسب با **پروفایل شما:**

**پروفایل:**

> Junior Machine Learning Developer | Building AI Foundations
> تمرکز روی یادگیری مفاهیم پایه ML، پردازش داده، مدل‌سازی و ارزیابی

**نتیجه:**
این پروژه یک پروژه مقدماتی تا متوسط در حوزه Regression محسوب می‌شود که دقیقاً مطابق با مهارت‌های ذکرشده در پروفایل شماست. فرصت خوبی برای استفاده عملی از دانش فعلی‌تان در دنیای واقعی‌ است.

---

### 🟢 **ارزیابی کلی برای شما:**

| معیار                           | نتیجه / نظر من            |
| ------------------------------- | ------------------------- |
| **تناسب با سطح شما**            | عالی ✅                    |
| **میزان دشواری**                | متوسط (مناسب سطح شما) ✅   |
| **نیاز به زبان انگلیسی**        | متوسط (مناسب سطح B1) ✅    |
| **نوع مدل‌ها و ابزارها**        | آشنا برای شما ✅           |
| **تکراری بودن پروژه برای شما**  | ❌ **تکراری نیست**         |
| **مبدا پروژه (کشور)**           | 🇮🇳 هند                  |
| **زمان تخمینی لازم برای انجام** | ⏱️ **30–35 ساعت** (واقعی) |
| **هزینه پیشنهادی مناسب**        | 💵 **180 تا 220 دلار**    |
| **امتیاز نهایی از ۱۰**          | ⭐ **۸.۵ / ۱۰**            |

---

### 💬 **نظر من برای شما:**

اگر می‌خوای وارد پروژه‌های واقعی ML بشی، این پروژه یه فرصت خیلی خوبه. چون داده‌محوره، مدل‌های ساده تا متوسط داره، و نیازی به دانش خیلی پیچیده نداره. زبان انگلیسی شما در سطح B1 برای فهم دیتاست، ارتباط ساده با کارفرما و مستندسازی اولیه کفایت می‌کنه، فقط ممکنه برای توضیح مفصل مدل یا گزارش، کمی چالش داشته باشی، ولی قابل مدیریت هست.

</div>

In [1]:
# Step 1: Import required libraries
import pandas as pd

# Step 2: Load the dataset
df = pd.read_csv("dataset/fp.csv")

# Step 3: Show the first few rows
df.head()

Unnamed: 0,id,Project,TeamExp,ManagerExp,YearEnd,Length,Effort,Transactions,Entities,PointsNonAdjust,Adjustment,PointsAjust,Language
0,1,1,1,4,85,12,5152,253,52,305,34,302,1
1,2,2,0,0,86,4,5635,197,124,321,33,315,1
2,3,3,4,4,85,1,805,40,60,100,18,83,1
3,4,4,0,0,86,5,3829,200,119,319,30,303,1
4,5,5,0,0,86,4,2149,140,94,234,24,208,1


<div style="direction: rtl; white-space: pre-wrap; line-height: 1.5;">


## 📊 توضیح کامل ستون‌های دیتاست `fp.csv`

| ستون              | توضیح فارسی                                          | نوع داده           | تحلیل تأثیرگذاری بر Effort                                                                                      |
| ----------------- | ---------------------------------------------------- | ------------------ | --------------------------------------------------------------------------------------------------------------- |
| `id`              | شناسه پروژه                                          | عدد صحیح           | ⚠️ فقط برای شناسایی است، هیچ تأثیری روی پیش‌بینی نداره.                                                         |
| `Project`         | شماره یا نوع پروژه                                   | عدد صحیح           | مشابه `id`، فقط نشانه‌گذاریه، نباید به مدل داده بشه.                                                            |
| `TeamExp`         | میزان تجربه تیم (سال)                                | عدد صحیح           | ✅ تأثیر زیاد: تیم با تجربه بالا احتمالاً زمان کمتری صرف می‌کنه.                                                 |
| `ManagerExp`      | تجربه مدیر پروژه (سال)                               | عدد صحیح           | ✅ تأثیر متوسط تا زیاد: مدیریت خوب باعث بهینه‌سازی زمان می‌شه.                                                   |
| `YearEnd`         | سال اتمام پروژه (مثلاً 85 = 1985)                    | عدد صحیح           | ⚠️ تأثیر مستقیم نداره ولی ممکنه برای تحلیل روند تاریخی مفید باشه.                                               |
| `Length`          | طول پروژه به ماه                                     | عدد صحیح           | ⚠️ در واقع، مشابه `Effort` هست؛ نباید به عنوان ورودی برای پیش‌بینی Effort استفاده بشه چون باهاش هم‌پوشانی داره. |
| `Effort`          | 🔴 تلاش واقعی برای اتمام پروژه (به ساعت یا نفر-ساعت) | عدد هدف (Target)   | 🎯 هدف اصلی مدل‌سازی ماست                                                                                       |
| `Transactions`    | تعداد تراکنش‌های سیستم                               | عدد صحیح           | ✅ نماینده‌ای از پیچیدگی عملکرد سیستم                                                                            |
| `Entities`        | تعداد موجودیت‌ها (Entityها) در سیستم                 | عدد صحیح           | ✅ تأثیر زیاد: ساختار داده پیچیده‌تر = زمان بیشتر                                                                |
| `PointsNonAdjust` | Function Points اولیه بدون تعدیل                     | عدد صحیح           | ✅ یکی از معیارهای رسمی در مهندسی نرم‌افزار برای تخمین تلاش                                                      |
| `Adjustment`      | فاکتور تعدیل (مثل سختی تکنولوژی یا محدودیت‌ها)       | عدد صحیح           | ✅ با این فاکتور، Function Point نهایی محاسبه می‌شه                                                              |
| `PointsAjust`     | Function Points نهایی بعد از Adjustment              | عدد صحیح           | ✅ می‌تونه ویژگی قوی باشه چون ترکیبی از بالا دو تاس                                                              |
| `Language`        | زبان برنامه‌نویسی پروژه (1 = 3GL، 2 = 4GL)           | دسته‌ای کدبندی‌شده | ⚠️ تأثیر متوسط: زبان سطح بالا (4GL) معمولاً زمان کمتری نیاز داره                                                |



</div>