## <font color = 'red'>**1. OLS Regression Introduction**<font/>  
OLS అనేది ఒక **linear regression model**, ఇది ఒక dependent variable (Y) మరియు ఒక లేదా ఎక్కువ independent variables (X) మధ్య సంబంధాన్ని కనుగొంటుంది. ఇది **best-fitting line** ను కనుగొంటుంది, ఇది **sum of squared errors (SSE)** ను minimize చేస్తుంది.  

**Key Terms:**  
- **Dependent Variable (Y):** ఇది మనం predict చేయాలనుకునే variable (ఉదా: ఇంటి ధర).  
- **Independent Variable (X):** ఇది Y ను explain చేసే variable (ఉదా: ఇంటి పరిమాణం).  
- **Residuals (లోపాలు):** Actual Y మరియు predicted Y (Ŷ) మధ్య తేడాలు.  

--------------

![image.png](attachment:a7cacae2-6170-46b6-b9d9-4bd82885b45f.png)

------------

![image.png](attachment:f7ce9e95-4564-4b49-9f05-ec245a04e075.png)

--------

### **4. OLS Assumptions (కావలసిన షరతులు)**  
1. **Linearity (సరళ సంబంధం):** X మరియు Y మధ్య సరళ సంబంధం ఉండాలి.  
2. **No Multicollinearity (స్వతంత్ర X లు):** Independent variables మధ్య strong correlation ఉండకూడదు.  
3. **Homoscedasticity (స్థిరమైన లోపాలు):** Residuals యొక్క variance స్థిరంగా ఉండాలి.  
4. **No Autocorrelation (లోపాలు స్వతంత్రం):** Residuals మధ్య correlation ఉండకూడదు.  
5. **Normality of Residuals (లోపాలు normal distribution):** Large datasets కోసం residuals normal గా ఉండాలి.  


------

### **5. Advantages & Limitations (ప్రయోజనాలు & పరిమితులు)**  
**ప్రయోజనాలు:**  
✅ Easy to understand & implement.  
✅ Computationally efficient.  
✅ Provides interpretable coefficients (β₀, β₁).  

**పరిమితులు:**  
❌ Only works for linear relationships.  
❌ Sensitive to outliers (అసాధారణ విలువలు).  
❌ Assumptions strict గా ఉండాలి.  


--------

### **6. Practical Example (ఉదాహరణ)**  
**Problem:** ఇంటి పరిమాణం (X) బట్టి ఇంటి ధర (Y) ను predict చేయడం.  
**Data:**  
| X (sq.ft) | Y (₹ in lakhs) |  
|-----------|----------------|  
| 1000      | 30             |  
| 1500      | 45             |  
| 2000      | 60             |  



![image.png](attachment:005a5cd1-4a1e-470a-9ca4-dfbdd5a440ce.png)

![image.png](attachment:023a1048-b3af-4ce5-b8e3-736cc4b0011f.png)

![image.png](attachment:eacbf819-641f-42ec-8308-92f1ebb1fe31.png)

In [5]:
### **7. Python Code Snippet (Implementation)**  
import numpy as np
X = np.array([1000, 1500, 2000])
Y = np.array([30, 45, 60])

beta_1 = np.cov(X, Y, ddof=0)[0, 1] / np.var(X)  # ddof=0 for population variance
beta_0 = np.mean(Y) - beta_1 * np.mean(X)
print(f"Slope (β₁): {beta_1:.4f}, Intercept (β₀): {beta_0:.1f}")

Slope (β₁): 0.0300, Intercept (β₀): 0.0


**Interpretation:** ప్రతి 1 sq.ft పరిమాణం పెరిగినప్పుడు, ఇంటి ధర ₹0.03 లక్షలు పెరుగుతుంది.  

--------------

## Summary 
OLS అనేది **linear relationships** ను model చేయడానికి ఒక powerful tool. ఇది **least squares principle** ను ఉపయోగించి best-fit line ను కనుగొంటుంది. కానీ ఇది **outliers** మరియు **non-linear data** కు సరిగ్గా పనిచేయదు.  

**మరింత అర్థం చేసుకోవడానికి:**  
- **R² (R-squared):** Model ఎంత well-fit అయిందో తెలుపుతుంది (0 to 1).  
- **p-values:** Coefficients statistically significant అయ్యాయో లేదో check చేస్తుంది.  
