<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">Data Manipulation Technique</h2>

---

```
ডেটা মেনিপুলেশনের ক্ষেত্রে, Forward Filling and Backward Filling হলো ডেটা সেটের শূন্যস্থান বা অনুপস্থিত মানগুলো পূরণের জন্য ব্যবহৃত দুটি পদ্ধতি। এই পদ্ধতিগুলো বিশেষ করে টাইম সিরিজ ডেটা বা ক্রমানুসারে সাজানো ডেটার ক্ষেত্রে খুব কাজে লাগে।


Forward Filling:
এই পদ্ধতিতে, একটি অনুপস্থিত মান তার আগের নন-নাল মান দ্বারা প্রতিস্থাপিত হয়।
অর্থাৎ, ডেটা সেটের শুরুতে কোনো অনুপস্থিত মান থাকলে, তার আগের বৈধ মানটি ব্যবহার করে সেই শূন্যস্থান পূরণ করা হয়।
এটি অনুমান করে যে, অনুপস্থিত মানের আগের মানটিই সম্ভবত সবচেয়ে সঠিক অনুমান।

Backward Filling:
এই পদ্ধতিতে, একটি অনুপস্থিত মান তার পরের নন-নাল মান দ্বারা প্রতিস্থাপিত হয়।
অর্থাৎ, ডেটা সেটের শেষে কোনো অনুপস্থিত মান থাকলে, তার পরের বৈধ মানটি ব্যবহার করে সেই শূন্যস্থান পূরণ করা হয়।
এটি অনুমান করে যে, অনুপস্থিত মানের পরের মানটিই সম্ভবত সবচেয়ে সঠিক অনুমান।


- Forward Fill (ffill) → আগের মান দিয়ে পূরণ করে।
- Backward Fill (bfill) → পরবর্তী মান দিয়ে পূরণ করে।
- limit → কতোটা NaN পূরণ করবে তা নির্ধারণ করে।

### Forward Filling

In [None]:
import pandas as pd
import numpy as np

# dataset
data = {"A": [1, np.nan, 3, np.nan, 5], 
        "B": [np.nan, 2, np.nan, 4, np.nan]}

df = pd.DataFrame(data)

# Forward filling (filling NaN with previous value)
df_ffill = df.fillna(method='ffill')

print(df_ffill)


### Backward Filling

In [None]:
# Backward filling
df_bfill = df.fillna(method='bfill')

print(df_bfill)

In [None]:
import pandas as pd
import numpy as np

# series
data = pd.Series([1, np.nan, 3, np.nan, 5])
print("Original Series:\n", data)

# Forward Filled
forward_filled = data.fillna(method='ffill')
print("\nForward Filled Series:\n", forward_filled)

# Backward Filled
backward_filled = data.fillna(method='bfill')
print("\nBackward Filled Series:\n", backward_filled)

<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">⭐ Interpolation, Polynomial, Spline, and Time-Series Filling Techniques in Pandas</h2>
    
```
Pandas-এ missing values (NaN) fill করতে বিভিন্ন টেকনিক ব্যবহার করা যায়। এগুলোর মধ্যে interpolation, polynomial, spline, এবং time-series বেশ জনপ্রিয়।

<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">1️⃣ Interpolation (অন্তর্বর্তীকরণ)</h2>

---

```
ইন্টারপোলেশন হলো একটি আনুমানিক পদ্ধতি যার মাধ্যমে ডেটা সেটের মধ্যে থাকা ফাঁকা স্থানগুলি পূরণ করা হয়। এটি ডেটার প্যাটার্ন এবং প্রবণতার উপর ভিত্তি করে অনুপস্থিত মানগুলি অনুমান করে। 

Interpolation হল একটি সিরিজের মধ্যে অনুপস্থিত (NaN) মান পূরণ করা, যা পূর্ববর্তী ও পরবর্তী মানের ভিত্তিতে গণনা করা হয়।
পান্ডাসে interpolate() ফাংশন দিয়ে এটি করা হয়।
    1. Linear Interpolation,
    2. polynomial Interpolation,
    3. spline Interpolation and
    4. time-series Interpolation বিভিন্ন পদ্ধতিতে কাজ করতে পারে।
```
# ![image.png](attachment:1dd081c2-ddac-4675-8cb6-301fe0b453c6.png)

<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">2️⃣ Polynomial Interpolation</h2>

--- 

পলিনমিয়াল ইন্টারপোলেশন একটি বহুঘাত সমীকরণ ব্যবহার করে অনুপস্থিত মানগুলি অনুমান করে। এই পদ্ধতিতে, ডেটার মধ্যে একটি কার্ভ তৈরি করা হয় যা ডেটার সমস্ত পরিচিত পয়েন্টের মধ্য দিয়ে যায়। কার্ভের উপর ভিত্তি করে, অনুপস্থিত মানগুলি অনুমান করা হয়।
```
🔹 Polynomial Interpolation হল একটি curve-fitting technique, যেখানে একটি পলিনোমিয়াল ফাংশন ব্যবহার করে NaN পূরণ করা হয়।
🔹 উচ্চতর ডিগ্রি (degree) পলিনোমিয়াল ব্যবহার করলে, এটি smooth curve-fitting করতে পারে।
🔹 interpolate(method='polynomial', order=n) দিয়ে এটি করা হয়, যেখানে order=n মানে কত ডিগ্রির পলিনোমিয়াল ব্যবহার হবে।
🔹 এটি NaN ভ্যালুগুলো quadratic curve অনুযায়ী পূরণ করবে।।

🟢 Polynomial Interpolation কিভাবে কাজ করে?
✅ একটি নির্দিষ্ট ডিগ্রির (degree) পলিনোমিয়াল ফাংশন ব্যবহার করে ডেটার মধ্যবর্তী অংশ পূরণ করা হয়।
✅ order=n দ্বারা পলিনোমিয়ালের ডিগ্রি নির্ধারণ করা হয়।
✅ যত বেশি ডিগ্রি হবে, তত বেশি জটিল কার্ভ তৈরি হবে।

📌 Polynomial Interpolation এর সুবিধা
✔ NaN মান পূরণের জন্য একটি smooth এবং নির্ভুল কার্ভ তৈরি করে।
✔ উচ্চতর ডিগ্রি ব্যবহার করলে এটি আরও নিখুঁতভাবে ডেটার প্যাটার্ন অনুসরণ করতে পারে।
✔ লিনিয়ার ইন্টারপোলেশনের তুলনায় এটি বেশি নিখুঁত রেজাল্ট দিতে পারে।

⚠️ Polynomial Interpolation এর অসুবিধা
❌ যদি অত্যধিক উচ্চ ডিগ্রি (high degree) ব্যবহার করা হয়, তাহলে Overfitting হতে পারে।
❌ ডেটার শেষের দিকে এটি অস্বাভাবিক মান (oscillation) তৈরি করতে পারে।
❌ সীমিত সংখ্যক ডেটার ক্ষেত্রে, উচ্চ-ডিগ্রির পলিনোমিয়াল ব্যবহার করলে ভুল পূর্বাভাস দিতে পারে।

<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">3️⃣ Spline Interpolation </h2>

---

```
🔹 Spline interpolation হল smooth curve-fitting পদ্ধতি, যেখানে একটি spline function (piecewise polynomial) ব্যবহার করে NaN পূরণ করা হয়।
🔹 এটি polynomial interpolation-এর তুলনায় অনেক বেশি স্টেবল এবং স্মুথ রেজাল্ট দেয়।
🔹 এটি order=2 দিয়ে quadratic spline ব্যবহার করবে।

🟢 Spline Interpolation কিভাবে কাজ করে?
✅ ডেটার মধ্যে একাধিক ছোট ছোট কার্ভ তৈরি করে অনুপস্থিত মান অনুমান করা হয়।
✅ প্রতিটি কার্ভ ডেটার একটি নির্দিষ্ট অংশের মধ্যে ফিট করা হয়।
✅ এই কার্ভগুলোর উপর ভিত্তি করে NaN ভ্যালুগুলো পূরণ করা হয়।

📌 Spline Interpolation এর সুবিধা
✔ বহুঘাত (Polynomial) ইন্টারপোলেশনের চেয়েও জটিল প্যাটার্ন অনুমান করতে পারে।
✔ ডেটার মধ্যে খুব বেশি পরিবর্তন থাকলেও সঠিকভাবে কাজ করতে পারে।
✔ Smooth এবং Stable রেজাল্ট দেয়।

⚠️Spline Interpolation এর অসুবিধা:
❌ অন্যান্য ইন্টারপোলেশন পদ্ধতির চেয়ে বেশি গণনা-নিবিড় (Computationally expensive)।
❌ যদি পর্যাপ্ত ডেটা না থাকে, তাহলে আনুমানিক মানগুলো তেমন নির্ভুল নাও হতে পারে।

<div style="background-color: #f9f9fc; color: #333366; border-radius: 12px; margin: 20px auto; padding: 20px; border: 2px solid #ff4c4c; max-width: 1000px; font-family: Arial, sans-serif; line-height: 1.6;">
  <h2 style="text-align: center; color: #333366;">4️⃣ Time-Series Interpolation</h2>

---

```
🔹 Time-series interpolation হল সময়ের সাথে পরিবর্তনশীল ডেটার অনুপস্থিত মান পূরণ করা।
🔹 interpolate(method='time') ব্যবহার করে এটি করা হয়, যা সময়ভিত্তিক মান গণনা করতে সক্ষম। ইন্টারপোলেশন ব্যবহার করে অনুপস্থিত মানগুলি অনুমান করা হয়।
🔹 ফরওয়ার্ড ফিলিং (Forward Filling): এই পদ্ধতিতে, অনুপস্থিত মানগুলি তাদের আগের পরিচিত মান দিয়ে পূরণ করা হয়।
🔹 ব্যাকওয়ার্ড ফিলিং (Backward Filling): এই পদ্ধতিতে, অনুপস্থিত মানগুলি তাদের পরের পরিচিত মান দিয়ে পূরণ করা হয়।
🔹 এটি সময় অনুযায়ী missing values পূরণ করবে।