<h2>Activation Function Guide</h2>

<h3>1. Hidden Layers</h3>
<ul>
  <li><b>ReLU (Rectified Linear Unit)</b><br>
    <b>Use when:</b> Most deep learning models (CNNs, MLPs)<br>
    <b>Pros:</b> Fast, avoids vanishing gradients<br>
    <b>Cons:</b> Can die during training (always output 0)<br><br>
    <b>ব্যবহার:</b> Deep learning এর hidden layers এ সাধারণভাবে ব্যবহৃত হয়।<br>
    <b>সুবিধা:</b> দ্রুত কাজ করে এবং gradient vanish সমস্যায় পড়ে না।<br>
    <b>অসুবিধা:</b> কিছু neuron train চলাকালীন dead হয়ে যেতে পারে।
  </li><br>

  <li><b>Leaky ReLU / Parametric ReLU</b><br>
    <b>Use when:</b> ReLU units are dying<br>
    <b>Pros:</b> Allows small gradient for inputs less than 0<br><br>
    <b>ব্যবহার:</b> ReLU যদি কাজ না করে বা neuron dead হয়ে যায়।<br>
    <b>সুবিধা:</b> Negative input এর জন্যও সামান্য gradient থাকে।
  </li><br>

  <li><b>Tanh</b><br>
    <b>Use when:</b> You want output between -1 and 1<br>
    <b>Cons:</b> Vanishing gradient problem<br><br>
    <b>ব্যবহার:</b> Output যদি -1 থেকে 1 এর মধ্যে রাখতে হয়।<br>
    <b>অসুবিধা:</b> Gradient vanish হতে পারে।
  </li><br>

  <li><b>Sigmoid</b><br>
    <b>Use when:</b> Simple binary tasks, shallow networks<br>
    <b>Cons:</b> Vanishing gradient<br><br>
    <b>ব্যবহার:</b> Binary classification বা ছোট network এর জন্য।<br>
    <b>অসুবিধা:</b> Deep networks এ gradient vanish হতে পারে।
  </li>
</ul>

<h3>2. Output Layer</h3>
<table border="1" cellpadding="5">
  <tr>
    <th>Task Type</th>
    <th>Activation Function</th>
    <th>Output Range</th>
    <th>Bengali Explanation</th>
  </tr>
  <tr>
    <td>Binary Classification</td>
    <td>Sigmoid</td>
    <td>0 to 1</td>
    <td>একটি neuron ব্যবহার করে binary output দেয়।</td>
  </tr>
  <tr>
    <td>Multi-Class (one label)</td>
    <td>Softmax</td>
    <td>0 to 1 (sum = 1)</td>
    <td>একটি class predict করার জন্য ব্যবহার হয়।</td>
  </tr>
  <tr>
    <td>Multi-Label Classification</td>
    <td>Sigmoid</td>
    <td>0 to 1</td>
    <td>একাধিক label এর জন্য একাধিক output neuron থাকে।</td>
  </tr>
  <tr>
    <td>Regression (real value)</td>
    <td>None / Linear</td>
    <td>-∞ to +∞</td>
    <td>Continuous value predict করার জন্য।</td>
  </tr>
  <tr>
    <td>Regression (0 to 1)</td>
    <td>Sigmoid</td>
    <td>0 to 1</td>
    <td>Target যদি normalized হয় (0 থেকে 1)।</td>
  </tr>
  <tr>
    <td>Regression (-1 to 1)</td>
    <td>Tanh</td>
    <td>-1 to 1</td>
    <td>Target যদি -1 থেকে 1 এর মধ্যে থাকে।</td>
  </tr>
</table>

<h3>Summary</h3>
<ul>
  <li>Use <b>ReLU</b> for hidden layers</li>
  <li>Use <b>Sigmoid</b> or <b>Softmax</b> for classification output</li>
  <li>Use <b>Linear</b> for regression output</li><br>
  <li><b>সারাংশ:</b> Hidden layer এর জন্য ReLU, Classification এর জন্য Sigmoid/Softmax, এবং Regression এর জন্য Linear ব্যবহার করুন।</li>
</ul>
