<h2>RMSProp Optimizer</h2>

<h3>What is RMSProp?</h3>
<ul>
  <li><b>English:</b> RMSProp (Root Mean Square Propagation) is an adaptive learning rate optimizer that improves upon Adagrad by preventing the learning rate from shrinking too much. It maintains a moving average of the squared gradients to normalize the gradient.</li>
  <li><b>বাংলা:</b> RMSProp একটি অ্যাডাপটিভ লার্নিং রেট অপটিমাইজার, যা Adagrad এর সমস্যাগুলো সমাধান করে। এটি গ্র্যাডিয়েন্টের স্কয়ারের একটি মুভিং অ্যাভারেজ রেখে, গ্র্যাডিয়েন্টকে নরমালাইজ করে।</li>
</ul>

<h3>How Does It Work?</h3>
<ul>
  <li><b>English:</b> Instead of accumulating all past squared gradients like Adagrad, RMSProp uses an exponentially decaying average of squared gradients. This allows the optimizer to keep learning even after many iterations.</li>
  <li><b>বাংলা:</b> Adagrad এর মতো সব গ্র্যাডিয়েন্টের স্কয়ার জমা না করে, RMSProp পুরোনো গ্র্যাডিয়েন্টগুলো ধীরে ধীরে কম গুরুত্ব দেয় এবং নতুনগুলোর উপর বেশি গুরুত্ব দেয়। ফলে অনেক ইটারেশনের পরেও লার্নিং বন্ধ হয় না।</li>
</ul>

<h3>Mathematical Formula</h3>
<pre>
E[g²]<sub>t</sub> = γ * E[g²]<sub>t-1</sub> + (1 - γ) * g²<sub>t</sub>

θ = θ - (η / sqrt(E[g²]<sub>t</sub> + ε)) * g<sub>t</sub>

Where:
- θ = parameter
- η = learning rate
- γ = decay rate (commonly 0.9)
- g<sub>t</sub> = gradient at time t
- ε = small number to prevent division by zero
</pre>

<h3>Advantages of RMSProp</h3>
<ul>
  <li><b>English:</b> Solves the learning rate decay issue of Adagrad.</li>
  <li>Works well in online and non-stationary settings (e.g. RNNs).</li>
  <li><b>বাংলা:</b> Adagrad এর লার্নিং রেট কমে যাওয়ার সমস্যা সমাধান করে।</li>
  <li>অনলাইন এবং পরিবর্তনশীল ডেটার জন্য ভালো কাজ করে।</li>
</ul>

<h3>Disadvantages of RMSProp</h3>
<ul>
  <li><b>English:</b> Needs tuning of hyperparameters like learning rate and decay factor (γ).</li>
  <li><b>বাংলা:</b> হাইপারপ্যারামিটার (লার্নিং রেট, γ) টিউন করা দরকার হয়।</li>
</ul>

<h3>When to Use RMSProp?</h3>
<ul>
  <li><b>English:</b> RMSProp is especially useful for Recurrent Neural Networks (RNNs), and models where the data distribution changes during training.</li>
  <li><b>বাংলা:</b> RNN বা এমন মডেলে RMSProp ভালো কাজ করে, যেখানে ট্রেনিং চলাকালীন ডেটার প্যাটার্ন পরিবর্তিত হয়।</li>
</ul>

<h3>RMSProp in Keras Example</h3>
<pre>
from tensorflow.keras.optimizers import RMSprop

optimizer = RMSprop(learning_rate=0.001, rho=0.9)

model.compile(optimizer=optimizer,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

model.fit(X_train, y_train, epochs=10, batch_size=32)
</pre>

<h3>Summary Table</h3>
<table border="1" cellpadding="5">
  <tr>
    <th>Aspect</th>
    <th>RMSProp</th>
    <th>বাংলা</th>
  </tr>
  <tr>
    <td>Learning Rate</td>
    <td>Adaptive (controlled by squared gradients)</td>
    <td>অ্যাডাপটিভ (গ্র্যাডিয়েন্টের স্কয়ার দিয়ে নিয়ন্ত্রিত)</td>
  </tr>
  <tr>
    <td>Strength</td>
    <td>Works well in changing environments</td>
    <td>পরিবর্তনশীল পরিবেশে ভালো কাজ করে</td>
  </tr>
  <tr>
    <td>Usage</td>
    <td>RNN, online learning, non-stationary data</td>
    <td>RNN, অনলাইন লার্নিং, পরিবর্তনশীল ডেটা</td>
  </tr>
</table>
