## What is model?
A model is abstractly:
- A function that compute something on tensor(a forward pass)
- Some variable that can be updated in response to training.
- models are made of layers.
- Layers are functions with a known mathematical structure that can be reused and have trainable variables.
- In Tensorflow, most high level implementations of layers and models such as Keras is built on tf.Model class.

## What is Keras?
Keras is a high level API for building and training networks designed for ease of use and rapid prototyping in deep learning.
- We use keras layers to build models.
- tf.keras.layers.Layer is the base for layers with which is build on top of tf.Module

## Common layers for Computer Vision:
- Convolution Layers; tf.keras.layers.Conv2D
- Pooling Layers: MaxPooling2D, AveragePooling2D
- Activation Layers: tf.keras.layers.Activation
  - relu --> most common hidden layers max(0,x)
  - sigmoid --> for multi-class classification, converting raw score in probabilities that sum to 1.
  - softmax --> for binary classification outputting a probability between 0 and 1.
- Normalize Layers: BatchNormalization - normalize the activations of the previous layers at each batch, meaning its shifts the mean to 0 and scales the variance to 1.
- Regulation Layers:  Dropout - Randomly sets a fraction of input units to 0 at each update during training time, which helps prevent co-adaption of neurons.
- Flattening Layers: Flatten - Transform the multidimensional output of convolutional/pooling layers into 1d vector. This is necessary before feeding the data into a fully connected Dense layers, as Dense Layers expect 1D array.
- Dense(Fully connected) Layers Dense: every neuron in the layer is connected to every neuron in the previous layer.

## Sequential Model:
 A way to build neural networks where layers are stacked linearly one after another.
 It's a simple and common approach for creating models with a single input and a single output per layer
 1. Simple way to build a neural networks
2. It allows you to create models by stacking layers one after another in a linear fashion.

Limitation:
- Strictly Linear: Cannot handle models with non-linear topologies.
- No multiple inputs/outputs.
- No share layers.
- No branching or skip connection

We can save and reload model with running further.

---
Absolutely! নিচে **Image Processing** এর দৃষ্টিকোণ থেকে TensorFlow এর ডীপ লার্নিং এ ব্যবহৃত important layers গুলো **বাংলায়** বুঝিয়ে দিচ্ছি, কখন কেন এবং কীভাবে ব্যবহার হয়, সাথে ডেটার dimension কেমন হয়—সেটাও বলছি।

---

# ১. Input Layer (ইনপুট লেয়ার)

**কেন ও কখন ব্যবহার?**

* ডেটা মডেলে ইনপুট হিসেবে যায় এখানে।
* Image processing এ, ইনপুট লেয়ার হিসেবে ছবি বা ছবি থেকে পাওয়া ফিচারগুলো মডেলে দেওয়া হয়।

**ডেটার dimension:**

* ধরো, RGB ছবি 224x224 পিক্সেলের, তাহলে ইনপুট হবে: `(224, 224, 3)`
* অর্থাৎ, 224 পিক্সেল হাইট, 224 পিক্সেল উইডথ, 3 = RGB কালার চ্যানেল।

**Example:**

* একটা ফটো ক্যামেরা থেকে মডেলে পাঠানো হবে।

---

# ২. Convolutional Layer (Conv2D)

**কেন ও কখন ব্যবহার?**

* ছবি থেকে ফিচার (যেমন, এজ, টেক্সচার, শেপ) বের করতে।
* প্রতিটি filter ছবির একটি অংশের ওপর কাজ করে এবং ফিচার ম্যাপ তৈরি করে।

**ডেটার dimension:**

* Input: `(height, width, channels)`
* Output: `(new_height, new_width, number_of_filters)`
* new\_height ও new\_width filter size ও stride এর উপর নির্ভর করে কমতে পারে।

**Example:**

* একটা ছবিতে ‘circle’ খুঁজে বের করা। Conv layer এর filter সেই circle এর edges detect করবে।

---

# ৩. Pooling Layer (MaxPooling2D / AveragePooling2D)

**কেন ও কখন ব্যবহার?**

* ফিচার ম্যাপ এর সাইজ কমাতে (downsampling) এবং কম্পিউটেশন কমাতে।
* Noise কমানো এবং বেশি গ্লোবাল ফিচার ধরার জন্য।

**ডেটার dimension:**

* Input: `(height, width, channels)`
* Output: `(height / pool_size, width / pool_size, channels)`
* Pooling সাধারনত spatial dimensions ছোট করে দেয়, channel অপরিবর্তিত থাকে।

**Example:**

* 224x224 ছবি থেকে 112x112 করে ছোট করা যাতে মডেল দ্রুত কাজ করতে পারে।

---

# ৪. Dense Layer (Fully Connected Layer)

**কেন ও কখন ব্যবহার?**

* শেষের দিকে ফিচার গুলোকে combine করে decision নেয়ার জন্য।
* Image classification এর জন্য শেষ লেয়ার হিসেবে বেশি ব্যবহৃত।

**ডেটার dimension:**

* Input: 1D vector (যদি Conv layer থাকে, তখন Flatten করে 1D করা হয়)
* Output: (number\_of\_neurons,)

**Example:**

* Cats vs Dogs image classifier এর শেষ Dense layer 2 neurons (cat, dog) output দিবে।

---

# ৫. Flatten Layer

**কেন ও কখন ব্যবহার?**

* Conv বা Pooling থেকে পাওয়া 3D ফিচার ম্যাপ কে 1D vector এ convert করার জন্য।
* কারণ Dense layer 1D ইনপুট নেয়।

**ডেটার dimension:**

* Input: `(height, width, channels)`
* Output: `(height * width * channels,)` (1D)

**Example:**

* Conv থেকে 7x7x64 output পেলে, Flatten করলে 3136 (7*7*64) লম্বা vector হবে।

---

# ৬. Dropout Layer

**কেন ও কখন ব্যবহার?**

* Overfitting কমাতে।
* Training এর সময় random কিছু neurons কে ignore করে মডেলকে আরো robust বানায়।

**ডেটার dimension:**

* Input আর output dimension একরকম থাকে।

**Example:**

* যদি মডেল খুব বেশি train করে validation set এ খারাপ হয়, তখন Dropout ইউজ করা হয়।

---

# ৭. Normalization Layer (BatchNormalization)

**কেন ও কখন ব্যবহার?**

* মডেলের training কে দ্রুত আর স্থিতিশীল করতে।
* প্রতিটি layer এর input কে normalize করে mean=0, std=1 করার চেষ্টা করে।

**ডেটার dimension:**

* Input আর output dimension একই থাকে।

**Example:**

* বড় বড় মডেল যেমন ResNet এ প্রতিটি Conv layer এর পরে BatchNormalization থাকে।

---

# ৮. Activation Layer (ReLU, Sigmoid, Softmax)

**কেন ও কখন ব্যবহার?**

* মডেলে non-linearity introduce করার জন্য।
* ReLU (Rectified Linear Unit) বেশি ব্যবহৃত কারণ এটা simple আর effective।

**ডেটার dimension:**

* Input আর output dimension একই থাকে।

**Example:**

* ReLU: hidden layers এ, Softmax: classification এর শেষ লেয়ারে।

---

# ৯. Embedding Layer

**কেন ও কখন ব্যবহার?**

* Image processing এর জন্য কমই ইউজ হয়, NLP তে বেশি।
* Categorical data বা text কে dense vector এ রূপান্তর করার জন্য।

---

## সারসংক্ষেপ (Image Processing এর জন্য Data Dimension Flow):

* **Input Layer:** (224,224,3) ছবি
* **Conv Layer:** (224,224,3) → (222,222,32) \[filter size 3x3, 32 filters]
* **Pooling:** (222,222,32) → (111,111,32) \[pool size 2x2]
* **Conv + Pooling** আরো কিছুবার
* **Flatten:** (7,7,64) → (3136,)
* **Dense:** (3136,) → (512,)
* **Dropout**
* **Dense (Output):** (512,) → (number\_of\_classes,)

---



In [6]:
import tensorflow as tf
import os

os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
from tensorflow.keras import layers, models

model = models.Sequential([
    layers.Dense(64, activation='relu', input_shape=(10,)),
    layers.Dense(32, activation='relu'),
    layers.Dense(10, activation='softmax'),
])
model.summary()