<a href="https://colab.research.google.com/github/coderzaman/Numpy-For-AI-ML/blob/main/Numpy_For__AI_ML.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Introduction to NumPy**


NumPy stands for **Num**erical **Py**thon. It's a fundamental library for scientific computing in Python.

At its core, NumPy provides a powerful object called an `ndarray`, which stands for **n-dimensional array**. This object is the key to NumPy's speed and power.

-----

## **Why is NumPy Faster than a Python List?**

While a NumPy `ndarray` might seem similar to a Python `list`, it has crucial architectural differences that make it significantly faster for numerical operations. The two main reasons are **data type homogeneity** and **contiguous memory layout**.

### **1. Homogeneous Data Types**

A NumPy array is **homogeneous**, meaning all elements inside the array must be of the **same data type** (e.g., all 32-bit integers or all 64-bit floats).

  * **NumPy `ndarray`**: Since every element is the same type, NumPy knows exactly how much memory each element takes up and doesn't need to perform type-checking when iterating or performing operations.
  * **Python `list`**: A list is **heterogeneous**. It can contain different data types (`int`, `string`, `object`, etc.). When you perform an operation on a list, Python must check the data type of each element before it can proceed, which adds significant overhead and slows down the process.

### **2. Contiguous Memory Layout**

This is the most important reason for NumPy's speed advantage.

  * **NumPy `ndarray`**: Array data is stored in a single, **contiguous block of memory**. This means if the first element is at memory address 1000, the next element (of the same integer type) will be right next to it at 1004, the next at 1008, and so on. Computers are highly optimized to work with contiguous memory blocks. This is often called being "cache-friendly."

  * **Python `list`**: A list doesn't store the actual data items contiguously. Instead, it stores **pointers** to objects that are scattered across different locations in memory. To access the next item, the program has to follow the pointer to find it, an extra step that slows things down.

-----

## **The Power of Vectorization & SIMD(Single Instruction Multiple Data)**

These two features—homogeneous types and contiguous memory—unlock a powerful programming paradigm called **vectorization**.

**Vectorization** is the process of executing operations on entire arrays at once, instead of iterating through elements one by one with a `for` loop.

For example, to multiply every element in a list by 5, you would write a loop:

```python
my_list = [1, 2, 3, 4, 5]
for i in range(len(my_list)):
    my_list[i] = my_list[i] * 5
```

With NumPy, you can perform this operation on the whole array in a single line:

```python
import numpy as np
my_array = np.array([1, 2, 3, 4, 5])
my_array = my_array * 5 # This is vectorization!
```

This is possible because NumPy can pass the entire block of contiguous data to highly optimized, pre-compiled C code. This code, in turn, can leverage modern CPU features like **SIMD (Single Instruction, Multiple Data)**. SIMD allows a single CPU instruction (e.g., "multiply by 5") to be performed on multiple data elements simultaneously, leading to massive performance gains.

-----

## **What Else is NumPy Used For? 🧑‍🔬**

Because of its speed and efficiency, NumPy is the foundation of the scientific Python ecosystem. It provides a vast library of high-level mathematical functions that operate on `ndarray`s, including:

  * **Linear Algebra**: Matrix multiplication, determinants, solving linear equations, and more.
  * **Statistics**: Calculating mean, median, standard deviation, etc.
  * **Fourier Transforms** and routines for shape manipulation.
  * It serves as the underlying data structure for other major libraries, most notably **Pandas**, **SciPy**, and **Scikit-learn**.

## **NumPy পরিচিতি**


NumPy-এর পূর্ণরূপ হলো **Num**erical **Py**thon। এটি পাইথনে সায়েন্টিফিক কম্পিউটিং-এর জন্য একটি মৌলিক লাইব্রেরি।

NumPy-এর কেন্দ্রে রয়েছে `ndarray` নামক একটি শক্তিশালী অবজেক্ট, যার অর্থ **n-dimensional array** (এন-ডাইমেনশনাল অ্যারে)। এই অবজেক্টটিই NumPy-এর গতি এবং ক্ষমতার মূল চাবিকাঠি।

-----

## **NumPy কেন Python List-এর চেয়ে দ্রুত?**

যদিও একটি NumPy `ndarray`-কে পাইথনের `list`-এর মতোই মনে হতে পারে, তবে এর কিছু গুরুত্বপূর্ণ আর্কিটেকচারাল পার্থক্য রয়েছে যা এটিকে নিউমেরিক্যাল অপারেশনের জন্য অনেক বেশি দ্রুত করে তোলে। এর দুটি প্রধান কারণ হলো **সমজাতীয় ডেটা টাইপ** এবং **ধারাবাহিক মেমরি লেআউট**।

### **১. সমজাতীয় ডেটা টাইপ (Homogeneous Data Types)**

একটি NumPy অ্যারে **সমজাতীয় (homogeneous)** হয়, অর্থাৎ অ্যারের ভিতরের সমস্ত উপাদান অবশ্যই **একই ডেটা টাইপের** হতে হবে (যেমন, সব 32-bit integer অথবা সব 64-bit float)।

  * **NumPy `ndarray`**: যেহেতু প্রতিটি উপাদান একই ধরনের, তাই NumPy ঠিকভাবে জানে প্রতিটি উপাদানের জন্য কতটা মেমরি প্রয়োজন। এর ফলে কোনো অপারেশন চালানোর সময় ডেটা টাইপ চেক করার প্রয়োজন হয় না।
  * **Python `list`**: একটি লিস্ট **বিষমজাতীয় (heterogeneous)** হতে পারে। এতে বিভিন্ন ডেটা টাইপের উপাদান (`int`, `string`, `object` ইত্যাদি) থাকতে পারে। যখন একটি লিস্টের উপর কোনো অপারেশন করা হয়, তখন পাইথনকে প্রতিটি উপাদানের ডেটা টাইপ পরীক্ষা করতে হয়, যা অতিরিক্ত সময় নেয় এবং প্রক্রিয়াটিকে ধীর করে দেয়।

### **২. ধারাবাহিক মেমরি লেআউট (Contiguous Memory Layout)**

NumPy-এর গতির পেছনে এটিই সবচেয়ে গুরুত্বপূর্ণ কারণ।

  * **NumPy `ndarray`**: অ্যারের ডেটা একটিমাত্র, **ধারাবাহিক মেমরি ব্লকে (contiguous block of memory)** সংরক্ষিত থাকে। এর মানে হলো, যদি প্রথম উপাদানটি মেমরি অ্যাড্রেস 1000-এ থাকে, তবে পরবর্তী (একই টাইপের) উপাদানটি ঠিক তার পাশেই 1004-এ থাকবে, তার পরেরটি 1008-এ, এবং এভাবেই চলতে থাকবে। কম্পিউটার এই ধরনের ধারাবাহিক মেমরি ব্লকের সাথে কাজ করতে অত্যন্ত অপ্টিমাইজড। একে প্রায়শই "ক্যাশ-ফ্রেন্ডলি" (cache-friendly) বলা হয়।

  * **Python `list`**: একটি লিস্ট তার আসল ডেটা আইটেমগুলো ধারাবাহিকভাবে সংরক্ষণ করে না। পরিবর্তে, এটি মেমরির বিভিন্ন স্থানে ছড়িয়ে ছিটিয়ে থাকা অবজেক্টগুলোর **পয়েন্টার (pointers)** সংরক্ষণ করে। পরবর্তী আইটেমটি অ্যাক্সেস করার জন্য, প্রোগ্রামকে সেই পয়েন্টার অনুসরণ করে তাকে খুঁজে বের করতে হয়, যা একটি অতিরিক্ত ধাপ এবং প্রক্রিয়াটিকে ধীর করে দেয়।

-----

## **ভেক্টরাইজেশন এবং SIMD(Single Instruction Multiple Data)-এর শক্তি**

এই দুটি বৈশিষ্ট্য—সমজাতীয় টাইপ এবং ধারাবাহিক মেমরি—একটি শক্তিশালী প্রোগ্রামিং কৌশলকে সম্ভব করে তোলে, যার নাম **ভেক্টরাইজেশন (vectorization)**।

**ভেক্টরাইজেশন** হলো `for` লুপ ব্যবহার করে এক এক করে উপাদানের উপর কাজ না করে, একবারে পুরো অ্যারের উপর অপারেশন চালানো।

উদাহরণস্বরূপ, একটি লিস্টের প্রতিটি উপাদানকে 5 দিয়ে গুণ করতে, আপনাকে একটি লুপ লিখতে হবে:

```python
my_list = [1, 2, 3, 4, 5]
for i in range(len(my_list)):
    my_list[i] = my_list[i] * 5
```

কিন্তু NumPy ব্যবহার করে, আপনি এই কাজটি একটিমাত্র লাইনে পুরো অ্যারের উপর করতে পারেন:

```python
import numpy as np
my_array = np.array([1, 2, 3, 4, 5])
my_array = my_array * 5 # এটাই ভেক্টরাইজেশন!
```

এটি সম্ভব কারণ NumPy পুরো ধারাবাহিক ডেটা ব্লকটিকে অত্যন্ত অপ্টিমাইজড এবং প্রি-কম্পাইলড C কোডের কাছে পাঠাতে পারে। এই C কোডটি আধুনিক CPU-এর **SIMD (Single Instruction, Multiple Data)**-এর মতো ফিচার ব্যবহার করতে পারে। SIMD একটিমাত্র CPU নির্দেশকে (যেমন, "5 দ্বারা গুণ করো") একই সময়ে একাধিক ডেটা উপাদানের উপর প্রয়োগ করতে দেয়, যার ফলে গতি বৃদ্ধি পায়।

-----

## **NumPy আর কী কী কাজে ব্যবহৃত হয়? 🧑‍🔬**

এর গতি এবং কার্যকারিতার কারণে, NumPy সায়েন্টিফিক পাইথন ইকোসিস্টেমের ভিত্তি। এটি `ndarray`-এর উপর কাজ করার জন্য উচ্চ-স্তরের গাণিতিক ফাংশনের একটি বিশাল লাইব্রেরি সরবরাহ করে, যার মধ্যে রয়েছে:

  * **রৈখিক বীজগণিত (Linear Algebra)**: ম্যাট্রিক্স গুণ, ডিটারমিন্যান্ট, রৈখিক সমীকরণ সমাধান এবং আরও অনেক কিছু।
  * **পরিসংখ্যান (Statistics)**: গড় (mean), মধ্যক (median), স্ট্যান্ডার্ড ডেভিয়েশন (standard deviation) ইত্যাদি গণনা করা।
  * **ফুরিয়ার ট্রান্সফর্ম** এবং শেপ ম্যানিপুলেশনের জন্য বিভিন্ন রুটিন।
  * এটি অন্যান্য প্রধান লাইব্রেরি যেমন **Pandas**, **SciPy**, এবং **Scikit-learn**-এর মূল ডেটা স্ট্রাকচার হিসাবে কাজ করে।

# **The NumPy `ndarray` and its Attributes**

As we've learned, the core of NumPy is the **`ndarray`** (N-dimensional array). It's a collection of one or more items of the **same data type**.

Let's first understand the problem it solves by looking at a standard Python list.

-----

## **The Problem with Python Lists**

If you try to perform a mathematical operation like multiplication on a list, it doesn't behave as you might expect for numerical tasks.

```python
# A standard Python list
arr_list = [1, 2, 3]

# Multiplying the list by 5
print(arr_list * 5)
```

**Output:** `[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]`

Instead of multiplying each element by 5, Python **duplicates the list** 5 times. To get the desired result, you need to use a loop or list comprehension, which is slower for large datasets.

```python
# Using a loop to multiply each item
multiplied_list = [item * 5 for item in arr_list]
print(multiplied_list)
```

**Output:** `[5, 10, 15]`

-----

## **NumPy Arrays: The Solution ✨**

NumPy arrays allow you to perform these operations directly on the entire array. This is called **vectorization**, and it uses low-level features like **SIMD** to execute the operation on all elements at once, making it incredibly fast.

### **Creating a NumPy Array**

First, we need to import the NumPy package. The standard convention is to import it as `np`.

```python
import numpy as np

# Creating a NumPy array from a list
arr1 = np.array([1, 2, 3])

print(arr1 * 5)
print(type(arr1))
```

**Output:**

```
[ 5 10 15]
<class 'numpy.ndarray'>
```

-----

## **Dimensions in NumPy Arrays**

NumPy arrays can have any number of dimensions.

### **1D Array (Vector)**

A 1D array is the simplest form, like a single list.

```python
arr1 = np.array([1, 2, 3])
```

### **2D Array (Matrix)**

A 2D array is like a table with rows and columns. It's essentially an array of arrays.

```python
arr2 = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
```

### **3D Array (Tensor)**

A 3D array can be visualized as a **collection of 2D arrays (matrices)** stacked on top of each other. This is very common in areas like image processing, where an image can be represented as three 2D arrays: one for the Red channel, one for Green, and one for Blue.

You can think of it as having **depth (or layers), rows, and columns**.

```python
arr3 = np.array([
    # First Layer (or Matrix)
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    # Second Layer (or Matrix)
    [
      [7, 8, 9],
      [10, 11, 12]
    ]
])
```

-----

## **Key Array Attributes**

You can inspect the properties of an `ndarray` using its attributes.

### **`.ndim`**

This attribute tells you the **number of dimensions** (or axes) of the array.

```python
print(f"arr1 dimensions: {arr1.ndim}") # Output: 1
print(f"arr2 dimensions: {arr2.ndim}") # Output: 2
print(f"arr3 dimensions: {arr3.ndim}") # Output: 3
```

### **`.shape`**

This attribute returns a **tuple** representing the size of the array in each dimension. It's one of the most important attributes.

```python
print(f"arr1 shape: {arr1.shape}")
print(f"arr2 shape: {arr2.shape}")
print(f"arr3 shape: {arr3.shape}")
```

**Output:**

```
arr1 shape: (3,)
arr2 shape: (2, 3)
arr3 shape: (2, 2, 3)
```

**How to read the shape tuple:**

  * `(3,)`: This is a **1D array** with **3 elements** along its single axis.
  * `(2, 3)`: This is a **2D array** with **2 rows** and **3 columns**.
  * `(2, 2, 3)`: This is a **3D array**. You can read it from left to right: It has **2 layers/matrices**. Each matrix has **2 rows** and **3 columns**.

### **`.size`**

This attribute gives you the **total number of elements** in the array. It's simply the product of the numbers in the shape tuple.

```python
print(f"arr1 size: {arr1.size}") # Output: 3
print(f"arr2 size: {arr2.size}") # Output: 2 * 3 = 6
print(f"arr3 size: {arr3.size}") # Output: 2 * 2 * 3 = 12
```

-----

### **`.dtype`**

The **`.dtype`** (data type) attribute is crucial. It tells you exactly what kind of data is stored inside the NumPy array. Since every element in a NumPy array must be of the **same type**, this attribute defines the type for the entire array.

This uniformity is a cornerstone of NumPy's efficiency. Knowing the exact data type allows NumPy to store the data in a compact, predictable way and use optimized, low-level functions for computation.

-----

### **How NumPy Determines `dtype`**

When you create a NumPy array without specifying a type, NumPy **infers** the most suitable `dtype` from the input data.

  * If you provide only integers, it will choose an integer type (like `int64`).
  * If you include even one floating-point number, it will promote the entire array to a float type (like `float64`) to avoid losing information.

Let's look at the arrays we created earlier, which all contained only integers:

```python
import numpy as np

# Let's redefine our arrays for clarity
arr1 = np.array([1, 2, 3])
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
arr3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

print(f"arr1 dtype: {arr1.dtype}")
print(f"arr2 dtype: {arr2.dtype}")
print(f"arr3 dtype: {arr3.dtype}")
```

**Expected Output:**

```
arr1 dtype: int64
arr2 dtype: int64
arr3 dtype: int64
```

*(Note: The output might be `int32` on some systems, but `int64` is common. It refers to a 64-bit integer.)*

-----

### **Specifying `dtype` Manually ✍️**

You can also explicitly tell NumPy what data type to use during creation. This is useful for controlling memory usage or ensuring precision.

```python
# Create an array of 64-bit floating-point numbers
float_arr = np.array([1, 2, 3], dtype=np.float64)

print(f"Original array: {arr1}, dtype: {arr1.dtype}")
print(f"New float array: {float_arr}, dtype: {float_arr.dtype}")
```

**Output:**

```
Original array: [1 2 3], dtype: int64
New float array: [1. 2. 3.], dtype: float64
```

Notice how NumPy added a decimal point to the numbers in `float_arr` to show they are now floats.

In [None]:
arr = [1,2,3]
print(arr*5) # it not multipy 5 on it. It duplicate this array to 5 times
# for multiplying 5 with each item we need loop which slower the operaton
arr = [i*5 for i in arr]
print(arr)

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]
[5, 10, 15]


But when we use numpy array which SIMD to allow to one single operation multipy all item with value

In [None]:
import numpy as np
arr = np.array([1,2,3])
print(arr*5)

[ 5 10 15]


## **NumPy `ndarray` এবং এর অ্যাট্রিবিউটসমূহ**

আমরা আগেই জেনেছি যে NumPy-এর মূল ভিত্তি হলো **`ndarray`** (N-dimensional array)। এটি **একই ডেটা টাইপের** এক বা একাধিক আইটেমের একটি কালেকশন।

প্রথমে চলুন দেখি, এটি কোন সমস্যার সমাধান করে এবং সাধারণ পাইথন লিস্টের সাথে এর পার্থক্য কোথায়।

-----

## **পাইথন লিস্টের সমস্যা**

আপনি যদি একটি সাধারণ পাইথন লিস্টের উপর গুণ করার মতো গাণিতিক অপারেশন করতে চান, তবে এটি নিউমেরিক্যাল কাজের জন্য প্রত্যাশিত আচরণ করে না।

```python
# একটি সাধারণ পাইথন লিস্ট
arr_list = [1, 2, 3]

# লিস্টকে 5 দিয়ে গুণ করা হলো
print(arr_list * 5)
```

**আউটপুট:** `[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]`

এখানে প্রতিটি উপাদানকে 5 দিয়ে গুণ না করে, পাইথন লিস্টটিকে 5 বার **ডুপ্লিকেট** বা পুনরাবৃত্তি করেছে। কাঙ্ক্ষিত ফলাফল পেতে, আপনাকে একটি লুপ বা লিস্ট কম্প্রিহেনশন ব্যবহার করতে হবে, যা বড় ডেটাসেটের জন্য ধীরগতির।

```python
# প্রতিটি আইটেমকে গুণ করার জন্য লুপ ব্যবহার
multiplied_list = [item * 5 for item in arr_list]
print(multiplied_list)
```

**আউটপুট:** `[5, 10, 15]`

-----

## **NumPy অ্যারে: সমাধান ✨**

NumPy অ্যারে আপনাকে এই ধরনের অপারেশন সরাসরি পুরো অ্যারের উপর করতে দেয়। একে **ভেক্টরাইজেশন (vectorization)** বলা হয় এবং এটি **SIMD**-এর মতো নিম্ন-স্তরের ফিচার ব্যবহার করে সব উপাদানের উপর একই সাথে অপারেশন চালায়, যা এটিকে অবিশ্বাস্যভাবে দ্রুত করে তোলে।

### **NumPy অ্যারে তৈরি করা**

প্রথমে, আমাদের NumPy প্যাকেজটি ইম্পোর্ট করতে হবে। সাধারণত এটিকে `np` হিসেবে ইম্পোর্ট করা হয়।

```python
import numpy as np

# একটি লিস্ট থেকে NumPy অ্যারে তৈরি করা
arr1 = np.array([1, 2, 3])

print(arr1 * 5)
print(type(arr1))
```

**আউটপুট:**

```
[ 5 10 15]
<class 'numpy.ndarray'>
```

-----

## **NumPy অ্যারেতে ডাইমেনশন (Dimension)**

NumPy অ্যারে যেকোনো সংখ্যক ডাইমেনশনের হতে পারে।

### **1D অ্যারে (ভেক্টর)**

1D অ্যারে হলো সবচেয়ে সহজ রূপ, যা একটি সাধারণ লিস্টের মতো।

```python
arr1 = np.array([1, 2, 3])
```

### **2D অ্যারে (ম্যাট্রিক্স)**

একটি 2D অ্যারে হলো সারি (row) এবং কলাম (column) সহ একটি টেবিলের মতো। এটি মূলত একটি অ্যারের ভিতরে থাকা একাধিক অ্যারে।

```python
arr2 = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
```

### **3D অ্যারে (টেনসর)**

একটি 3D অ্যারে-কে কয়েকটি **2D অ্যারের (ম্যাট্রিক্স)** একটি স্ট্যাক বা floor হিসাবে কল্পনা করা যেতে পারে। এটি ইমেজ প্রসেসিং-এর মতো ক্ষেত্রে খুব সাধারণ, যেখানে একটি ছবিকে তিনটি 2D অ্যারে হিসাবে প্রকাশ করা হয়: একটি লাল (Red) চ্যানেলের জন্য, একটি সবুজ (Green) চ্যানেলের জন্য এবং একটি নীল (Blue) চ্যানেলের জন্য।

আপনি এটিকে **গভীরতা (depth), সারি (row) এবং কলাম (column)** হিসেবে ভাবতে পারেন।

```python
arr3 = np.array([
    # প্রথম স্তর (বা ম্যাট্রিক্স)
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    # দ্বিতীয় স্তর (বা ম্যাট্রিক্স)
    [
      [7, 8, 9],
      [10, 11, 12]
    ]
])
```

-----

## **অ্যারের কিছু গুরুত্বপূর্ণ অ্যাট্রিবিউট**

আপনি একটি `ndarray`-এর বৈশিষ্ট্যগুলো তার অ্যাট্রিবিউট ব্যবহার করে জানতে পারেন।

### **`.ndim`**

এই অ্যাট্রিবিউটটি অ্যারের **ডাইমেনশন সংখ্যা** (বা অক্ষের সংখ্যা) দেখায়।

```python
print(f"arr1 ডাইমেনশন: {arr1.ndim}") # আউটপুট: 1
print(f"arr2 ডাইমেনশন: {arr2.ndim}") # আউটপুট: 2
print(f"arr3 ডাইমেনশন: {arr3.ndim}") # আউটপুট: 3
```

### **`.shape`**

এই অ্যাট্রিবিউটটি একটি **টাপল (tuple)** রিটার্ন করে যা প্রতিটি ডাইমেনশনে অ্যারের আকার দেখায়। এটি সবচেয়ে গুরুত্বপূর্ণ অ্যাট্রিবিউটগুলোর মধ্যে একটি।

```python
print(f"arr1-এর শেপ: {arr1.shape}")
print(f"arr2-এর শেপ: {arr2.shape}")
print(f"arr3-এর শেপ: {arr3.shape}")
```

**আউটপুট:**

```
arr1-এর শেপ: (3,)
arr2-এর শেপ: (2, 3)
arr3-এর শেপ: (2, 2, 3)
```

**শেপ টাপলটি কীভাবে পড়বেন:**

  * `(3,)`: এটি একটি **1D অ্যারে** যার একটিমাত্র অক্ষে **3টি উপাদান** আছে।
  * `(2, 3)`: এটি একটি **2D অ্যারে** যার **2টি সারি (row)** এবং **3টি কলাম (column)** আছে।
  * `(2, 2, 3)`: এটি একটি **3D অ্যারে**। এটিকে বাম থেকে ডানে পড়ুন: এতে **2টি স্তর/ম্যাট্রিক্স** আছে। প্রতিটি ম্যাট্রিক্সে **2টি সারি** এবং **3টি কলাম** আছে।

### **`.size`**

এই অ্যাট্রিবিউটটি অ্যারের **মোট উপাদান সংখ্যা** দেখায়। এটি শেপ টাপলের সংখ্যাগুলোর গুণফল।

```python
print(f"arr1-এর সাইজ: {arr1.size}") # আউটপুট: 3
print(f"arr2-এর সাইজ: {arr2.size}") # আউটপুট: 2 * 3 = 6
print(f"arr3-এর সাইজ: {arr3.size}") # আউটপুট: 2 * 2 * 3 = 12
```
___

### **`.dtype`**

**`.dtype`** (data type) অ্যাট্রিবিউটটি অত্যন্ত গুরুত্বপূর্ণ। এটি আপনাকে বলে দেয় যে NumPy অ্যারের ভিতরে ঠিক কোন ধরনের ডেটা সংরক্ষণ করা আছে। যেহেতু একটি NumPy অ্যারের প্রতিটি উপাদান অবশ্যই **একই ধরনের** হতে হবে, তাই এই অ্যাট্রিবিউটটি পুরো অ্যারের জন্য সেই টাইপটি নির্ধারণ করে।

এই সমজাতীয়তাই হলো NumPy-এর কার্যকারিতার মূল ভিত্তি। সঠিক ডেটা টাইপ জানার ফলে NumPy ডেটাগুলোকে একটি সুসংগঠিত উপায়ে সংরক্ষণ করতে পারে এবং গণনার জন্য অপ্টিমাইজড, নিম্ন-স্তরের ফাংশন ব্যবহার করতে পারে।

-----

### **NumPy কীভাবে `dtype` নির্ধারণ করে**

আপনি যখন কোনো টাইপ উল্লেখ না করে একটি NumPy অ্যারে তৈরি করেন, তখন NumPy ইনপুট ডেটা থেকে সবচেয়ে উপযুক্ত **`dtype` অনুমান (infer)** করে নেয়।

  * আপনি যদি শুধু পূর্ণসংখ্যা (integer) দেন, তবে এটি একটি ইন্টিজার টাইপ (যেমন `int64`) বেছে নেবে।
  * আপনি যদি একটিও ফ্লোটিং-পয়েন্ট নম্বর (দশমিক সংখ্যা) অন্তর্ভুক্ত করেন, তবে এটি ডেটার Verlust এড়াতে পুরো অ্যারেটিকে একটি ফ্লোট টাইপে (যেমন `float64`) রূপান্তর করবে।

চলুন আমাদের আগে তৈরি করা অ্যারেগুলো দেখি, যেগুলোতে শুধুমাত্র ইন্টিজার ছিল:

```python
import numpy as np

# স্বচ্ছতার জন্য আমাদের অ্যারেগুলো আবার লিখি
arr1 = np.array([1, 2, 3])
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
arr3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

print(f"arr1-এর dtype: {arr1.dtype}")
print(f"arr2-এর dtype: {arr2.dtype}")
print(f"arr3-এর dtype: {arr3.dtype}")
```

**প্রত্যাশিত আউটপুট:**

```
arr1-এর dtype: int64
arr2-এর dtype: int64
arr3-এর dtype: int64
```

*(দ্রষ্টব্য: কিছু সিস্টেমে আউটপুট `int32` হতে পারে, তবে `int64` বেশি প্রচলিত। এটি একটি 64-বিটের ইন্টিজার বোঝায়।)*

-----

### **`dtype` নিজে নির্দিষ্ট করা ✍️**

আপনি অ্যারে তৈরির সময় NumPy-কে ডেটা টাইপ কী হবে তা স্পষ্টভাবে বলে দিতে পারেন। মেমরি ব্যবহার নিয়ন্ত্রণ করতে বা গণনার সঠিকতা নিশ্চিত করার জন্য এটি খুব দরকারি।

```python
# 64-বিট ফ্লোটিং-পয়েন্ট নম্বরের একটি অ্যারে তৈরি করা
float_arr = np.array([1, 2, 3], dtype=np.float64)

print(f"আসল অ্যারে: {arr1}, dtype: {arr1.dtype}")
print(f"নতুন ফ্লোট অ্যারে: {float_arr}, dtype: {float_arr.dtype}")
```

**আউটপুট:**

```
আসল অ্যারে: [1 2 3], dtype: int64
নতুন ফ্লোট অ্যারে: [1. 2. 3.], dtype: float64
```

লক্ষ্য করুন, `float_arr`-এর সংখ্যাগুলোকে ফ্লোট হিসেবে দেখানোর জন্য NumPy কীভাবে তাদের সাথে একটি দশমিক বিন্দু যোগ করেছে।

In [None]:
import numpy as np
arr1 = np.array([1, 2, 3])
print(arr1)
print()

arr2 = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
print(arr2)
print()

arr3 = np.array([
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    [
      [7, 8, 9],
      [10, 11, 12]
    ],
])
print(arr3)
print()

# Types of Array
print(type(arr1))
print(type(arr2))
print(type(arr3))

[1 2 3]

[[1 2 3]
 [4 5 6]]

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]

<class 'numpy.ndarray'>
<class 'numpy.ndarray'>
<class 'numpy.ndarray'>


### **Attributes**

In [None]:
print(arr1.ndim)
print(arr2.ndim)
print(arr3.ndim)

1
2
3


In [None]:
print(arr1.shape)
print(arr2.shape)
print(arr3.shape)

(3,)
(2, 3)
(2, 2, 3)


In [None]:
print(arr1.dtype)
print(arr2.dtype)
print(arr3.dtype)

int64
int64
int64


In [None]:
print(arr1.size)
print(arr2.size)
print(arr3.size)

3
6
12


# **NumPy Data Types: Upcasting and Type Control**

NumPy's efficiency comes from its strict, uniform data types. When you create an array, NumPy has a smart system for deciding the `dtype` for you, a process called **upcasting**.

-----

## **Automatic Type Inference: The Rule of Upcasting 🧠**

NumPy's primary rule is: **never lose information**. It will automatically "upcast" the data type of the entire array to the most general or precise type present in the input data.

1.  **All Integers → Integer Type**
    If all you provide are integers, NumPy creates an integer array. The specific kind (`int32` or `int64`) depends on your computer's operating system architecture (64-bit OS usually defaults to `int64`).

    ```python
    import numpy as np
    arr_i = np.array([1, 2, 3])
    print(arr_i.dtype) # Output: int64 (or int32 on some systems)
    ```

2.  **Integer + Float → Float Type**
    If the array contains even a single floating-point number, NumPy upcasts the *entire array* to a float type to preserve the decimal part.

    ```python
    arr_f = np.array([1, 2.3, 3])
    print(arr_f.dtype) # Output: float64
    ```

3.  **Anything + String → String Type**
    The string is the most general type. If a string is present, everything else is converted to a string.

    ```python
    arr_s = np.array([1, 2.3, "avc"])
    print(arr_s.dtype) # Output: <U32
    ```

    Here, `<U32` means a **Unicode string** with a maximum length of **32 characters**.

-----

## **A Note on Precision: `float32` vs. `float64`**

When NumPy upcasts to a float, it typically defaults to `float64`. This is known as **double-precision**.

  * **Single Precision (`float32`)**: Uses 32 bits of memory. It's faster and uses less memory but is less precise (about 7 decimal digits of precision).
  * **Double Precision (`float64`)**: Uses 64 bits of memory. It's the default because it is much more precise (about 15-16 decimal digits), which is crucial for scientific and financial calculations.

Think of it like a measuring tape. Single precision is like measuring to the nearest millimeter, while double precision is like measuring to the nearest micrometer.

-----

## **Manually Controlling `dtype` (and its Dangers ⚠️)**

You can force a specific `dtype` during array creation, but you must be careful.

### **1. "Safe" but Lossy Downcasting**

You can force a float array to be an integer array. This is considered "downcasting". NumPy will allow it, but it will **truncate** (cut off) the decimal part, leading to data loss.

```python
# The .3 in 2.3 will be lost
arr_downcast = np.array([1, 2.3, 3], dtype=np.int64)
print(arr_downcast)      # Output: [1 2 3]
print(arr_downcast.dtype) # Output: int64
```

### **2. Invalid Conversion Errors**

You cannot downcast when it's impossible. Trying to convert a non-numeric string like `"asd"` into a number will raise a `ValueError`.

```python
# This will cause an error!
# arr_error = np.array([1, 2.3, "asd"], dtype=np.int64)
# ValueError: invalid literal for int() with base 10: 'asd'
```

### **3. Out-of-Range Errors**

Specifying a smaller data type to save memory can be risky. If a value doesn't fit within the range of the specified type, you'll get an `OverflowError`. The range for `int8` is only **-128 to 127**.

```python
# This will cause an error because 422 is too large for int8
# arr_overflow = np.array([1, 2, 422], dtype=np.int8)
# OverflowError: Python int too large to convert to C long
```

-----

## **Changing Type After Creation: `.astype()`**

If you have an existing array, you can create a new copy with a different `dtype` using the `.astype()` method. This is a very common and useful operation.

```python
arr_float = np.array([1.1, 2.7, 3.5])
print(f"Original array: {arr_float}, dtype: {arr_float.dtype}")

# Create a new integer copy
arr_int = arr_float.astype(np.int32)
print(f"New array: {arr_int}, dtype: {arr_int.dtype}")
```

**Output:**

```
Original array: [1.1 2.7 3.5], dtype: float64
New array: [1 2 3], dtype: int32
```

Notice again that the decimal values were **truncated**, not rounded.

## **NumPy ডেটা টাইপ: আপকাস্টিং এবং টাইপ কন্ট্রোল**

NumPy-এর কার্যকারিতার মূলে রয়েছে এর কঠোর এবং অভিন্ন ডেটা টাইপ। আপনি যখন একটি অ্যারে তৈরি করেন, NumPy আপনার জন্য `dtype` নির্ধারণ করার জন্য একটি স্মার্ট সিস্টেম ব্যবহার করে, এই প্রক্রিয়াটিকে **আপকাস্টিং (upcasting)** বলা হয়।

-----

## **স্বয়ংক্রিয় টাইপ নির্ধারণ: আপকাস্টিং-এর নিয়ম 🧠**

NumPy-এর মূল নিয়ম হলো: **কখনোই ডেটা হারানো যাবে না**। এটি ইনপুট ডেটার মধ্যে সবচেয়ে সাধারণ বা সুনির্দিষ্ট (precise) টাইপটিকে বেছে নেয় এবং পুরো অ্যারের ডেটা টাইপকে সেই অনুযায়ী "আপকাস্ট" বা উন্নত করে।

1.  **সব ইন্টিজার → ইন্টিজার টাইপ**
    যদি আপনি শুধু ইন্টিজার দেন, NumPy একটি ইন্টিজার অ্যারে তৈরি করবে। নির্দিষ্ট ধরনটি (`int32` বা `int64`) আপনার কম্পিউটারের অপারেটিং সিস্টেম আর্কিটেকচারের উপর নির্ভর করে (64-বিট OS সাধারণত `int64` ব্যবহার করে)।

    ```python
    import numpy as np
    arr_i = np.array([1, 2, 3])
    print(arr_i.dtype) # আউটপুট: int64 (কিছু সিস্টেমে int32 হতে পারে)
    ```

2.  **ইন্টিজার + ফ্লোট → ফ্লোট টাইপ**
    অ্যারেতে যদি একটিও ফ্লোটিং-পয়েন্ট নম্বর (দশমিক সংখ্যা) থাকে, তবে NumPy দশমিক অংশটি রক্ষা করার জন্য *পুরো অ্যারেটিকে* একটি ফ্লোট টাইপে আপকাস্ট করে।

    ```python
    arr_f = np.array([1, 2.3, 3])
    print(arr_f.dtype) # আউটপুট: float64
    ```

3.  **যেকোনো কিছু + স্ট্রিং → স্ট্রিং টাইপ**
    স্ট্রিং হলো সবচেয়ে সাধারণ টাইপ। যদি একটি স্ট্রিং উপস্থিত থাকে, তবে বাকি সবকিছুকে স্ট্রিং-এ রূপান্তরিত করা হয়।

    ```python
    arr_s = np.array([1, 2.3, "avc"])
    print(arr_s.dtype) # আউটপুট: <U32
    ```

    এখানে `<U32` মানে হলো একটি **ইউনিকোড স্ট্রিং**, যার সর্বোচ্চ দৈর্ঘ্য **32 ক্যারেক্টার** হতে পারে।

-----

## **প্রিসিশন নোট: `float32` বনাম `float64`**

যখন NumPy একটি ফ্লোট টাইপে আপকাস্ট করে, তখন এটি সাধারণত `float64` ব্যবহার করে। এটিকে **ডাবল-প্রিসিশন (double-precision)** বলা হয়।

  * **সিঙ্গেল প্রিসিশন (`float32`)**: 32 বিট মেমরি ব্যবহার করে। এটি দ্রুত এবং কম মেমরি নেয় কিন্তু কম সুনির্দিষ্ট (প্রায় 7 দশমিক স্থান পর্যন্ত নির্ভুল)।
  * **ডাবল প্রিসিশন (`float64`)**: 64 বিট মেমরি ব্যবহার করে। এটি ডিফল্ট কারণ এটি অনেক বেশি সুনির্দিষ্ট (প্রায় 15-16 দশমিক স্থান পর্যন্ত নির্ভুল), যা বৈজ্ঞানিক এবং আর্থিক গণনার জন্য অত্যন্ত গুরুত্বপূর্ণ।

-----

## **`dtype` নিজে নিয়ন্ত্রণ করা (এবং এর বিপদ ⚠️)**

আপনি অ্যারে তৈরির সময় একটি নির্দিষ্ট `dtype` জোর করে সেট করতে পারেন, তবে আপনাকে সতর্ক থাকতে হবে।

### **১. "নিরাপদ" কিন্তু ডেটা হারানো ডাউনকাস্টিং**

আপনি একটি ফ্লোট অ্যারে-কে ইন্টিজার অ্যারেতে রূপান্তর করতে পারেন। একে "ডাউনকাস্টিং" বলা হয়। NumPy এটি করতে দেবে, কিন্তু এটি দশমিক অংশটি **ট্রাঙ্কেট (truncate)** বা কেটে ফেলবে, যার ফলে ডেটা হারিয়ে যাবে।

```python
# 2.3 এর .3 অংশটি হারিয়ে যাবে
arr_downcast = np.array([1, 2.3, 3], dtype=np.int64)
print(arr_downcast)      # আউটপুট: [1 2 3]
print(arr_downcast.dtype) # আউটপুট: int64
```

### **২. ValueError**

যখন রূপান্তর অসম্ভব, তখন আপনি ডাউনকাস্ট করতে পারবেন না। `"asd"`-এর মতো একটি নন-নিউমেরিক স্ট্রিংকে নম্বরে রূপান্তর করার চেষ্টা করলে একটি `ValueError` দেখাবে।

```python
# এটি এরর দেবে!
# arr_error = np.array([1, 2.3, "asd"], dtype=np.int64)
# ValueError: invalid literal for int() with base 10: 'asd'
```

### **৩. OverflowError**

মেমরি বাঁচানোর জন্য ছোট ডেটা টাইপ নির্দিষ্ট করা ঝুঁকিপূর্ণ হতে পারে। যদি কোনো মান নির্দিষ্ট টাইপের সীমার মধ্যে না থাকে, তবে আপনি একটি `OverflowError` পাবেন। `int8`-এর সীমা শুধুমাত্র **-128 থেকে 127** পর্যন্ত।

```python
# এটি এরর দেবে কারণ 422 সংখ্যাটি int8-এর জন্য খুব বড়
# arr_overflow = np.array([1, 2, 422], dtype=np.int8)
# OverflowError: Python int too large to convert to C long
```

-----

## **তৈরির পরে টাইপ পরিবর্তন: `.astype()`**

যদি আপনার কাছে একটি অ্যারে থাকে, তবে আপনি `.astype()` মেথড ব্যবহার করে ভিন্ন `dtype` সহ একটি নতুন কপি তৈরি করতে পারেন। এটি একটি খুব সাধারণ এবং দরকারী অপারেশন।

```python
arr_float = np.array([1.1, 2.7, 3.5])
print(f"আসল অ্যারে: {arr_float}, dtype: {arr_float.dtype}")

# একটি নতুন ইন্টিজার কপি তৈরি করা
arr_int = arr_float.astype(np.int32)
print(f"নতুন অ্যারে: {arr_int}, dtype: {arr_int.dtype}")
```

**আউটপুট:**

```
আসল অ্যারে: [1.1 2.7 3.5], dtype: float64
নতুন অ্যারে: [1 2 3], dtype: int32
```

এখানেও লক্ষ্য করুন যে দশমিক মানগুলো রাউন্ড না হয়ে **ট্রাঙ্কেট** বা কেটে ফেলা হয়েছে।

In [None]:
arr = np.array([1,2,3])
print(arr.dtype)

int64


In [None]:
arr = np.array([1.2,2.3,3.5])
print(arr.dtype)

float64


In [None]:
arr_f = np.array([1,2.3,3])
print(arr_f.dtype)

float64


In [None]:
arr_s = np.array([1,2.3,3,"avc"])
print(arr_s.dtype)

<U32


In [None]:

arr_f = np.array([1,2.3,3], dtype=np.uint32)
print(arr_f.dtype)
print(arr_f)

uint32
[1 2 3]


In [None]:
# Throw error
# arr_f = np.array([1,2.3,"asd"],dtype=np.int64)
# print(arr_f.dtype)


In [None]:
arr_f = np.array([1,2.3,3])
print(arr_f.dtype)

arr_f = arr.astype(np.int32)
print(arr_f.dtype)


float64
int32


In [None]:
# show erro
#rr= np.array([1,2,3.5,[1,2,4],"anv"])


In [None]:
arr= np.array([1,2,3.5,"anv"])
print(arr.dtype)

<U32


# **Creating an `ndarray` from Existing Data**

You can easily create NumPy arrays from standard Python data structures like lists, tuples, sets, and dictionaries. However, there are important rules and behaviors to understand for each.

-----

### **1. From a Python `list` 📜**

This is the most common way to create an `ndarray`.

### **1D Lists**

NumPy handles **upcasting** automatically to preserve data. If a list contains a mix of types, NumPy will choose the most general type for the entire array.

```python
import numpy as np

# A float value forces the whole array to be float64
lst = [10, 20, 30, 40, 40.5]
arr = np.array(lst)

print(f"Array: {arr}")
print(f"Dtype: {arr.dtype}")
```

**Output:**

```
Array: [10.  20.  30.  40.  40.5]
Dtype: float64
```

You can manually set the `dtype` during creation or change it later with `.astype()`, but be aware of potential data loss (truncation).

### **2D Lists (Matrices)**

For multi-dimensional arrays, NumPy requires a consistent, **rectangular shape**.

**Rule:** Every inner list must have the **same number of elements**.

```python
# This will cause an error because the lists have different lengths
two_d_list_bad = [
    [1, 2, 3],
    [4, 5, 6, 7] # This list is longer
]
# np.array(two_d_list_bad) -> ValueError
```

### **The `ValueError` from Ragged Arrays ⚠️**

When a list contains a mix of single items and other sequences (like another list), it's called a **"ragged" array**. Modern NumPy will raise a `ValueError` because it cannot create a simple, rectangular grid.

```python
# This is a "ragged" list
mixed_lst = [10,  40.5, True, "hello", [1,2,3]]

# This will raise a ValueError.
# arr = np.array(mixed_lst)
```

**Error:** `ValueError: setting an array element with a sequence.`

**Solution:** You can force this to work by explicitly setting `dtype=object`. This tells NumPy to create a generic container of Python objects, but you **lose all performance benefits** and the ability to do math operations. Use it sparingly.

```python
arr_object = np.array(mixed_lst, dtype=object)
print(f"Object array: {arr_object}, dtype: {arr_object.dtype}")
```

**Output:**

```
Object array: [10 40.5 True 'hello' list([1, 2, 3])], dtype: object
```

-----

## **2. From a Python `tuple` 📦**

Creating an array from a tuple works **exactly like creating one from a list**. All the same rules of upcasting and shape uniformity apply.

```python
mat_tu = (
          (1, 2, 3),
          (4, 5, 6),
          (7, 8, 9)
         )
arr = np.array(mat_tu)

print(f"Array from tuple:\n{arr}")
print(f"Shape: {arr.shape}")
```

**Output:**

```
Array from tuple:
[[1 2 3]
 [4 5 6]
 [7 8 9]]
Shape: (3, 3)
```

-----

## **3. From a Python `set` 🌀**

Directly converting a set to an `ndarray` is problematic. Because sets are **unordered**, NumPy doesn't try to infer a numeric type. Instead, it creates a single-element array of `dtype=object`.

**Solution:** First, convert the set to a **`list`** or **`tuple`**.

```python
st = {1, 2, 3, 4, 5}

# Wrong way - creates an object array
arr_wrong = np.array(st)
print(f"Wrong Way Dtype: {arr_wrong.dtype}") # Output: object

# Correct way
arr_correct = np.array(list(st))
print(f"Correct Way Dtype: {arr_correct.dtype}") # Output: int64
```

To create a 2D array, you can use a set of tuples and convert it to a list first.

```python
st_2d = {(1,2,3), (4,5,6)}
arr_2d_from_set = np.array(list(st_2d))
print(f"\n2D Array from set of tuples:\n{arr_2d_from_set}")
```

-----

## **4. From a Python `dict` 🔑**

A dictionary has a key-value structure, so it cannot be directly converted. You must first extract the `.keys()`, `.values()`, or `.items()` and then convert those to a `list`.

```python
dic = {'a': 10, 'b': 20, 'c': 30}

# Convert keys to an array
keys_arr = np.array(list(dic.keys()))
print(f"Keys Array: {keys_arr}")

# Convert values to an array
values_arr = np.array(list(dic.values()))
print(f"Values Array: {values_arr}")

# Convert items (key-value pairs) to a 2D array
items_arr = np.array(list(dic.items()))
print(f"\nItems Array:\n{items_arr}")
print(f"Items Dtype: {items_arr.dtype}") # Dtype is string due to upcasting
```

**Output:**

```
Keys Array: ['a' 'b' 'c']
Values Array: [10 20 30]

Items Array:
[['a' '10']
 ['b' '20']
 ['c' '30']]
Items Dtype: <U21
```

___


## **বিদ্যমান ডেটা থেকে `ndarray` তৈরি করা**

আপনি পাইথনের সাধারণ ডেটা স্ট্রাকচার যেমন লিস্ট, টুপল, সেট এবং ডিকশনারি থেকে সহজেই NumPy অ্যারে তৈরি করতে পারেন। তবে, প্রতিটির জন্য কিছু গুরুত্বপূর্ণ নিয়ম এবং আচরণ বোঝা প্রয়োজন।

-----

## **১. পাইথন `list` থেকে 📜**

`ndarray` তৈরি করার এটিই সবচেয়ে প্রচলিত উপায়।

### **1D লিস্ট**

ডেটা রক্ষা করার জন্য NumPy স্বয়ংক্রিয়ভাবে **আপকাস্টিং (upcasting)** পরিচালনা করে। যদি একটি লিস্টে বিভিন্ন ধরণের ডেটা মিশ্রিত থাকে, তবে NumPy পুরো অ্যারের জন্য সবচেয়ে সাধারণ টাইপটি বেছে নেয়।

```python
import numpy as np

# একটি ফ্লোট মান পুরো অ্যারেটিকে float64 বানিয়ে দেবে
lst = [10, 20, 30, 40, 40.5]
arr = np.array(lst)

print(f"অ্যারে: {arr}")
print(f"Dtype: {arr.dtype}")
```

**আউটপুট:**

```
অ্যারে: [10.  20.  30.  40.  40.5]
Dtype: float64
```

আপনি অ্যারে তৈরির সময় `dtype` নিজে সেট করতে পারেন অথবা পরে `.astype()` দিয়ে পরিবর্তন করতে পারেন, তবে এতে ডেটা হারানোর (truncation) সম্ভাবনা থাকে।

### **2D লিস্ট (ম্যাট্রিক্স)**

বহুমাত্রিক (multi-dimensional) অ্যারের জন্য NumPy-কে একটি সামঞ্জস্যপূর্ণ, **আয়তক্ষেত্রাকার (rectangular) আকৃতি** প্রয়োজন।

**নিয়ম:** প্রতিটি ভেতরের লিস্টে অবশ্যই **একই সংখ্যক উপাদান** থাকতে হবে।

```python
# এটি এরর দেবে কারণ লিস্টগুলোর দৈর্ঘ্য ভিন্ন
two_d_list_bad = [
    [1, 2, 3],
    [4, 5, 6, 7] # এই লিস্টটি দীর্ঘ
]
# np.array(two_d_list_bad) -> ValueError
```

### **র‍্যাগড অ্যারে (Ragged Arrays) থেকে `ValueError` ⚠️**

যখন একটি লিস্টে একক আইটেম এবং অন্যান্য সিকোয়েন্স (যেমন আরেকটি লিস্ট) মিশ্রিত থাকে, তখন তাকে **"র‍্যাগড" অ্যারে** বলা হয়। আধুনিক NumPy এক্ষেত্রে একটি `ValueError` দেখায় কারণ এটি একটি সহজ, আয়তক্ষেত্রাকার গ্রিড তৈরি করতে পারে না।

```python
# এটি একটি "র‍্যাগড" লিস্ট
mixed_lst = [10,  40.5, True, "hello", [1,2,3]]

# এটি একটি ValueError দেবে
# arr = np.array(mixed_lst)
```

**এরর:** `ValueError: setting an array element with a sequence.`

**সমাধান:** আপনি `dtype=object` স্পষ্টভাবে সেট করে এটি কাজ করাতে পারেন। এটি NumPy-কে পাইথন অবজেক্টগুলোর একটি সাধারণ কন্টেইনার তৈরি করতে বলে, কিন্তু এর ফলে আপনি **পারফরম্যান্সের সমস্ত সুবিধা হারাবেন** এবং গাণিতিক অপারেশন করতে পারবেন না। তাই এটি খুব কম ব্যবহার করা উচিত।

```python
arr_object = np.array(mixed_lst, dtype=object)
print(f"অবজেক্ট অ্যারে: {arr_object}, dtype: {arr_object.dtype}")
```

**আউটপুট:**

```
অবজেক্ট অ্যারে: [10 40.5 True 'hello' list([1, 2, 3])], dtype: object
```

-----

## **২. পাইথন `tuple` থেকে 📦**

একটি টুপল থেকে অ্যারে তৈরি করা **ঠিক একটি লিস্ট থেকে অ্যারে তৈরির মতোই** কাজ করে। আপকাস্টিং এবং আকৃতির সামঞ্জস্যের সমস্ত নিয়ম এখানেও প্রযোজ্য।

```python
mat_tu = (
          (1, 2, 3),
          (4, 5, 6),
          (7, 8, 9)
         )
arr = np.array(mat_tu)

print(f"টুপল থেকে অ্যারে:\n{arr}")
print(f"Shape: {arr.shape}")
```

**আউটপুট:**

```
টুপল থেকে অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 9]]
Shape: (3, 3)
```

-----

## **৩. পাইথন `set` থেকে 🌀**

সরাসরি একটি সেটকে `ndarray`-তে রূপান্তর করা একটি সমস্যা। কারণ সেট **অগোছালো (unordered)**, তাই NumPy একটি নিউমেরিক টাইপ অনুমান করার চেষ্টা করে না। পরিবর্তে, এটি পুরো সেটটিকে ধারণ করে একটি একক-উপাদানের `dtype=object` অ্যারে তৈরি করে।

**সমাধান:** প্রথমে সেটটিকে একটি **`list`** বা **`tuple`**-এ রূপান্তর করুন।

```python
st = {1, 2, 3, 4, 5}

# ভুল পদ্ধতি - একটি অবজেক্ট অ্যারে তৈরি করে
arr_wrong = np.array(st)
print(f"ভুল পদ্ধতির Dtype: {arr_wrong.dtype}") # আউটপুট: object

# সঠিক পদ্ধতি
arr_correct = np.array(list(st))
print(f"সঠিক পদ্ধতির Dtype: {arr_correct.dtype}") # আউটপুট: int64
```

একটি 2D অ্যারে তৈরি করতে, আপনি টুপলের একটি সেট ব্যবহার করতে পারেন এবং প্রথমে সেটিকে একটি লিস্টে রূপান্তর করতে পারেন।

```python
st_2d = {(1,2,3), (4,5,6)}
arr_2d_from_set = np.array(list(st_2d))
print(f"\nটুপলের সেট থেকে 2D অ্যারে:\n{arr_2d_from_set}")
```

-----

## **৪. পাইথন `dict` থেকে 🔑**

একটি ডিকশনারিতে কী-ভ্যালু (key-value) স্ট্রাকচার থাকায় এটিকে সরাসরি রূপান্তর করা যায় না। আপনাকে প্রথমে `.keys()`, `.values()`, বা `.items()` বের করে সেগুলোকে একটি `list`-এ রূপান্তর করতে হবে।

```python
dic = {'a': 10, 'b': 20, 'c': 30}

# কী (keys) থেকে অ্যারে
keys_arr = np.array(list(dic.keys()))
print(f"কী অ্যারে: {keys_arr}")

# ভ্যালু (values) থেকে অ্যারে
values_arr = np.array(list(dic.values()))
print(f"ভ্যালু অ্যারে: {values_arr}")

# আইটেম (items) থেকে 2D অ্যারে
items_arr = np.array(list(dic.items()))
print(f"\nআইটেম অ্যারে:\n{items_arr}")
print(f"আইটেম Dtype: {items_arr.dtype}") # আপকাস্টিং-এর কারণে Dtype স্ট্রিং হবে
```

**আউটপুট:**

```
কী অ্যারে: ['a' 'b' 'c']
ভ্যালু অ্যারে: [10 20 30]

আইটেম অ্যারে:
[['a' '10']
 ['b' '20']
 ['c' '30']]
আইটেম Dtype: <U21
```

In [None]:
import numpy as np

lst = [10, 20, 30, 40, 40.5]
arr = np.array(lst)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

# arr = arr.astype(np.int32)
# print(arr.dtype)

<class 'numpy.ndarray'>
float64
1
int32


In [None]:
lst = [10, 20, 30, 40, 40.5]
arr = np.array(lst, dtype=np.int32)
print(type(arr))
print(arr.dtype)

<class 'numpy.ndarray'>
int32


In [None]:
mixed_lst = [10,  40.5, True, "hello"]
arr = np.array(mixed_lst)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

<class 'numpy.ndarray'>
<U32
1


In [None]:
#ValueError
# mixed_lst = [10,  40.5, True, "hello", [1,2,3]]
# arr = np.array(mixed_lst)

In [None]:
two_d_list = [
    [1, 2, 3],
    [4, 5, 6]
]

arr = np.array(two_d_list)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

<class 'numpy.ndarray'>
int64
2


In [None]:
# ValueError
# two_d_list = [
#     [1, 2, 3],
#     [4, 5, 6, 7]
# ]
# two_d_array = np.array(two_d_list)

In [None]:
tu = (1,2,3)
arr = np.array(tu)
print(arr)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

[1 2 3]
<class 'numpy.ndarray'>
int64
1


In [None]:
mat_tu = (
          (1,2,3),
          (4,5,6),
          (7,8,9)
          )
arr = np.array(mat_tu)
print(arr)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
<class 'numpy.ndarray'>
int64
2


In [None]:
mat_tu = (
          (1,2,3),
          (4,5,6),
          (7,8,9)
          )
arr = np.array(mat_tu, dtype=np.int32)
print(arr)
print(type(arr))
print(arr.dtype)
print(arr.ndim)

arr = arr.astype(np.int8)
print(arr.dtype)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
<class 'numpy.ndarray'>
int32
2
int8


In [None]:
# st = {1,2,3,4,5}
# arr = np.array(st, dtype=np.int32)

In [None]:
st = {1,2,3,4,5}
arr = np.array(st)
print(arr)
print(type(arr))
print(arr.dtype)


{1, 2, 3, 4, 5}
<class 'numpy.ndarray'>
object


In [None]:
st = {1,2,3,4,5}
arr = np.array(list(st), dtype=np.int32)
print(arr)
print(type(arr))
print(arr.dtype)


[1 2 3 4 5]
<class 'numpy.ndarray'>
int32


In [None]:
st_2d = {(1,2,3),(4,5,6)}
arr = np.array(list(st_2d))
print(arr)
print(type(arr))
print(arr.dtype)

[[1 2 3]
 [4 5 6]]
<class 'numpy.ndarray'>
int8


In [None]:
dic = {'a':10, 'b':20, 'c':30}
keys = dic.keys()

values = dic.values()

key_value = dic.items()

# It not possible directly
keys_arr = np.array(keys)
print(keys_arr.dtype) #object

# firstly we need to convert list or tuple then make ndarry
keys_arr = np.array(list(keys))
print(keys_arr.dtype) #int64
print(keys_arr)
print()

values_arr = np.array(list(values))
print(values_arr.dtype) #int64
print(values_arr)
print()

key_value_arr = np.array(list(key_value))
print(key_value_arr.dtype) #object
print(key_value_arr)



object
<U1
['a' 'b' 'c']

int64
[10 20 30]

<U21
[['a' '10']
 ['b' '20']
 ['c' '30']]


# **Creating an `ndarray` From Scratch**

NumPy provides several convenient functions to create arrays from scratch without needing an existing Python data structure. These are highly efficient for initializing arrays of a specific size with placeholder values.

-----

## **1. `np.zeros` and `np.zeros_like`**

The `np.zeros()` function creates an array of a given shape, filling it entirely with **zeros**.

  * **Default `dtype`**: By default, the array is filled with floating-point zeros (`0.`) and has a `dtype` of `float64`.
  * **Shape**: The first argument is the shape, provided as an integer for 1D arrays or a tuple for multi-dimensional arrays.

<!-- end list -->

```python
import numpy as np

# 1D array of zeros (float by default)
arr_1d = np.zeros(3)
print(f"1D Zeros:\n{arr_1d}\nDtype: {arr_1d.dtype}\n")

# 2D array of zeros, with dtype specified as integer
arr_2d = np.zeros((2, 3), dtype=np.int32)
print(f"2D Integer Zeros:\n{arr_2d}\nDtype: {arr_2d.dtype}")
```

### **`np.zeros_like()`**

This is a handy function to create a new array of zeros that has the **exact same shape and `dtype`** as an existing array.

```python
arr_existing = np.array([[1, 2], [3, 4]])

arr_zeros_like = np.zeros_like(arr_existing)
print(f"\nZeros array like existing one:\n{arr_zeros_like}")
print(f"Shape: {arr_zeros_like.shape}, Dtype: {arr_zeros_like.dtype}")
```

-----

## **2. `np.ones` and `np.ones_like`**

This works exactly like `np.zeros()`, but it fills the array with **ones** (`1.`) instead.

```python
# 2D array of ones (float by default)
arr_2d_ones = np.ones((2, 3))
print(f"2D Ones:\n{arr_2d_ones}\nDtype: {arr_2d_ones.dtype}\n")

# 3D array of ones using ones_like
arr3_ones_like = np.ones_like(arr_zeros_like) # Using the array from the previous example
print(f"Ones array like the zeros one:\n{arr3_ones_like}")
print(f"Shape: {arr3_ones_like.shape}, Dtype: {arr3_ones_like.dtype}")
```

-----

## **3. `np.empty` and `np.empty_like`**

The `np.empty()` function creates an array of a given shape **without initializing its entries to any particular value**.

**Important Note:** The values you see in an `empty` array are not truly random. They are whatever "garbage" data was already present in that memory location. This function is slightly faster than `zeros` or `ones` and is useful only when you plan to immediately overwrite every element in the array yourself.

```python
# Create a 2x3 empty array. The values will be unpredictable.
arr_empty = np.empty((2, 3))
print(f"Empty Array (values are arbitrary):\n{arr_empty}")
```

-----

## **4. `np.full` and `np.full_like`**

This function gives you more control by allowing you to create an array of a specific shape filled with any **`fill_value`** you choose.

  * **Arguments**: It takes two main arguments: `shape` and `fill_value`.
  * **`dtype` Inference**: NumPy infers the `dtype` from the type of the `fill_value`.

<!-- end list -->

```python
# Create a 2x3 array filled with the integer 5
arr_full_int = np.full((2, 3), 5)
print(f"Full array with integers:\n{arr_full_int}\nDtype: {arr_full_int.dtype}\n")

# Create a 2x3 array filled with boolean True
arr_full_bool = np.full((2, 3), True)
print(f"Full array with booleans:\n{arr_full_bool}\nDtype: {arr_full_bool.dtype}\n")

# Create a 2x3 array filled with infinity
arr_full_inf = np.full((2, 3), np.inf)
print(f"Full array with infinity:\n{arr_full_inf}\nDtype: {arr_full_inf.dtype}\n")
```

The `np.full_like()` variant creates a new array with the shape and `dtype` of an existing array, but fills it with a new specified value.

```python
arr_existing = np.array([[1, 2], [3, 4]])

# Create a new array like arr_existing but filled with -1
arr_full_like = np.full_like(arr_existing, -1)
print(f"Full_like array:\n{arr_full_like}")
```


অবশ্যই\! আপনার জন্য সম্পূর্ণ নোটটি বাংলাতে নিচে দেওয়া হলো।

___

## **Creating an ndarray From Scratch(Bangla)**

বিদ্যমান কোনো পাইথন ডেটা স্ট্রাকচার ছাড়াই শুরু থেকে অ্যারে তৈরি করার জন্য NumPy বেশ কিছু সুবিধাজনক ফাংশন সরবরাহ করে। একটি নির্দিষ্ট আকারের অ্যারে ইনিশিয়ালাইজ করার জন্য এগুলো অত্যন্ত কার্যকর।

-----

## **১. `np.zeros` এবং `np.zeros_like`**

`np.zeros()` ফাংশনটি একটি নির্দিষ্ট আকারের অ্যারে তৈরি করে, যা সম্পূর্ণরূপে **শূন্য (`0`)** দিয়ে পূর্ণ থাকে।

  * **ডিফল্ট `dtype`**: ডিফল্টভাবে, অ্যারেটি ফ্লোটিং-পয়েন্ট শূন্য (`0.`) দিয়ে পূর্ণ থাকে এবং এর `dtype` হয় `float64`।
  * **শেপ (Shape)**: প্রথম আর্গুমেন্ট হলো শেপ, যা 1D অ্যারের জন্য একটি ইন্টিজার বা বহুমাত্রিক (multi-dimensional) অ্যারের জন্য একটি টুপল হিসেবে দেওয়া হয়।

<!-- end list -->

```python
import numpy as np

# 1D শূন্যের অ্যারে (ডিফল্টভাবে ফ্লোট)
arr_1d = np.zeros(3)
print(f"1D Zeros:\n{arr_1d}\nDtype: {arr_1d.dtype}\n")

# 2D শূন্যের অ্যারে, যেখানে dtype ইন্টিজার হিসেবে নির্দিষ্ট করা হয়েছে
arr_2d = np.zeros((2, 3), dtype=np.int32)
print(f"2D Integer Zeros:\n{arr_2d}\nDtype: {arr_2d.dtype}")
```

### **`np.zeros_like()`**

এটি একটি সুবিধাজনক ফাংশন যা একটি নতুন শূন্যের অ্যারে তৈরি করে, যার **শেপ এবং `dtype`** হুবহু বিদ্যমান একটি অ্যারের মতো হয়।

```python
arr_existing = np.array([[1, 2], [3, 4]])

arr_zeros_like = np.zeros_like(arr_existing)
print(f"\nবিদ্যমান অ্যারের মতো শূন্যের অ্যারে:\n{arr_zeros_like}")
print(f"Shape: {arr_zeros_like.shape}, Dtype: {arr_zeros_like.dtype}")
```

-----

## **২. `np.ones` এবং `np.ones_like`**

এটি `np.zeros()`-এর মতোই কাজ করে, কিন্তু এটি অ্যারেটিকে **এক (`1`)** দিয়ে পূর্ণ করে।

```python
# 2D একের অ্যারে (ডিফল্টভাবে ফ্লোট)
arr_2d_ones = np.ones((2, 3))
print(f"2D Ones:\n{arr_2d_ones}\nDtype: {arr_2d_ones.dtype}\n")

# ones_like ব্যবহার করে 3D একের অ্যারে
# আগের উদাহরণ থেকে অ্যারে ব্যবহার করে
arr3_ones_like = np.ones_like(arr_zeros_like)
print(f"শূন্যের অ্যারের মতো একের অ্যারে:\n{arr3_ones_like}")
print(f"Shape: {arr3_ones_like.shape}, Dtype: {arr3_ones_like.dtype}")
```

-----

## **৩. `np.empty` এবং `np.empty_like`**

`np.empty()` ফাংশনটি কোনো নির্দিষ্ট মান দিয়ে উপাদানগুলোকে ইনিশিয়ালাইজ না করেই একটি নির্দিষ্ট আকারের অ্যারে তৈরি করে।

**গুরুত্বপূর্ণ নোট:** একটি `empty` অ্যারেতে যে মানগুলো দেখা যায়, সেগুলো সত্যি সত্যি র‍্যান্ডম নয়। এগুলো হলো সেই মেমরি লোকেশনে আগে থেকে থাকা "গার্বেজ" ডেটা। এই ফাংশনটি `zeros` বা `ones`-এর চেয়ে কিছুটা দ্রুত এবং শুধুমাত্র তখনই উপযোগী যখন আপনি অ্যারের প্রতিটি উপাদানকে உடனடியாக নিজে ওভাররাইট করার পরিকল্পনা করেন।

```python
# একটি 2x3 empty অ্যারে তৈরি করা হলো। এর মানগুলো অনির্ predictable হবে।
arr_empty = np.empty((2, 3))
print(f"Empty Array (মানগুলো ইচ্ছামতো হতে পারে):\n{arr_empty}")
```

-----

## **৪. `np.full` এবং `np.full_like`**

এই ফাংশনটি আপনাকে আপনার পছন্দের যেকোনো **`fill_value`** দিয়ে একটি নির্দিষ্ট আকারের অ্যারে তৈরি করার সুবিধা দেয়।

  * **আর্গুমেন্টস**: এটি দুটি প্রধান আর্গুমেন্ট নেয়: `shape` এবং `fill_value`।
  * **`dtype` অনুমান**: NumPy `fill_value`-এর টাইপ থেকে `dtype` অনুমান করে নেয়।

<!-- end list -->

```python
# ইন্টিজার 5 দিয়ে পূর্ণ একটি 2x3 অ্যারে
arr_full_int = np.full((2, 3), 5)
print(f"ইন্টিজার দিয়ে পূর্ণ অ্যারে:\n{arr_full_int}\nDtype: {arr_full_int.dtype}\n")

# বুলিয়ান True দিয়ে পূর্ণ একটি 2x3 অ্যারে
arr_full_bool = np.full((2, 3), True)
print(f"বুলিয়ান দিয়ে পূর্ণ অ্যারে:\n{arr_full_bool}\nDtype: {arr_full_bool.dtype}\n")

# ইনফিনিটি দিয়ে পূর্ণ একটি 2x3 অ্যারে
arr_full_inf = np.full((2, 3), np.inf)
print(f"ইনফিনিটি দিয়ে পূর্ণ অ্যারে:\n{arr_full_inf}\nDtype: {arr_full_inf.dtype}\n")
```

`np.full_like()` ভেরিয়েন্টটি একটি বিদ্যমান অ্যারের শেপ এবং `dtype` অনুযায়ী একটি নতুন অ্যারে তৈরি করে, কিন্তু সেটিকে একটি নতুন নির্দিষ্ট মান দিয়ে পূর্ণ করে।

```python
arr_existing = np.array([[1, 2], [3, 4]])

# arr_existing-এর মতো একটি নতুন অ্যারে তৈরি করা হলো যা -1 দিয়ে পূর্ণ
arr_full_like = np.full_like(arr_existing, -1)
print(f"Full_like অ্যারে:\n{arr_full_like}")
```

###**np.zeros**

In [None]:
# Make 1d array with value 0
arr = np.zeros(3)
print(arr)
print(arr.dtype) # by default it will be float

[0. 0. 0.]
float64


In [None]:
# Make 2d arrays with value 0
arr = np.zeros((2,3))
print(arr)
print(arr.dtype)

[[0. 0. 0.]
 [0. 0. 0.]]
float64


In [None]:
# make 3d array with value 0
arr = np.zeros((2,3,4))
print(arr)
print(arr.dtype)

[[[0. 0. 0. 0.]
  [0. 0. 0. 0.]
  [0. 0. 0. 0.]]

 [[0. 0. 0. 0.]
  [0. 0. 0. 0.]
  [0. 0. 0. 0.]]]
float64


In [None]:
#we can determine datatype when creaing or after creating to int
arr = np.zeros((3,3), dtype=np.int32)
print(arr)
print(arr.dtype)

[[0 0 0]
 [0 0 0]
 [0 0 0]]
int32


In [None]:
# We can make nd array as like previous array with value 0
arr3 = np.array([
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    [
      [7, 8, 9],
      [10, 11, 12]
    ],
])

print(arr3)
print(arr3.dtype)
print(arr3.ndim)

print()

arr3_zeros = np.zeros_like(arr3)
print(arr3_zeros)
print(arr3_zeros.dtype)
print(arr3_zeros.ndim)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
int64
3

[[[0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]]]
int64
3


### **np.ones**

In [None]:
# Make 1d array with value 1
arr = np.ones(3)
print(arr)
print(arr.dtype) # by default it will be float

[1. 1. 1.]
float64


In [None]:
# Make 2d arrays with value 1
arr = np.ones((2,3))
print(arr)
print(arr.dtype)

[[1. 1. 1.]
 [1. 1. 1.]]
float64


In [None]:
# make 3d array with value 1
arr = np.ones((2,3,4))
print(arr)
print(arr.dtype)

[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]
float64


In [None]:
#we can determine datatype when creaing or after creating to int
arr = np.ones((3,3), dtype=np.int32)
print(arr)
print(arr.dtype)

[[1 1 1]
 [1 1 1]
 [1 1 1]]
int32


In [None]:
# We can make nd array as like previous array with value 0
arr3 = np.array([
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    [
      [7, 8, 9],
      [10, 11, 12]
    ],
])

print(arr3)
print(arr3.dtype)
print(arr3.ndim)

print()

arr3_ones = np.ones_like(arr3)
print(arr3_ones)
print(arr3_ones.dtype)
print(arr3_ones.ndim)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
int64
3

[[[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]]
int64
3


### **np.empty**

In [None]:
# Make 1d array with random value
arr = np.empty(3)
print(arr)
print(arr.dtype) # by default it will be float


[7.74860419e-304 7.74860419e-304 7.74860419e-304]
float64


In [None]:

# Make 2d arrays with random value
arr = np.empty((2,3))
print(arr)
print(arr.dtype)

[[1. 1. 1.]
 [1. 1. 1.]]
float64


In [None]:

# make 3d array with random value
arr = np.empty((2,3,4))
print(arr)
print(arr.dtype)

[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]
float64


In [None]:
#we can determine datatype when creaing or after creating to int
arr = np.empty((3,3), dtype=np.int32)
print(arr)
print(arr.dtype)

[[453752996         0         0]
 [        0        99       116]
 [      108       121  11665408]]
int32


In [None]:
# We can make nd array as like previous array with random value
arr3 = np.array([
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    [
      [7, 8, 9],
      [10, 11, 12]
    ],
])

print(arr3)
print(arr3.dtype)
print(arr3.ndim)

print()

arr3_random = np.empty_like(arr3)
print(arr3_random)
print(arr3_random.dtype)
print(arr3_random.ndim)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
int64
3

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
int64
3


### **np.full**

In [None]:
arr = np.full((2,3), 5)
print(arr)
print(arr.dtype)

[[5 5 5]
 [5 5 5]]
int64


In [None]:
arr = np.full((2,3), True)
print(arr)
print(arr.dtype)

[[ True  True  True]
 [ True  True  True]]
bool


In [None]:
arr = np.full((2,3), np.inf)
print(arr)
print(arr.dtype)

[[inf inf inf]
 [inf inf inf]]
float64


In [None]:
arr3 = np.array([
    [
      [1, 2, 3],
      [4, 5, 6]
    ],
    [
      [7, 8, 9],
      [10, 11, 12]
    ],
], dtype=np.float64)

arr3_full = np.full_like(arr3, np.inf)
print(arr3_full)
print(arr3_full.dtype)
print(arr3_full.ndim)
#

[[[inf inf inf]
  [inf inf inf]]

 [[inf inf inf]
  [inf inf inf]]]
float64
3


# **`ndarray` Generation with Random Values 🎲**

Generating random data is a fundamental task in Machine Learning and Data Science. It's used for creating synthetic datasets, initializing model parameters (like the weights in a neural network), and evaluating model performance through random sampling. NumPy's `random` module provides a powerful suite of tools for this.

-----

## **1. `np.random.rand()`**

This function creates an array of a given shape and populates it with random samples from a **uniform distribution** over the interval **[0, 1)**. This means every number between 0 (inclusive) and 1 (exclusive) has an equal chance of being generated.

**Syntax Note:** Unlike other functions, you pass the dimensions as separate arguments, not as a tuple. `np.random.rand(d0, d1, ...)`

```python
import numpy as np

# Create a 1D array of 4 random floats
arr_1d = np.random.rand(4)
print(f"1D Random Array:\n{arr_1d}\n")

# Create a 2D array (4 rows, 3 columns)
arr_2d = np.random.rand(4, 3)
print(f"2D Random Array:\n{arr_2d}\n")

# Create a 3D array
arr_3d = np.random.rand(2, 4, 3)
print(f"3D Random Array:\n{arr_3d}")
```

The `dtype` of arrays created with `rand()` is always `float64`.

-----

## **2. `np.random.randint()`**

This function generates an array of a given shape filled with random **integers** from a specified range.

**Syntax:** `np.random.randint(low, high=None, size=None)`

  * If only `low` is provided, the range is `[0, low)`.
  * If `low` and `high` are provided, the range is `[low, high)`.
  * `size` is a tuple that defines the shape of the array.

<!-- end list -->

```python
# Generate a 2x3 array with random integers from 0 up to (but not including) 10
arr_int1 = np.random.randint(10, size=(2, 3))
print(f"Random integers in [0, 10):\n{arr_int1}\n")

# Generate a 2x3 array with random integers from 8 up to (but not including) 10
# The only possible values are 8 and 9
arr_int2 = np.random.randint(8, 10, size=(2, 3))
print(f"Random integers in [8, 10):\n{arr_int2}")
```

-----

## **3. `np.random.uniform()`**

This function is similar to `np.random.rand()`, but it allows you to specify a custom range `[low, high)` for your uniformly distributed random **floating-point numbers**.

**Syntax:** `np.random.uniform(low=0.0, high=1.0, size=None)`

```python
# Generate a 2x3 array with random floats from 0.0 up to (but not including) 10.0
arr_uni1 = np.random.uniform(10, size=(2, 3))
print(f"Random floats in [0, 10):\n{arr_uni1}\n")

# Generate a 2x3 array with random floats from 5.0 up to (but not including) 10.0
arr_uni2 = np.random.uniform(5, 10, size=(2, 3))
print(f"Random floats in [5, 10):\n{arr_uni2}")
```
___
# **`ndarray` Generation with Random Values 🎲**

মেশিন লার্নিং এবং ডেটা সায়েন্সে র‍্যান্ডম ডেটা তৈরি করা একটি মৌলিক কাজ। এটি সিন্থেটিক ডেটাসেট তৈরি করতে, মডেলের প্যারামিটার (যেমন একটি নিউরাল নেটওয়ার্কের ওয়েটস) ইনিশিয়ালাইজ করতে এবং র‍্যান্ডম স্যাম্পলিং-এর মাধ্যমে মডেলের পারফরম্যান্স মূল্যায়ন করতে ব্যবহৃত হয়। NumPy-এর `random` মডিউল এর জন্য একটি শক্তিশালী টুলকিট সরবরাহ করে।

-----

## **1. `np.random.rand()`**

এই ফাংশনটি একটি নির্দিষ্ট আকারের অ্যারে তৈরি করে এবং এটিকে **[0, 1)** ব্যবধানের মধ্যে একটি **ইউনিফর্ম ডিস্ট্রিবিউশন** থেকে র‍্যান্ডম স্যাম্পল দিয়ে পূর্ণ করে। এর মানে হলো ০ (অন্তর্ভুক্ত) এবং ১ (ব্যতীত) এর মধ্যে প্রতিটি সংখ্যা তৈরি হওয়ার সমান সম্ভাবনা থাকে।

**সিনট্যাক্স নোট:** অন্যান্য ফাংশনের মতো এখানে শেপ টুপল হিসেবে না দিয়ে, ডাইমেনশনগুলো আলাদা আর্গুমেন্ট হিসেবে পাস করতে হয়। যেমন: `np.random.rand(d0, d1, ...)`

```python
import numpy as np

# ৪টি র‍্যান্ডম ফ্লোট মানের একটি 1D অ্যারে তৈরি
arr_1d = np.random.rand(4)
print(f"1D Random Array:\n{arr_1d}\n")

# একটি 2D অ্যারে তৈরি (৪টি সারি, ৩টি কলাম)
arr_2d = np.random.rand(4, 3)
print(f"2D Random Array:\n{arr_2d}\n")

# একটি 3D অ্যারে তৈরি
arr_3d = np.random.rand(2, 4, 3)
print(f"3D Random Array:\n{arr_3d}")
```

`rand()` দিয়ে তৈরি অ্যারের `dtype` সবসময় `float64` হয়।

-----

## **2. `np.random.randint()`**

এই ফাংশনটি একটি নির্দিষ্ট আকারের অ্যারে তৈরি করে যা একটি নির্দিষ্ট পরিসরের র‍্যান্ডম **পূর্ণসংখ্যা (integers)** দিয়ে পূর্ণ থাকে।

**সিনট্যাক্স:** `np.random.randint(low, high=None, size=None)`

  * যদি শুধু `low` দেওয়া হয়, পরিসর হবে `[0, low)`।
  * যদি `low` এবং `high` উভয়ই দেওয়া হয়, পরিসর হবে `[low, high)`।
  * `size` একটি টুপল যা অ্যারের শেপ নির্ধারণ করে।

<!-- end list -->

```python
# ০ থেকে ১০-এর আগ পর্যন্ত (exclusive) র‍্যান্ডম ইন্টিজার দিয়ে একটি 2x3 অ্যারে তৈরি
arr_int1 = np.random.randint(10, size=(2, 3))
print(f"Random integers in [0, 10):\n{arr_int1}\n")

# ৮ থেকে ১০-এর আগ পর্যন্ত র‍্যান্ডম ইন্টিজার দিয়ে একটি 2x3 অ্যারে তৈরি
# এখানে শুধুমাত্র ৮ এবং ৯ মানগুলোই সম্ভব
arr_int2 = np.random.randint(8, 10, size=(2, 3))
print(f"Random integers in [8, 10):\n{arr_int2}")
```

-----

## **3. `np.random.uniform()`**

এই ফাংশনটি `np.random.rand()`-এর মতোই, কিন্তু এটি আপনাকে ইউনিফর্মলি ডিস্ট্রিবিউটেড র‍্যান্ডম **ফ্লোটিং-পয়েন্ট নম্বরগুলোর** জন্য একটি কাস্টম পরিসর `[low, high)` নির্দিষ্ট করতে দেয়।

**সিনট্যাক্স:** `np.random.uniform(low=0.0, high=1.0, size=None)`

```python
# ০.০ থেকে ১০.০-এর আগ পর্যন্ত র‍্যান্ডম ফ্লোট দিয়ে একটি 2x3 অ্যারে তৈরি
arr_uni1 = np.random.uniform(10, size=(2, 3))
print(f"Random floats in [0, 10):\n{arr_uni1}\n")

# ৫.০ থেকে ১০.০-এর আগ পর্যন্ত র‍্যান্ডম ফ্লোট দিয়ে একটি 2x3 অ্যারে তৈরি
arr_uni2 = np.random.uniform(5, 10, size=(2, 3))
print(f"Random floats in [5, 10):\n{arr_uni2}")
```

In [None]:
# np.random.rand()
# Create 1d array with random value
arr = np.random.rand(4)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

print()
# Create 2d array with random value
arr = np.random.rand(4,3)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)
print()

# Create 3d array with random value
arr = np.random.rand(2,4,3)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

#this value withing 0 to one range all are like equally distributed

[0.47145217 0.77241083 0.32241774 0.59199957]
float64
1
(4,)
float64

[[0.00329412 0.77721725 0.32284827]
 [0.60425329 0.58096305 0.03019702]
 [0.58732095 0.7322091  0.22667302]
 [0.43496581 0.05705622 0.79401279]]
float64
2
(4, 3)
float64

[[[0.27697981 0.84868112 0.99422411]
  [0.65170631 0.68871249 0.86337053]
  [0.29273968 0.29746853 0.47385468]
  [0.20260456 0.357075   0.17417866]]

 [[0.70980134 0.72491354 0.4653913 ]
  [0.5834332  0.64951802 0.42078038]
  [0.6456875  0.00371873 0.51257865]
  [0.36861186 0.91544508 0.53681805]]]
float64
3
(2, 4, 3)
float64


In [None]:
# Make int random array
# np.random.randint(range_with_comma, shape)
arr = np.random.randint(10, size=(2,3)) # Generate a 2x3 array with random integers from 0 up to (but not including) 10
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

print()

# ro we can hardcode the start to end range
arr = np.random.randint(8,10, size=(2,3)) # Generate a 2x3 array with random integers from 8 up to (but not including) 10
# The only possible values are 8 and 9
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

[[7 5 4]
 [9 8 9]]
int64
2
(2, 3)
int64

[[9 8 9]
 [8 8 8]]
int64
2
(2, 3)
int64


In [None]:
# np.random.uniform(range, shape): we can generate random floating value with in range

arr = np.random.uniform(10, size=(2,3)) # Generate a 2x3 array with random floats from 0.0 up to (but not including) 10.0
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)


print()

arr = np.random.uniform(5,10, size=(2,3)) # Generate a 2x3 array with random floats from 5.0 up to (but not including) 10.0
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)


[[5.01441972 9.60172903 7.8263776 ]
 [3.09363797 7.77904901 3.1625865 ]]
float64
2
(2, 3)
float64

[[6.09132681 7.56337183 8.31283609]
 [8.79001311 9.15119675 7.47461772]]
float64
2
(2, 3)
float64


# **`ndarray` Creation from a Range**

Instead of filling an array with a single value or random numbers, you can generate an array with a **sequence of numbers**. These functions are perfect for creating arrays with predictable, ordered data.

-----

## **1. `np.arange()`**

The `np.arange()` function is very similar to Python's built-in `range()` function but returns a NumPy array instead of a list iterator. It generates values within a half-open interval `[start, stop)`.

**Syntax:** `np.arange(start, stop, step)`

  * **`start`**: The starting value of the sequence (inclusive).
  * **`stop`**: The end value of the sequence (**exclusive**).
  * **`step`**: The difference between consecutive values.

<!-- end list -->

```python
import numpy as np

# Create a sequence of numbers from 1 to 10
arr = np.arange(1, 11, 1)
print(f"Array from arange: {arr}\n")

# We can easily reshape the output into a matrix
# Create a sequence from 1 to 9 and reshape it into a 3x3 matrix
matrix = np.arange(1, 10, 1).reshape(3, 3)
print(f"Reshaped matrix:\n{matrix}")
```

-----

## **2. `np.linspace()`**

The `np.linspace()` function (short for **lin**ear **space**) is incredibly useful. It creates an array with a specified number of evenly spaced points over a given interval.

**Key Difference:** Unlike `arange()`, `linspace()` **includes the `stop` value** in the array. You don't specify the step size; you specify how many total points you want, and NumPy calculates the step size for you.

**Syntax:** `np.linspace(start, stop, num)`

  * **`start`**: The starting value (inclusive).
  * **`stop`**: The ending value (**inclusive**).
  * **`num`**: The total number of points to generate.

<!-- end list -->

```python
# Generate 10 evenly spaced points from 1 to 10. The step is 1.0.
arr_10 = np.linspace(1, 10, 10)
print(f"10 points from 1 to 10:\n{arr_10}\n")

# Generate 19 evenly spaced points from 1 to 10. The step is calculated as 0.5.
arr_19 = np.linspace(1, 10, 19)
print(f"19 points from 1 to 10:\n{arr_19}")
```

-----

## **3. `np.logspace()`**

The `np.logspace()` function is the logarithmic equivalent of `linspace()`. It generates numbers that are evenly spaced on a **logarithmic scale**. This is very useful for plotting data that spans several orders of magnitude.

**How it works:** It creates a linear sequence of exponents (using `linspace`) and then raises a `base` to the power of those exponents.

  * **Default Base**: The default base is `10`.

**Syntax:** `np.logspace(start, stop, num, base=10.0)`

```python
# Generate 6 points from 10^0 to 10^5
# The exponents will be [0, 1, 2, 3, 4, 5]
arr_log = np.logspace(0, 5, 6)
print(f"Logspace with base 10:\n{arr_log}\n")

# You can also change the base
# Generate 6 points from 2^0 to 2^5
arr_log_base2 = np.logspace(0, 5, 6, base=2)
print(f"Logspace with base 2:\n{arr_log_base2}")
```

-----


## **`ndarray` Creation from a Range**

একটি অ্যারে শুধুমাত্র একটি নির্দিষ্ট মান বা র‍্যান্ডম সংখ্যা দিয়ে পূর্ণ না করে, আপনি **সংখ্যার ক্রম (sequence)** দিয়েও একটি অ্যারে তৈরি করতে পারেন। এই ফাংশনগুলো পূর্বাভাসযোগ্য, সাজানো ডেটা সহ অ্যারে তৈরির জন্য উপযুক্ত।

-----

## **১. `np.arange()`**

`np.arange()` ফাংশনটি পাইথনের বিল্ট-ইন `range()` ফাংশনের মতোই, কিন্তু এটি একটি লিস্ট ইটারেটরের পরিবর্তে একটি NumPy অ্যারে রিটার্ন করে। এটি একটি অর্ধ-খোলা ব্যবধান `[start, stop)`-এর মধ্যে মান তৈরি করে।

**সিনট্যাক্স:** `np.arange(start, stop, step)`

  * **`start`**: ক্রমের শুরুর মান (অন্তর্ভুক্ত)।
  * **`stop`**: ক্রমের শেষ মান (**ব্যতীত**)।
  * **`step`**: পরপর দুটি মানের মধ্যে পার্থক্য।

<!-- end list -->

```python
import numpy as np

# ১ থেকে ১০ পর্যন্ত সংখ্যার একটি ক্রম তৈরি
arr = np.arange(1, 11, 1)
print(f"arange থেকে তৈরি অ্যারে: {arr}\n")

# আমরা সহজেই আউটপুটটিকে একটি ম্যাট্রিক্সে রিশেপ করতে পারি
# ১ থেকে ৯ পর্যন্ত একটি ক্রম তৈরি করে সেটিকে 3x3 ম্যাট্রিক্সে রিশেপ করা হলো
matrix = np.arange(1, 10, 1).reshape(3, 3)
print(f"রিশেপ করা ম্যাট্রিক্স:\n{matrix}")
```

-----

## **২. `np.linspace()`**

`np.linspace()` ফাংশনটি (**lin**ear **space**-এর সংক্ষিপ্ত রূপ) অত্যন্ত দরকারী। এটি একটি নির্দিষ্ট ব্যবধানে, নির্দিষ্ট সংখ্যক সমদূরবর্তী পয়েন্টসহ একটি অ্যারে তৈরি করে।

**মূল পার্থক্য:** `arange()`-এর বিপরীতে, `linspace()` তার অ্যারেতে **`stop` মানটিকে অন্তর্ভুক্ত করে**। এখানে আপনি ধাপের আকার (step size) নির্দিষ্ট করেন না; বরং আপনি মোট কতগুলো পয়েন্ট চান তা নির্দিষ্ট করেন এবং NumPy আপনার জন্য ধাপের আকার গণনা করে নেয়।

**সিনট্যাক্স:** `np.linspace(start, stop, num)`

  * **`start`**: শুরুর মান (অন্তর্ভুক্ত)।
  * **`stop`**: শেষ মান (**অন্তর্ভুক্ত**)।
  * **`num`**: মোট কতগুলো পয়েন্ট তৈরি করতে হবে।

<!-- end list -->

```python
# ১ থেকে ১০ পর্যন্ত ১০টি সমদূরবর্তী পয়েন্ট তৈরি। এখানে ধাপ হলো ১.০।
arr_10 = np.linspace(1, 10, 10)
print(f"১ থেকে ১০ পর্যন্ত ১০টি পয়েন্ট:\n{arr_10}\n")

# ১ থেকে ১০ পর্যন্ত ১৯টি সমদূরবর্তী পয়েন্ট তৈরি। এখানে ধাপ গণনা করে ০.৫ পাওয়া গেছে।
arr_19 = np.linspace(1, 10, 19)
print(f"১ থেকে ১০ পর্যন্ত ১৯টি পয়েন্ট:\n{arr_19}")
```

-----

## **৩. `np.logspace()`**

`np.logspace()` ফাংশনটি `linspace()`-এর লগারিদমিক সমতুল্য। এটি এমন সংখ্যা তৈরি করে যা একটি **লগারিদমিক স্কেলে** সমদূরবর্তী। যে ডেটা কয়েক অর্ডারের ম্যাগনিচিউড জুড়ে বিস্তৃত থাকে, তা প্লট করার জন্য এটি খুব দরকারী।

**এটি কীভাবে কাজ করে:** এটি প্রথমে এক্সপোনেন্টগুলোর একটি রৈখিক ক্রম (`linspace` ব্যবহার করে) তৈরি করে এবং তারপরে একটি `base`-কে সেই এক্সপোনেন্টগুলোর ঘাতে (power) উন্নীত করে।

  * **ডিফল্ট বেস**: ডিফল্ট বেস হলো `10`।

**সিনট্যাক্স:** `np.logspace(start, stop, num, base=10.0)`

```python
# 10^0 থেকে 10^5 পর্যন্ত ৬টি পয়েন্ট তৈরি
# এক্সপোনেন্টগুলো হবে [0, 1, 2, 3, 4, 5]
arr_log = np.logspace(0, 5, 6)
print(f"বেস ১০ সহ Logspace:\n{arr_log}\n")

# আপনি বেস পরিবর্তনও করতে পারেন
# 2^0 থেকে 2^5 পর্যন্ত ৬টি পয়েন্ট তৈরি
arr_log_base2 = np.logspace(0, 5, 6, base=2)
print(f"বেস ২ সহ Logspace:\n{arr_log_base2}")
```

### **arange**

In [None]:
arr = np.arange(1,11,1)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

[ 1  2  3  4  5  6  7  8  9 10]
int64
1
(10,)
int64


### **reshape**

In [None]:
#Also we can make it 2d array matrix reshape function
arr = np.arange(1,10,1)
matrix = arr.reshape(3,3)
print(matrix)
print(matrix.dtype)
print(matrix.ndim)
print(matrix.shape)
print(matrix.dtype)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
int64
2
(3, 3)
int64


### **linspace**

In [None]:
arr = np.linspace(1,10,10)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)


[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
float64
1
(10,)
float64


In [None]:
arr = np.linspace(1,10,11)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

[ 1.   1.9  2.8  3.7  4.6  5.5  6.4  7.3  8.2  9.1 10. ]
float64
1
(11,)
float64


In [None]:
arr = np.linspace(1,10,19)
print(arr)
print(arr.dtype)
print(arr.ndim)
print(arr.shape)
print(arr.dtype)

[ 1.   1.5  2.   2.5  3.   3.5  4.   4.5  5.   5.5  6.   6.5  7.   7.5
  8.   8.5  9.   9.5 10. ]
float64
1
(19,)
float64


### **logspace**


In [None]:
arr = np.logspace(0,5,6)
print(arr)

[1.e+00 1.e+01 1.e+02 1.e+03 1.e+04 1.e+05]


In [None]:
arr = np.linspace(0,5,10)
print(arr)

print()
arr = np.logspace(0,5,10) # here it doing 10^1, 10^0.55555556 ,  10^1.11111111 so on
print(arr)

[0.         0.55555556 1.11111111 1.66666667 2.22222222 2.77777778
 3.33333333 3.88888889 4.44444444 5.        ]

[1.00000000e+00 3.59381366e+00 1.29154967e+01 4.64158883e+01
 1.66810054e+02 5.99484250e+02 2.15443469e+03 7.74263683e+03
 2.78255940e+04 1.00000000e+05]


In [None]:
# we can also change base here
arr = np.logspace(0,5,6, base=2)
print(arr)

[ 1.  2.  4.  8. 16. 32.]


# **Creating Diagonal and Identity Matrices**

Diagonal and identity matrices are special types of square matrices that are fundamental building blocks in linear algebra and have significant applications in machine learning algorithms.

1.  **Diagonal Matrix**: A square matrix where all the elements are zero except for the elements on the **main diagonal** (where the row index equals the column index).
2.  **Identity Matrix**: A special type of diagonal matrix where all the elements on the main diagonal are **exactly 1**, and all other elements are 0.

-----

## **1. `np.diag()` - Creating a Diagonal Matrix**

The `np.diag()` function is versatile. When you pass it a 1D array-like object (list, tuple, or another NumPy array), it creates a 2D square matrix and places the elements of the input on the main diagonal.

```python
import numpy as np

# Create a diagonal matrix from a list
mat_diag_list = np.diag([1, 2, 3, 4])
print(f"Diagonal matrix from a list:\n{mat_diag_list}\n")
```

**Output:**

```
Diagonal matrix from a list:
[[1 0 0 0]
 [0 2 0 0]
 [0 0 3 0]
 [0 0 0 4]]
```

```python
# Create a diagonal matrix from a 1D NumPy array
mat_diag_arr = np.diag(np.arange(5, 8))
print(f"Diagonal matrix from a NumPy array:\n{mat_diag_arr}")
```

**Output:**

```
Diagonal matrix from a NumPy array:
[[5 0 0]
 [0 6 0]
 [0 0 7]]
```

*(Note: `np.diag()` can also be used to extract the diagonal elements from an existing matrix, making it a dual-purpose function.)*

-----

## **2. `np.eye()` - Creating an Identity Matrix**

The `np.eye()` function is the standard way to create an identity matrix. The name "eye" comes from the pronunciation of the letter "I", which is the mathematical symbol for an identity matrix.

```python
# Create a 3x3 identity matrix
mat_identity = np.eye(3)
print(f"3x3 Identity Matrix:\n{mat_identity}\n")
```

**Output:**

```
3x3 Identity Matrix:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
```

The `eye()` function can also create non-square matrices and allows you to shift the diagonal of ones up or down using the optional `k` parameter.

  * `k=0` (default): Main diagonal.
  * `k > 0`: Shifts the diagonal upwards.
  * `k < 0`: Shifts the diagonal downwards.

<!-- end list -->

```python
# Create a 3x4 matrix with the main diagonal of ones
mat_rect = np.eye(3, 4)
print(f"3x4 matrix with k=0:\n{mat_rect}\n")

# Shift the diagonal up by 1 position (k=1)
mat_up = np.eye(3, 4, k=1)
print(f"3x4 matrix with k=1:\n{mat_up}\n")

# Shift the diagonal down by 1 position (k=-1)
mat_down = np.eye(3, 4, k=-1)
print(f"3x4 matrix with k=-1:\n{mat_down}")
```

**Output:**

```
3x4 matrix with k=0:
[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]]

3x4 matrix with k=1:
[[0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]

3x4 matrix with k=-1:
[[0. 0. 0. 0.]
 [1. 0. 0. 0.]
 [0. 1. 0. 0.]]
```

-----

## **Why are these matrices important in ML? 🤔**

### **Identity Matrix (I)**

Think of the identity matrix as the matrix equivalent of the number **1**. Just as `5 * 1 = 5`, multiplying any compatible matrix **A** by the identity matrix **I** results in **A** (`A * I = A`).

  * **Initialization**: In neural networks, weight matrices are sometimes initialized to be close to an identity matrix. This ensures that, at the start of training, the layer doesn't drastically change the input, providing a stable starting point.
  * **Regularization**: In techniques like **Ridge Regression**, a small multiple of the identity matrix (`λI`) is added to the data's covariance matrix. This helps to make the matrix invertible and prevents the model's parameters from becoming too large, which helps to reduce overfitting.

### **Diagonal Matrix (D)**

Diagonal matrices represent simple **scaling transformations**. When you multiply a vector by a diagonal matrix, each component of the vector is scaled by the corresponding diagonal element. This is a very efficient operation.

  * **Feature Scaling/Standardization**: Operations like standardizing features can be represented by diagonal matrices.
  * **Model Simplification**: In some probabilistic models like the **Gaussian Naive Bayes classifier**, the covariance matrix is assumed to be diagonal. This is a simplifying assumption that means the features are treated as statistically independent, which makes calculations much faster.
  * **Optimization Algorithms**: They appear frequently in the theory behind optimization algorithms and in matrix decomposition methods like **Singular Value Decomposition (SVD)**, where the matrix of singular values (**Σ**) is a diagonal matrix.


----
# **Creating Diagonal and Identity Matrices(Bangla)**

ডায়াগোনাল এবং আইডেন্টিটি ম্যাট্রিক্স হলো বিশেষ ধরনের বর্গ ম্যাট্রিক্স যা রৈখিক বীজগণিতের (linear algebra) মৌলিক অংশ এবং মেশিন লার্নিং অ্যালগরিদমে এদের উল্লেখযোগ্য প্রয়োগ রয়েছে।

1.  **ডায়াগোনাল ম্যাট্রিক্স (Diagonal Matrix)**: একটি বর্গ ম্যাট্রিক্স যেখানে **প্রধান কর্ণ** (main diagonal) বরাবর উপাদানগুলো ছাড়া বাকি সব উপাদান শূন্য থাকে (যেখানে সারি এবং কলামের ইনডেক্স সমান)।
2.  **আইডেন্টিটি ম্যাট্রিক্স (Identity Matrix)**: এটি একটি বিশেষ ধরনের ডায়াগোনাল ম্যাট্রিক্স যেখানে প্রধান কর্ণের সমস্ত উপাদান **ঠিক ১** থাকে এবং বাকি সব উপাদান শূন্য থাকে।

-----

## **1. `np.diag()` - ডায়াগোনাল ম্যাট্রিক্স তৈরি**

`np.diag()` ফাংশনটি বেশ বহুমুখী। যখন আপনি এটিকে একটি 1D অ্যারের মতো অবজেক্ট (লিস্ট, টুপল, বা অন্য NumPy অ্যারে) পাস করেন, তখন এটি একটি 2D বর্গ ম্যাট্রিক্স তৈরি করে এবং ইনপুটের উপাদানগুলোকে প্রধান কর্ণে স্থাপন করে।

```python
import numpy as np

# একটি লিস্ট থেকে ডায়াগোনাল ম্যাট্রিক্স তৈরি
mat_diag_list = np.diag([1, 2, 3, 4])
print(f"লিস্ট থেকে ডায়াগোনাল ম্যাট্রিক্স:\n{mat_diag_list}\n")
```

**আউটপুট:**

```
লিস্ট থেকে ডায়াগোনাল ম্যাট্রিক্স:
[[1 0 0 0]
 [0 2 0 0]
 [0 0 3 0]
 [0 0 0 4]]
```

```python
# একটি NumPy অ্যারে থেকে ডায়াগোনাল ম্যাট্রিক্স তৈরি
mat_diag_arr = np.diag(np.arange(5, 8))
print(f"NumPy অ্যারে থেকে ডায়াগোনাল ম্যাট্রিক্স:\n{mat_diag_arr}")
```

**আউটপুট:**

```
NumPy অ্যারে থেকে ডায়াগোনাল ম্যাট্রিক্স:
[[5 0 0]
 [0 6 0]
 [0 0 7]]
```

*(দ্রষ্টব্য: `np.diag()` একটি বিদ্যমান ম্যাট্রিক্স থেকে কর্ণের উপাদানগুলো বের করার জন্যও ব্যবহার করা যেতে পারে, যা এটিকে একটি দ্বৈত-উদ্দেশ্যমূলক ফাংশন করে তোলে।)*

-----

## **2. `np.eye()` - আইডেন্টিটি ম্যাট্রিক্স তৈরি**

আইডেন্টিটি ম্যাট্রিক্স তৈরি করার জন্য `np.eye()` একটি স্ট্যান্ডার্ড ফাংশন। এর নাম "eye" এসেছে "I" অক্ষরের উচ্চারণ থেকে, যা আইডেন্টিটি ম্যাট্রিক্সের গাণিতিক প্রতীক।

```python
# একটি 3x3 আইডেন্টিটি ম্যাট্রিক্স তৈরি
mat_identity = np.eye(3)
print(f"3x3 আইডেন্টিটি ম্যাট্রিক্স:\n{mat_identity}\n")
```

**আউটপুট:**

```
3x3 আইডেন্টিটি ম্যাট্রিক্স:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
```

`eye()` ফাংশনটি বর্গাকার নয় এমন ম্যাট্রিক্সও তৈরি করতে পারে এবং `k` প্যারামিটার ব্যবহার করে আপনি ১-এর কর্ণটিকে উপরে বা নিচে সরাতে পারেন।

  * `k=0` (ডিফল্ট): প্রধান কর্ণ।
  * `k > 0`: কর্ণটিকে উপরে সরায়।
  * `k < 0`: কর্ণটিকে নিচে সরায়।

<!-- end list -->

```python
# ১-এর প্রধান কর্ণ সহ একটি 3x4 ম্যাট্রিক্স
mat_rect = np.eye(3, 4)
print(f"k=0 সহ 3x4 ম্যাট্রিক্স:\n{mat_rect}\n")

# কর্ণটিকে ১ ঘর উপরে সরানো হলো (k=1)
mat_up = np.eye(3, 4, k=1)
print(f"k=1 সহ 3x4 ম্যাট্রিক্স:\n{mat_up}\n")

# কর্ণটিকে ১ ঘর নিচে সরানো হলো (k=-1)
mat_down = np.eye(3, 4, k=-1)
print(f"k=-1 সহ 3x4 ম্যাট্রিক্স:\n{mat_down}")
```

**আউটপুট:**

```
k=0 সহ 3x4 ম্যাট্রিক্স:
[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]]

k=1 সহ 3x4 ম্যাট্রিক্স:
[[0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]

k=-1 সহ 3x4 ম্যাট্রিক্স:
[[0. 0. 0. 0.]
 [1. 0. 0. 0.]
 [0. 1. 0. 0.]]
```

-----

## **মেশিন লার্নিং-এ এই ম্যাট্রিক্সগুলো কেন গুরুত্বপূর্ণ? 🤔**

### **আইডেন্টিটি ম্যাট্রিক্স (I)**

আইডেন্টিটি ম্যাট্রিক্সকে সংখ্যা **১**-এর ম্যাট্রিক্স সমতুল্য হিসেবে ভাবুন। যেমন `5 * 1 = 5` হয়, তেমনই যেকোনো সামঞ্জস্যপূর্ণ ম্যাট্রিক্স **A**-কে আইডেন্টিটি ম্যাট্রিক্স **I** দ্বারা গুণ করলে **A** পাওয়া যায় (`A * I = A`)।

  * **ইনিশিয়ালাইজেশন (Initialization)**: নিউরাল নেটওয়ার্কে, ওয়েট ম্যাট্রিক্সগুলোকে কখনও কখনও আইডেন্টিটি ম্যাট্রিক্সের কাছাকাছি মানে ইনিশিয়ালাইজ করা হয়। এটি নিশ্চিত করে যে, প্রশিক্ষণের শুরুতে লেয়ারটি ইনপুটকে খুব বেশি পরিবর্তন করবে না, যা একটি স্থিতিশীল সূচনা প্রদান করে।
  * **রেগুলারাইজেশন (Regularization)**: **রিজ রিগ্রেশন (Ridge Regression)**-এর মতো কৌশলে, ডেটার কোভ্যারিয়েন্স ম্যাট্রিক্সের সাথে আইডেন্টিটি ম্যাট্রিক্সের একটি ছোট গুণিতক (`λI`) যোগ করা হয়। এটি ম্যাট্রিক্সটিকে ইনভার্টেবল করতে সাহায্য করে এবং মডেলের প্যারামিটারগুলোকে খুব বড় হতে বাধা দেয়, যা ওভারফিটিং কমাতে সাহায্য করে।

### **ডায়াগোনাল ম্যাট্রিক্স (D)**

ডায়াগোনাল ম্যাট্রিক্স সাধারণ **স্কেলিং রূপান্তর (scaling transformations)** প্রকাশ করে। যখন আপনি একটি ভেক্টরকে একটি ডায়াগোনাল ম্যাট্রিক্স দ্বারা গুণ করেন, তখন ভেক্টরের প্রতিটি উপাদান সংশ্লিষ্ট ডায়াগোনাল উপাদান দ্বারা স্কেল বা গুণ হয়। এটি একটি অত্যন্ত কার্যকর অপারেশন।

  * **ফিচার স্কেলিং/স্ট্যান্ডার্ডাইজেশন**: ফিচার স্ট্যান্ডার্ডাইজ করার মতো অপারেশনগুলোকে ডায়াগোনাল ম্যাট্রিক্স দ্বারা প্রকাশ করা যেতে পারে।
  * **মডেল সরলীকরণ**: কিছু সম্ভাব্যতা মডেলে, যেমন **গাউসিয়ান নাইভ বেইজ ক্লাসিফায়ার (Gaussian Naive Bayes classifier)**, কোভ্যারিয়েন্স ম্যাট্রিক্সকে ডায়াগোনাল বলে ধরে নেওয়া হয়। এই সরল অনুমানের অর্থ হলো ফিচারগুলোকে পরিসংখ্যানগতভাবে স্বাধীন হিসেবে গণ্য করা হয়, যা গণনাকে অনেক দ্রুত করে তোলে।
  * **অপ্টিমাইজেশন অ্যালগরিদম**: অপ্টিমাইজেশন অ্যালগরিদমের তত্ত্ব এবং **সিঙ্গুলার ভ্যালু ডিকম্পোজিশন (SVD)**-এর মতো ম্যাট্রিক্স ডিকম্পোজিশন পদ্ধতিতে এগুলো প্রায়শই দেখা যায়, যেখানে সিঙ্গুলার মানের ম্যাট্রিক্সটি (**Σ**) একটি ডায়াগোনাল ম্যাট্রিক্স।

### **diag()**

In [None]:
mat = np.diag([1,2,3,4])
print(mat)

[[1 0 0 0]
 [0 2 0 0]
 [0 0 3 0]
 [0 0 0 4]]


In [None]:
# It can hold tuple or can be ndarray
mat = np.diag(np.arange(1,7))
print(mat)

[[1 0 0 0 0 0]
 [0 2 0 0 0 0]
 [0 0 3 0 0 0]
 [0 0 0 4 0 0]
 [0 0 0 0 5 0]
 [0 0 0 0 0 6]]


### **eye()**

In [None]:
# identitiy Matrix

mat = np.eye(3)
print(mat)



[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [None]:
# we can also make identity matrix but it it is not identify matrix when it is not squar
mat = np.eye(3,4)
print(mat)


[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]]


In [None]:
# We can move diagnal bottom to using -1 and top to +1
mat = np.eye(3,4,-1)
print(mat)

[[0. 0. 0. 0.]
 [1. 0. 0. 0.]
 [0. 1. 0. 0.]]


In [None]:
mat = np.eye(3,4,1)
print(mat)

[[0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


# **`ndarray` Indexing and Slicing**

Accessing and manipulating specific parts of an array is a fundamental operation. NumPy provides a powerful and flexible syntax for indexing (accessing single elements) and slicing (accessing sub-arrays) that is similar to Python lists but extended for multiple dimensions.

-----

## **1. Working with 1D Arrays**

Indexing and slicing on 1D arrays work just like they do for Python lists.

```python
import numpy as np

arr = np.arange(1, 10)
print(f"Original 1D array:\n{arr}\n")
```

**Output:**

```
Original 1D array:
[1 2 3 4 5 6 7 8 9]
```

### **Accessing and Modifying Elements**

You use square brackets `[]` with the index of the element you want to access. Remember, indexing starts at 0.

```python
# Access the element at index 2 (the third element)
print(f"Element at index 2: {arr[2]}\n")

# Change the value at index 2
arr[2] = 100
print(f"Array after modification:\n{arr}\n")
```

**Output:**

```
Element at index 2: 3

Array after modification:
[  1   2 100   4   5   6   7   8   9]
```

### **Slicing 1D Arrays**

The slicing syntax is `[start:stop:step]`.

```python
# Slice from index 2 up to (but not including) index 9, with a step of 2
sliced_arr = arr[2:9:2]
print(f"Sliced array [2:9:2]:\n{sliced_arr}")
```

**Output:**

```
Sliced array [2:9:2]:
[100   5   7   9]
```

-----

## **2. Working with 2D Arrays (Matrices)**

For 2D arrays, indexing and slicing are extended with a comma-separated syntax: `[row_specifier, column_specifier]`.

```python
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"Original 2D array:\n{arr2}\n")
```

**Output:**

```
Original 2D array:
[[1 2 3]
 [4 5 6]
 [7 8 9]]
```

### **Accessing and Modifying Elements**

You can use `[row][col]` syntax, but the more efficient and standard NumPy way is `[row, col]`.

```python
# Access the element in the first row (index 0) and second column (index 1)
element = arr2[0, 1] # Preferred NumPy syntax
print(f"Element at [0, 1]: {element}\n")

# Reassign the value at that position
arr2[0, 1] = 20
print(f"Array after modification:\n{arr2}\n")
```

**Output:**

```
Element at [0, 1]: 2

Array after modification:
[[ 1 20  3]
 [ 4  5  6]
 [ 7  8  9]]
```

### **Slicing 2D Arrays**

The syntax is `[row_start:row_end:row_step, col_start:col_end:col_step]`. A colon `:` by itself means "select all".

```python
# Let's reset the array for clarity
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"Reset 2D array:\n{arr2}\n")

# Getting one or more rows
print(f"Getting the second row (index 1):\n{arr2[1, :]}\n") # or simply arr2[1]
print(f"Getting first and third rows (step=2):\n{arr2[0:3:2, :]}\n")


# Getting one or more columns
print(f"Getting the first column (index 0):\n{arr2[:, 0:1]}\n")
print(f"Getting first and third columns (step=2):\n{arr2[:, 0:3:2]}\n")


# Getting a portion (submatrix)
# Get the top-left 2x2 matrix
# Rows 0 to 2 (exclusive), Columns 0 to 2 (exclusive)
submatrix = arr2[0:2, 0:2]
print(f"Top-left 2x2 submatrix:\n{submatrix}")
```

**Output:**

```
Reset 2D array:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Getting the second row (index 1):
[4 5 6]

Getting first and third rows (step=2):
[[1 2 3]
 [7 8 9]]

Getting the first column (index 0):
[[1]
 [4]
 [7]]

Getting first and third columns (step=2):
[[1 3]
 [4 6]
 [7 9]]

Top-left 2x2 submatrix:
[[1 2]
 [4 5]]
```
---

## **`ndarray` ইনডেক্সিং এবং স্লাইসিং**

একটি অ্যারের নির্দিষ্ট অংশ অ্যাক্সেস এবং পরিবর্তন করা একটি মৌলিক কাজ। NumPy **ইনডেক্সিং** (একক উপাদান অ্যাক্সেস করা) এবং **স্লাইসিং** (সাব-অ্যারে অ্যাক্সেস করা)-এর জন্য একটি শক্তিশালী এবং নমনীয় সিনট্যাক্স সরবরাহ করে, যা পাইথন লিস্টের মতোই কিন্তু একাধিক ডাইমেনশনের জন্য প্রসারিত।

-----

## **১. 1D অ্যারের সাথে কাজ করা**

1D অ্যারেতে ইনডেক্সিং এবং স্লাইসিং পাইথন লিস্টের মতোই কাজ করে।

```python
import numpy as np

arr = np.arange(1, 10)
print(f"মূল 1D অ্যারে:\n{arr}\n")
```

**আউটপুট:**

```
মূল 1D অ্যারে:
[1 2 3 4 5 6 7 8 9]
```

### **উপাদান অ্যাক্সেস এবং পরিবর্তন করা**

আপনি যে উপাদানটি অ্যাক্সেস করতে চান তার ইনডেক্স সহ স্কয়ার ব্র্যাকেট `[]` ব্যবহার করবেন। মনে রাখবেন, ইনডেক্সিং ০ থেকে শুরু হয়।

```python
# ইনডেক্স ২-এর উপাদানটি (তৃতীয় উপাদান) অ্যাক্সেস করা
print(f"ইনডেক্স ২-এর উপাদান: {arr[2]}\n")

# ইনডেক্স ২-এর মান পরিবর্তন করা
arr[2] = 100
print(f"পরিবর্তনের পর অ্যারে:\n{arr}\n")
```

**আউটপুট:**

```
ইনডেক্স ২-এর উপাদান: 3

পরিবর্তনের পর অ্যারে:
[  1   2 100   4   5   6   7   8   9]
```

### **1D অ্যারে স্লাইস করা**

স্লাইসিং-এর সিনট্যাক্স হলো `[start:stop:step]`।

```python
# ইনডেক্স ২ থেকে ৯-এর আগ পর্যন্ত (exclusive) স্লাইস করা, যেখানে ধাপ ২
sliced_arr = arr[2:9:2]
print(f"স্লাইস করা অ্যারে [2:9:2]:\n{sliced_arr}")
```

**আউটপুট:**

```
স্লাইস করা অ্যারে [2:9:2]:
[100   5   7   9]
```

-----

## **২. 2D অ্যারের (ম্যাট্রিক্স) সাথে কাজ করা**

2D অ্যারের জন্য, ইনডেক্সিং এবং স্লাইসিং কমা-দ্বারা পৃথক করা সিনট্যাক্স ব্যবহার করে প্রসারিত করা হয়েছে: `[row_specifier, column_specifier]`।

```python
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"মূল 2D অ্যারে:\n{arr2}\n")
```

**আউটপুট:**

```
মূল 2D অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 9]]
```

### **উপাদান অ্যাক্সেস এবং পরিবর্তন করা**

আপনি `[row][col]` সিনট্যাক্স ব্যবহার করতে পারেন, তবে NumPy-এর জন্য বেশি কার্যকর এবং স্ট্যান্ডার্ড উপায় হলো `[row, col]`।

```python
# প্রথম সারি (ইনডেক্স ০) এবং দ্বিতীয় কলামের (ইনডেক্স ১) উপাদান অ্যাক্সেস করা
element = arr2[0, 1] # NumPy-এর পছন্দের সিনট্যাক্স
print(f"[0, 1] অবস্থানের উপাদান: {element}\n")

# সেই অবস্থানের মান পরিবর্তন করা
arr2[0, 1] = 20
print(f"পরিবর্তনের পর অ্যারে:\n{arr2}\n")
```

**আউটপুট:**

```
[0, 1] অবস্থানের উপাদান: 2

পরিবর্তনের পর অ্যারে:
[[ 1 20  3]
 [ 4  5  6]
 [ 7  8  9]]
```

### **2D অ্যারে স্লাইস করা**

সিনট্যাক্সটি হলো `[row_start:row_end:row_step, col_start:col_end:col_step]`। একটি কোলন `:` একা থাকলে তার মানে হলো "সবগুলো নির্বাচন করো"।

```python
# স্বচ্ছতার জন্য অ্যারেটি রিসেট করা হলো
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"রিসেট করা 2D অ্যারে:\n{arr2}\n")

# এক বা একাধিক সারি পাওয়া
print(f"দ্বিতীয় সারি (ইনডেক্স ১) পাওয়া:\n{arr2[1, :]}\n") # অথবা শুধু arr2[1]
print(f"প্রথম এবং তৃতীয় সারি পাওয়া (ধাপ=২):\n{arr2[0:3:2, :]}\n")


# এক বা একাধিক কলাম পাওয়া
print(f"প্রথম কলাম (ইনডেক্স ০) পাওয়া:\n{arr2[:, 0:1]}\n")
print(f"প্রথম এবং তৃতীয় কলাম পাওয়া (ধাপ=২):\n{arr2[:, 0:3:2]}\n")


# একটি অংশ (সাবম্যাট্রিক্স) পাওয়া
# উপরের-বামের 2x2 ম্যাট্রিক্সটি পাওয়া
# সারি ০ থেকে ২ (exclusive), কলাম ০ থেকে ২ (exclusive)
submatrix = arr2[0:2, 0:2]
print(f"উপরের-বামের 2x2 সাবম্যাট্রিক্স:\n{submatrix}")
```

**আউটপুট:**

```
রিসেট করা 2D অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

দ্বিতীয় সারি (ইনডেক্স ১) পাওয়া:
[4 5 6]

প্রথম এবং তৃতীয় সারি পাওয়া (ধাপ=২):
[[1 2 3]
 [7 8 9]]

প্রথম কলাম (ইনডেক্স ০) পাওয়া:
[[1]
 [4]
 [7]]

প্রথম এবং তৃতীয় কলাম পাওয়া (ধাপ=২):
[[1 3]
 [4 6]
 [7 9]]

উপরের-বামের 2x2 সাবম্যাট্রিক্স:
[[1 2]
 [4 5]]
```

In [None]:
# work with 1d array
arr = np.arange(1,10)
print(arr)

# access index
print(arr[2])

# change the value of index
arr[2] = 100
print(arr)


# slicing array
print(arr[2:9:2])

[1 2 3 4 5 6 7 8 9]
3
[  1   2 100   4   5   6   7   8   9]
[100   5   7   9]


In [None]:
# working with 2d array
arr2 = np.reshape(np.arange(1,10),(3,3))
print(arr2)

# Accesing element
print(arr2[0][1])

# reassing value
arr2[0][1] = 20
print(arr2[0][1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
2
20


In [None]:
# Slicing 2d array
# how it work [row_start : row_end : row_step , col_start : col_end : col_step]

# Getting a row
# working with 2d array
arr2 = np.reshape(np.arange(1,10),(3,3))
print(arr2)


[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [4 5 6]]


In [None]:
# Gettig a row
print(arr2[1:2,])

# Getting one or more row with step
print(arr2[0:3:2,])


[[4 5 6]]
[[1 2 3]
 [7 8 9]]


In [None]:
# getting a column
print(arr2[::,0:1])

# Getting one or more row with step
print(arr2[::,0:3:2])


[[1]
 [4]
 [7]]
[[1 3]
 [4 6]
 [7 9]]


In [None]:
# Getting a protion
print(arr2[0:2, 0:2])

[[1 2]
 [4 5]]


# **`ndarray`: Views, Copies, Advanced Indexing, and Iteration**

This note covers some advanced but crucial concepts: how NumPy handles memory when slicing, how to select elements in non-sequential ways, and the best practices for iterating over arrays.

-----

## **1. Slicing: View vs. Copy 🔗**

This is one of the most important concepts to understand in NumPy for avoiding unexpected bugs. By default, slicing a NumPy array creates a **view**, not a copy.

A **view** is a new array object that looks at the *same underlying data* as the original array. This makes slicing very fast and memory-efficient. However, it means that if you modify the view, you also modify the original array.

```python
import numpy as np

arr = np.linspace(1, 10, 10, dtype=int)
print(f"Original array:\n{arr}\n")

# Slicing creates a view
mod_arr_view = arr[1:5]
print(f"This is a view of the original:\n{mod_arr_view}\n")

# Modify the first element of the view
mod_arr_view[0] = 200
print(f"The view is modified:\n{mod_arr_view}\n")

# The original array is also changed!
print(f"The original array has also been changed:\n{arr}\n")
```

**Output:**

```
Original array:
[ 1  2  3  4  5  6  7  8  9 10]

This is a view of the original:
[2 3 4 5]

The view is modified:
[200   3   4   5]

The original array has also been changed:
[  1 200   3   4   5   6   7   8   9  10]
```

### **Making an Explicit Copy**

If you want to modify a slice without affecting the original array, you must create an explicit **copy** using the `.copy()` method.

```python
arr = np.linspace(1, 10, 10, dtype=int)
print(f"Original array:\n{arr}\n")

# Create an explicit copy
mod_arr_copy = arr[0:4].copy()
mod_arr_copy[1] = 200 # Modify the copy

print(f"The modified copy is:\n{mod_arr_copy}\n")
print(f"The original array is NOT changed:\n{arr}")
```

**Output:**

```
Original array:
[ 1  2  3  4  5  6  7  8  9 10]

The modified copy is:
[  1 200   3   4]

The original array is NOT changed:
[ 1  2  3  4  5  6  7  8  9 10]
```

-----

## **2. Advanced Indexing**

Standard slicing is limited to creating sequential views. Advanced indexing (also known as "fancy indexing") allows you to select any arbitrary set of elements.

### **Integer Array Indexing**

You can pass a list or an array of indices to access multiple, specific elements at once.

```python
arr = np.linspace(1, 10, 10, dtype=int)
print(f"Original array:\n{arr}\n")

# Access elements at indices 0, 1, 3, 4, and 5
values = arr[[0, 1, 3, 4, 5]]
print(f"Specifically chosen values:\n{values}\n")

# For 2D arrays, you pass a tuple of lists: ([rows], [cols])
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"Original 2D array:\n{arr2}\n")

# Get the elements at (row 1, col 1) and (row 1, col 2)
elements = arr2[[1, 1], [1, 2]]
print(f"Elements at (1,1) and (1,2):\n{elements}")
```

**Output:**

```
Original array:
[ 1  2  3  4  5  6  7  8  9 10]

Specifically chosen values:
[1 2 4 5 6]

Original 2D array:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Elements at (1,1) and (1,2):
[5 6]
```

### **Boolean Indexing (Filtering)**

You can use a boolean expression to select or modify elements that meet a certain condition.

```python
arr = np.arange(1, 10).reshape(3, 3)
print(f"Original array:\n{arr}\n")

# Select all elements greater than 2
filtered_arr = arr[arr > 2]
print(f"Values greater than 2:\n{filtered_arr}\n")

# Reassign a value to all elements greater than 8
arr[arr > 8] = 0
print(f"Array after reassigning values > 8 to 0:\n{arr}")
```

**Output:**

```
Original array:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Values greater than 2:
[3 4 5 6 7 8 9]

Array after reassigning values > 8 to 0:
[[1 2 3]
 [4 5 6]
 [7 8 0]]
```

-----

## **3. Iterating Over Arrays 🚶‍♂️**

While vectorized operations are always preferred for speed, sometimes you need to loop through an array.

```python
arr = np.arange(1, 10).reshape(3, 3)

# Standard Python loop iterates over rows
print("Iterating over rows:")
for row in arr:
  print(row)

# Nested loop to access each item
print("\nIterating over each element (nested loop):")
for row in arr:
  for col in row:
    print(col, end=" ")
```

**Output:**

```
Iterating over rows:
[1 2 3]
[4 5 6]
[7 8 9]

Iterating over each element (nested loop):
1 2 3 4 5 6 7 8 9
```

### **The NumPy Way: `np.nditer()`**

For large or multi-dimensional arrays, the `np.nditer()` iterator is much more efficient. It provides a clean way to visit every element regardless of the array's shape.

```python
arr = np.arange(1, 10).reshape(3, 3)
print("\n\nIterating with np.nditer():")
for i in np.nditer(arr):
  print(i, end=" ")
```

**Output:**

```
Iterating with np.nditer():
1 2 3 4 5 6 7 8 9
```

___

## **`ndarray`: ভিউ, কপি, অ্যাডভান্সড ইনডেক্সিং এবং ইটারেশন**

এই নোটে কিছু অ্যাডভান্সড কিন্তু অত্যন্ত গুরুত্বপূর্ণ বিষয় আলোচনা করা হয়েছে: স্লাইস করার সময় NumPy কীভাবে মেমরি পরিচালনা করে, নন-সিকোয়েন্সিয়াল পদ্ধতিতে কীভাবে উপাদান নির্বাচন করতে হয় এবং অ্যারের উপর ইটারেট করার সেরা উপায়গুলো কী কী।

-----

## **১. স্লাইসিং: ভিউ বনাম কপি 🔗**

অপ্রত্যাশিত বাগ এড়ানোর জন্য NumPy-তে এটি একটি সবচেয়ে গুরুত্বপূর্ণ ধারণা। ডিফল্টভাবে, একটি NumPy অ্যারে স্লাইস করলে একটি **ভিউ (view)** তৈরি হয়, কপি নয়।

একটি **ভিউ** হলো একটি নতুন অ্যারে অবজেক্ট যা মূল অ্যারের *একই ডেটার দিকে নির্দেশ করে*। এটি স্লাইসিংকে খুব দ্রুত এবং মেমরি-সাশ্রয়ী করে তোলে। তবে, এর মানে হলো আপনি যদি ভিউটি পরিবর্তন করেন, তবে মূল অ্যারেটিও পরিবর্তিত হয়ে যাবে।

```python
import numpy as np

arr = np.linspace(1, 10, 10, dtype=int)
print(f"মূল অ্যারে:\n{arr}\n")

# স্লাইসিং একটি ভিউ তৈরি করে
mod_arr_view = arr[1:5]
print(f"এটি মূল অ্যারের একটি ভিউ:\n{mod_arr_view}\n")

# ভিউয়ের প্রথম উপাদানটি পরিবর্তন করা হলো
mod_arr_view[0] = 200
print(f"ভিউটি পরিবর্তিত হয়েছে:\n{mod_arr_view}\n")

# মূল অ্যারেটিও পরিবর্তিত হয়ে গেছে!
print(f"মূল অ্যারেটিও পরিবর্তিত হয়েছে:\n{arr}\n")
```

**আউটপুট:**

```
মূল অ্যারে:
[ 1  2  3  4  5  6  7  8  9 10]

এটি মূল অ্যারের একটি ভিউ:
[2 3 4 5]

ভিউটি পরিবর্তিত হয়েছে:
[200   3   4   5]

মূল অ্যারেটিও পরিবর্তিত হয়েছে:
[  1 200   3   4   5   6   7   8   9  10]
```

### **একটি সুস্পষ্ট কপি তৈরি করা**

আপনি যদি মূল অ্যারেটিকে প্রভাবিত না করে একটি স্লাইস পরিবর্তন করতে চান, তবে আপনাকে অবশ্যই `.copy()` মেথড ব্যবহার করে একটি সুস্পষ্ট **কপি** তৈরি করতে হবে।

```python
arr = np.linspace(1, 10, 10, dtype=int)
print(f"মূল অ্যারে:\n{arr}\n")

# একটি সুস্পষ্ট কপি তৈরি
mod_arr_copy = arr[0:4].copy()
mod_arr_copy[1] = 200 # কপিটি পরিবর্তন করা হলো

print(f"পরিবর্তিত কপিটি হলো:\n{mod_arr_copy}\n")
print(f"মূল অ্যারেটি পরিবর্তিত হয়নি:\n{arr}")
```

**আউটপুট:**

```
মূল অ্যারে:
[ 1  2  3  4  5  6  7  8  9 10]

পরিবর্তিত কপিটি হলো:
[  1 200   3   4]

মূল অ্যারেটি পরিবর্তিত হয়নি:
[ 1  2  3  4  5  6  7  8  9 10]
```

-----

## **২. অ্যাডভান্সড ইনডেক্সিং**

স্ট্যান্ডার্ড স্লাইসিং শুধুমাত্র ক্রমিক (sequential) ভিউ তৈরি করার মধ্যে সীমাবদ্ধ। অ্যাডভান্সড ইনডেক্সিং (যাকে "ফ্যান্সি ইনডেক্সিং"ও বলা হয়) আপনাকে যেকোনো ইচ্ছামত উপাদান নির্বাচন করার অনুমতি দেয়।

### **ইন্টিজার অ্যারে ইনডেক্সিং**

আপনি একাধিক, নির্দিষ্ট উপাদান একসাথে অ্যাক্সেস করার জন্য ইনডেক্সগুলোর একটি লিস্ট বা অ্যারে পাস করতে পারেন।

```python
arr = np.linspace(1, 10, 10, dtype=int)
print(f"মূল অ্যারে:\n{arr}\n")

# ইনডেক্স ০, ১, ৩, ৪, এবং ৫ এর উপাদানগুলো অ্যাক্সেস করা
values = arr[[0, 1, 3, 4, 5]]
print(f"নির্দিষ্টভাবে নির্বাচিত মান:\n{values}\n")

# 2D অ্যারের জন্য, আপনি লিস্টের একটি টুপল পাস করবেন: ([সারি], [কলাম])
arr2 = np.arange(1, 10).reshape(3, 3)
print(f"মূল 2D অ্যারে:\n{arr2}\n")

# (সারি ১, কলাম ১) এবং (সারি ১, কলাম ২) এর উপাদানগুলো পাওয়া
elements = arr2[[1, 1], [1, 2]]
print(f"(1,1) এবং (1,2) অবস্থানের উপাদান:\n{elements}")
```

**আউটপুট:**

```
মূল অ্যারে:
[ 1  2  3  4  5  6  7  8  9 10]

নির্দিষ্টভাবে নির্বাচিত মান:
[1 2 4 5 6]

মূল 2D অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

(1,1) এবং (1,2) অবস্থানের উপাদান:
[5 6]
```

### **বুলিয়ান ইনডেক্সিং (ফিল্টারিং)**

আপনি একটি নির্দিষ্ট শর্ত পূরণকারী উপাদানগুলো নির্বাচন বা পরিবর্তন করতে একটি বুলিয়ান এক্সপ্রেশন ব্যবহার করতে পারেন।

```python
arr = np.arange(1, 10).reshape(3, 3)
print(f"মূল অ্যারে:\n{arr}\n")

# ২-এর চেয়ে বড় সমস্ত উপাদান নির্বাচন করা
filtered_arr = arr[arr > 2]
print(f"২-এর চেয়ে বড় মানগুলো:\n{filtered_arr}\n")

# ৮-এর চেয়ে বড় সমস্ত উপাদানের মান পরিবর্তন করা
arr[arr > 8] = 0
print(f"৮-এর চেয়ে বড় মানগুলোকে ০ করার পর অ্যারে:\n{arr}")
```

**আউটপুট:**

```
মূল অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

২-এর চেয়ে বড় মানগুলো:
[3 4 5 6 7 8 9]

৮-এর চেয়ে বড় মানগুলোকে ০ করার পর অ্যারে:
[[1 2 3]
 [4 5 6]
 [7 8 0]]
```

-----

## **৩. অ্যারের উপর ইটারেট করা 🚶‍♂️**

যদিও গতির জন্য ভেক্টরাইজড অপারেশন সবসময়ই শ্রেয়, কখনও কখনও আপনাকে একটি অ্যারের মধ্য দিয়ে লুপ করতে হতে পারে।

```python
arr = np.arange(1, 10).reshape(3, 3)

# সাধারণ পাইথন লুপ সারিগুলোর উপর ইটারেট করে
print("সারিগুলোর উপর ইটারেট করা:")
for row in arr:
  print(row)

# প্রতিটি আইটেম অ্যাক্সেস করার জন্য নেস্টেড লুপ
print("\nপ্রতিটি উপাদানের উপর ইটারেট করা (নেস্টেড লুপ):")
for row in arr:
  for col in row:
    print(col, end=" ")
```

**আউটপুট:**

```
সারিগুলোর উপর ইটারেট করা:
[1 2 3]
[4 5 6]
[7 8 9]

প্রতিটি উপাদানের উপর ইটারেট করা (নেস্টেড লুপ):
1 2 3 4 5 6 7 8 9
```

### **NumPy-এর উপায়: `np.nditer()`**

বড় বা বহুমাত্রিক অ্যারের জন্য `np.nditer()` ইটারেটরটি অনেক বেশি কার্যকর। এটি অ্যারের শেপ নির্বিশেষে প্রতিটি উপাদান ভিজিট করার একটি সহজ উপায় সরবরাহ করে।

```python
arr = np.arange(1, 10).reshape(3, 3)
print("\n\nnp.nditer() দিয়ে ইটারেট করা:")
for i in np.nditer(arr):
  print(i, end=" ")
```

**আউটপুট:**

```
np.nditer() দিয়ে ইটারেট করা:
1 2 3 4 5 6 7 8 9
```


In [None]:
arr = np.linspace(1,10,10, dtype=int)
mod_arr = arr[1:5] # It not make copy it hold a portion of arr aray
print(mod_arr)
mod_arr[0] = 200
# it chnge the original array
print(arr)

[2 3 4 5]
[  1 200   3   4   5   6   7   8   9  10]


In [None]:
# we also make copy instead of taking portion of original array which not effecting in original array

arr = np.linspace(1,10,10, dtype=int)
mod_arr = arr[0:4].copy()
print(mod_arr)

mod_arr[1] = 200
print(mod_arr)
print(arr)

[1 2 3 4]
[  1 200   3   4]
[ 1  2  3  4  5  6  7  8  9 10]


### **Advance Indexing**

In [None]:
# we can access specific multiple index which not possible with slicing
arr = np.linspace(1,10,10, dtype=int)
print(arr)
values = arr[[0,1,3,4,5]]
print(values)

[ 1  2  3  4  5  6  7  8  9 10]
[1 2 4 5 6]


In [None]:
# 2d array
arr = np.linspace(1,9,9, dtype=int)
arr = np.reshape(arr,(3,3))
print(arr)


#arr[[row_no_first_item, row_no_second_item,...row_no_n_item],[col_no_first_item, col_no_second_item,...col_no_n_item ]]
print(arr[[1,1],[1,2]])



[[1 2 3]
 [4 5 6]
 [7 8 9]]
[5 6]


In [None]:
# filtering or reassing value with bollean expression

print(arr[arr>2])

# reassing value 0 to value greater than 8
arr[arr>8] = 0

print(arr)

[3 4 5 6 7 8 9]
[[1 2 3]
 [4 5 6]
 [7 8 0]]


### **Iteration**

In [None]:
arr = np.linspace(1,9,9, dtype=int)
arr = np.reshape(arr,(3,3))
# we can itereate with for
for row in arr:
  print(row)

# access each item
for row in arr:
  for col in row:
    print(col)

[1 2 3]
[4 5 6]
[7 8 9]
1
2
3
4
5
6
7
8
9


In [None]:
# best way is doint it np.nditer()

arr = np.linspace(1,9,9, dtype=int)
arr = np.reshape(arr,(3,3))

for i in np.nditer(arr):
  print(i)

# it also print 3 darray with one loop
# our arr3 is 3d array

for i in np.nditer(arr3):
  print(i)


1
2
3
4
5
6
7
8
9
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
11.0
12.0


# **`ndarray` Manipulation**


In Machine Learning and AI, you often need to preprocess your data. This involves changing the shape, combining, or splitting arrays to match the input format expected by a model. Array manipulation is key for tasks like splitting data into training/testing sets or separating features from target variables.

-----

## **1. Reshaping Arrays: `np.reshape()`**

The `np.reshape()` function changes the shape of an array without changing its data.

**Rule:** The total number of elements must remain the same. An array with 50 elements (e.g., shape `(10, 5)`) can be reshaped to `(5, 10)`, `(2, 25)`, or `(25, 2)`, but not `(3, 5)` because `3 * 5 = 15`, not 50.

```python
import numpy as np

# Original 10x5 array (50 elements)
arr = np.random.randint(1, 100, size=(10, 5))
print(f"Original shape: {arr.shape}\n")

# Reshape to 5x10
arr_reshaped = np.reshape(arr, (5, 10))
print(f"Reshaped to 5x10:\n{arr_reshaped}\n")

# This would cause a ValueError because 3 * 5 != 50
# arr_error = np.reshape(arr, (3, 5))
```

-----

## **2. Flattening Arrays: `flatten()` vs. `ravel()`**

Sometimes you need to convert a multi-dimensional array into a single 1D array.

  * **`flatten()`**: Always returns a **copy** of the array, flattened row by row.
  * **`ravel()`**: Returns a **view** of the array if possible, which is more memory-efficient. It can flatten row-wise (`order='C'`, default) or column-wise (`order='F'`).

<!-- end list -->

```python
arr = np.array([[1, 2, 3], [4, 5, 6]])

# Row-wise flattening (standard)
print(f"Flattened (row-wise):\n{arr.flatten()}\n")

# Column-wise flattening using ravel
print(f"Raveled (column-wise):\n{np.ravel(arr, order='F')}")
```

**Output:**

```
Flattened (row-wise):
[1 2 3 4 5 6]

Raveled (column-wise):
[1 4 2 5 3 6]
```

-----

## **3. Combining Arrays: `np.concatenate()`**

This function joins a sequence of arrays along a specified axis.

**Syntax:** `np.concatenate((a, b, ...), axis=0/1)`

  * `axis=0`: Stacks arrays vertically (row-wise).
  * `axis=1`: Stacks arrays horizontally (column-wise).

**Rule:**

  * For `axis=0`, the number of **columns** must match.
  * For `axis=1`, the number of **rows** must match.

<!-- end list -->

```python
a = np.random.randint(1, 10, size=(2, 3))
b = np.random.randint(20, 30, size=(2, 3))
print(f"Array a:\n{a}\n\nArray b:\n{b}\n")

# Row-wise concatenation (axis=0)
con_row = np.concatenate((a, b), axis=0)
print(f"Row-wise concatenation (shape {con_row.shape}):\n{con_row}\n")

# Column-wise concatenation (axis=1)
con_col = np.concatenate((a, b), axis=1)
print(f"Column-wise concatenation (shape {con_col.shape}):\n{con_col}")
```

**Output:**

```
Array a:
[[6 8 1]
 [1 3 4]]

Array b:
[[23 29 22]
 [26 25 21]]

Row-wise concatenation (shape (4, 3)):
[[ 6  8  1]
 [ 1  3  4]
 [23 29 22]
 [26 25 21]]

Column-wise concatenation (shape (2, 6)):
[[ 6  8  1 23 29 22]
 [ 1  3  4 26 25 21]]
```

### **Example: Splitting and Rejoining Features/Target**

```python
# Create a 5x10 dataset where the last column is the target
dataset = np.random.randint(50, 100, size=(5, 10))

# Split into features (all columns except the last)
features = dataset[:, :-1]

# Split into target (only the last column)
target = dataset[:, -1:]

# After some processing, we can concatenate them back
processed_dataset = np.concatenate((features, target), axis=1)
print(f"Original and rejoined datasets have the same shape: {dataset.shape == processed_dataset.shape}") # Output: True
```

-----

## **4. Transposing Arrays: `.T`**

Transposing an array swaps its rows and columns. This is incredibly useful for changing the orientation of your data.

```python
# Each row represents a subject (Math, Science)
marks = np.array([
    [80, 90, 98, 86, 78], # Math marks for 5 students
    [70, 80, 88, 76, 68], # Science marks for 5 students
])

# Transpose to make each row represent a student's marks
marks_T = marks.T
print(f"Original marks (shape {marks.shape}):\n{marks}\n")
print(f"Transposed marks (shape {marks_T.shape}):\n{marks_T}")
```

**Output:**

```
Original marks (shape (2, 5)):
[[80 90 98 86 78]
 [70 80 88 76 68]]

Transposed marks (shape (5, 2)):
[[80 70]
 [90 80]
 [98 88]
 [86 76]
 [78 68]]
```

-----

## **5. Splitting Arrays**

These functions divide an array into multiple sub-arrays.

  * **`np.split()`**: Requires that the array can be split into an **equal** number of elements. If not, it raises a `ValueError`.
  * **`np.array_split()`**: Will split the array into nearly-equal parts if an equal split is not possible. This is often more flexible.

<!-- end list -->

```python
a = np.arange(10)
print(f"Original array: {a}\n")

# This works because 10 is divisible by 2
split_equal = np.split(a, 2)
print(f"Equal split with np.split():\n{split_equal}\n")

# This would cause an error with np.split()
# splitted_array = np.split(a, 3)

# This works with np.array_split()
split_unequal = np.array_split(a, 3)
print(f"Unequal split with np.array_split():\n{split_unequal}")
```

**Output:**

```
Original array: [0 1 2 3 4 5 6 7 8 9]

Equal split with np.split():
[array([0, 1, 2, 3, 4]), array([5, 6, 7, 8, 9])]

Unequal split with np.array_split():
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8, 9])]
```



## **`ndarray` ম্যানিপুলেশন (Manipulation)**

মেশিন লার্নিং এবং AI-তে, প্রায়শই আপনার ডেটা প্রি-প্রসেস করার প্রয়োজন হয়। এর মধ্যে রয়েছে একটি মডেলের প্রত্যাশিত ইনপুট ফরম্যাটের সাথে মেলানোর জন্য অ্যারের শেপ পরিবর্তন করা, অ্যারে একত্রিত করা বা ভাগ করা। ডেটাকে ট্রেনিং/টেস্টিং সেটে ভাগ করা বা ফিচার থেকে টার্গেট ভেরিয়েবল আলাদা করার মতো কাজের জন্য অ্যারে ম্যানিপুলেশন অত্যন্ত গুরুত্বপূর্ণ।

-----

### **১. অ্যারের শেপ পরিবর্তন: `np.reshape()`**

`np.reshape()` ফাংশনটি একটি অ্যারের ডেটা পরিবর্তন না করে তার শেপ পরিবর্তন করে।

**নিয়ম:** মোট উপাদানের সংখ্যা অবশ্যই একই থাকতে হবে। ৫০টি উপাদানসহ একটি অ্যারে (যেমন, শেপ `(10, 5)`) `(5, 10)`, `(2, 25)`, বা `(25, 2)`-এ রিশেপ করা যেতে পারে, কিন্তু `(3, 5)`-এ করা যাবে না কারণ `3 * 5 = 15`, 50 নয়।

```python
import numpy as np

# মূল 10x5 অ্যারে (৫০টি উপাদান)
arr = np.random.randint(1, 100, size=(10, 5))
print(f"মূল শেপ: {arr.shape}\n")

# 5x10 এ রিশেপ করা হলো
arr_reshaped = np.reshape(arr, (5, 10))
print(f"5x10 এ রিশেপ করা হয়েছে:\n{arr_reshaped}\n")

# এটি ValueError দেবে কারণ 3 * 5 != 50
# arr_error = np.reshape(arr, (3, 5))
```

-----

### **২. অ্যারে ফ্ল্যাট করা: `flatten()` বনাম `ravel()`**

কখনও কখনও আপনাকে একটি বহুমাত্রিক (multi-dimensional) অ্যারে-কে একটি 1D অ্যারেতে রূপান্তর করতে হতে পারে।

  * **`flatten()`**: সর্বদা অ্যারের একটি **কপি** রিটার্ন করে, যা সারি বরাবর ফ্ল্যাট করা থাকে।
  * **`ravel()`**: যদি সম্ভব হয় তবে অ্যারের একটি **ভিউ** রিটার্ন করে, যা বেশি মেমরি-সাশ্রয়ী। এটি সারি-ভিত্তিক (`order='C'`, ডিফল্ট) বা কলাম-ভিত্তিক (`order='F'`) ফ্ল্যাট করতে পারে।

<!-- end list -->

```python
arr = np.array([[1, 2, 3], [4, 5, 6]])

# সারি-ভিত্তিক ফ্ল্যাটেনিং (স্ট্যান্ডার্ড)
print(f"ফ্ল্যাট করা (সারি-ভিত্তিক):\n{arr.flatten()}\n")

# ravel ব্যবহার করে কলাম-ভিত্তিক ফ্ল্যাটেনিং
print(f"র‍্যাভেল করা (কলাম-ভিত্তিক):\n{np.ravel(arr, order='F')}")
```

**আউটপুট:**

```
ফ্ল্যাট করা (সারি-ভিত্তিক):
[1 2 3 4 5 6]

র‍্যাভেল করা (কলাম-ভিত্তিক):
[1 4 2 5 3 6]
```

-----

### **৩. অ্যারে একত্রিত করা: `np.concatenate()`**

এই ফাংশনটি একটি নির্দিষ্ট অক্ষ (axis) বরাবর একাধিক অ্যারে যুক্ত করে।

**সিনট্যাক্স:** `np.concatenate((a, b, ...), axis=0/1)`

  * `axis=0`: অ্যারেগুলোকে উল্লম্বভাবে (vertically) যুক্ত করে (সারি-ভিত্তিক)।
  * `axis=1`: অ্যারেগুলোকে অনুভূমিকভাবে (horizontally) যুক্ত করে (কলাম-ভিত্তিক)।

**নিয়ম:**

  * `axis=0` এর জন্য, **কলামের** সংখ্যা অবশ্যই মিলতে হবে।
  * `axis=1` এর জন্য, **সারির** সংখ্যা অবশ্যই মিলতে হবে।

<!-- end list -->

```python
a = np.random.randint(1, 10, size=(2, 3))
b = np.random.randint(20, 30, size=(2, 3))
print(f"অ্যারে a:\n{a}\n\nঅ্যারে b:\n{b}\n")

# সারি-ভিত্তিক কনক্যাটেনেশন (axis=0)
con_row = np.concatenate((a, b), axis=0)
print(f"সারি-ভিত্তিক কনক্যাটেনেশন (শেপ {con_row.shape}):\n{con_row}\n")

# কলাম-ভিত্তিক কনক্যাটেনেশন (axis=1)
con_col = np.concatenate((a, b), axis=1)
print(f"কলাম-ভিত্তিক কনক্যাটেনেশন (শেপ {con_col.shape}):\n{con_col}")
```

**আউটপুট:**

```
অ্যারে a:
[[6 8 1]
 [1 3 4]]

অ্যারে b:
[[23 29 22]
 [26 25 21]]

সারি-ভিত্তিক কনক্যাটেনেশন (শেপ (4, 3)):
[[ 6  8  1]
 [ 1  3  4]
 [23 29 22]
 [26 25 21]]

কলাম-ভিত্তিক কনক্যাটেনেশন (শেপ (2, 6)):
[[ 6  8  1 23 29 22]
 [ 1  3  4 26 25 21]]
```

-----

### **৪. অ্যারে ট্রান্সপোজ করা: `.T`**

একটি অ্যারে ট্রান্সপোজ করলে তার সারি এবং কলামগুলো互换 (swap) হয়ে যায়। ডেটার দিক পরিবর্তন করার জন্য এটি অত্যন্ত দরকারী।

```python
# প্রতিটি সারি একটি বিষয়কে প্রতিনিধিত্ব করে (গণিত, বিজ্ঞান)
marks = np.array([
    [80, 90, 98, 86, 78], # ৫ জন ছাত্রের গণিতের নম্বর
    [70, 80, 88, 76, 68], # ৫ জন ছাত্রের বিজ্ঞানের নম্বর
])

# প্রতিটি সারিকে একজন ছাত্রের নম্বর হিসেবে দেখাতে ট্রান্সপোজ করা হলো
marks_T = marks.T
print(f"মূল নম্বর (শেপ {marks.shape}):\n{marks}\n")
print(f"ট্রান্সপোজড নম্বর (শেপ {marks_T.shape}):\n{marks_T}")
```

**আউটপুট:**

```
মূল নম্বর (শেপ (2, 5)):
[[80 90 98 86 78]
 [70 80 88 76 68]]

ট্রান্সপোজড নম্বর (শেপ (5, 2)):
[[80 70]
 [90 80]
 [98 88]
 [86 76]
 [78 68]]
```

-----

### **৫. অ্যারে বিভক্ত করা**

এই ফাংশনগুলো একটি অ্যারে-কে একাধিক সাব-অ্যারেতে বিভক্ত করে।

  * **`np.split()`**: এটির জন্য অ্যারেটিকে **সমান** সংখ্যক উপাদানে বিভক্ত করা আবশ্যক। যদি তা সম্ভব না হয়, এটি একটি `ValueError` দেখায়।
  * **`np.array_split()`**: যদি সমানভাবে ভাগ করা সম্ভব না হয়, তবে এটি অ্যারেটিকে প্রায়-সমান অংশে বিভক্ত করবে। এটি প্রায়শই বেশি নমনীয়।

<!-- end list -->

```python
a = np.arange(10)
print(f"মূল অ্যারে: {a}\n")

# এটি কাজ করে কারণ ১০, ২ দ্বারা বিভাজ্য
split_equal = np.split(a, 2)
print(f"np.split() দিয়ে সমান ভাগ:\n{split_equal}\n")

# np.split() দিয়ে এটি এরর দেবে
# splitted_array = np.split(a, 3)

# np.array_split() দিয়ে এটি কাজ করে
split_unequal = np.array_split(a, 3)
print(f"np.array_split() দিয়ে অসমান ভাগ:\n{split_unequal}")
```

**আউটপুট:**

```
মূল অ্যারে: [0 1 2 3 4 5 6 7 8 9]

np.split() দিয়ে সমান ভাগ:
[array([0, 1, 2, 3, 4]), array([5, 6, 7, 8, 9])]

np.array_split() দিয়ে অসমান ভাগ:
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8, 9])]
```


In [None]:
import numpy as np
arr = np.random.randint(1,100,size=(10,5))
print(arr)

[[36 30  2 75 57]
 [67 45 56 83 12]
 [37 31 35 61 86]
 [ 5 22 50 17 29]
 [83 59 34 79 67]
 [32 43 23 50  7]
 [99 75 54 97 65]
 [52  8 31 55 10]
 [90 38 83 16 31]
 [92 33 30 63  2]]


In [None]:
# np.reshape(): Now IF we need change the shape of it we doing it reshape function
arr1 = np.reshape(arr,(5,10))
print(arr1)

[[36 30  2 75 57 67 45 56 83 12]
 [37 31 35 61 86  5 22 50 17 29]
 [83 59 34 79 67 32 43 23 50  7]
 [99 75 54 97 65 52  8 31 55 10]
 [90 38 83 16 31 92 33 30 63  2]]


In [None]:
# We should alert about that when you reshape like we 5,10 shape data which have 50 value we can not convert it to 3*5 which give us valueError
# arr_e = np.reshape(arr,(3,5))

# Here also 2*25 or 25*2 is also allow because it hold 50 datapoint
arr1 = np.reshape(arr,(2,25))
print(arr1)

[[36 30  2 75 57 67 45 56 83 12 37 31 35 61 86  5 22 50 17 29 83 59 34 79
  67]
 [32 43 23 50  7 99 75 54 97 65 52  8 31 55 10 90 38 83 16 31 92 33 30 63
   2]]


In [None]:
# we need flate array we can use flatten funcion and ravel function
# flatten: doing row way flat
# ravel: colum or row wise flat array base on parameter order="F" column wise flat and order="C" row wise flat the array
arr1 = np.reshape(arr,(5,10))
print(arr1)

# row wise flat array
print(arr1.flatten())
print(np.ravel(arr1, order="C"))

#column wise flat the array
print(np.ravel(arr1, order="F"))


[[36 30  2 75 57 67 45 56 83 12]
 [37 31 35 61 86  5 22 50 17 29]
 [83 59 34 79 67 32 43 23 50  7]
 [99 75 54 97 65 52  8 31 55 10]
 [90 38 83 16 31 92 33 30 63  2]]
[36 30  2 75 57 67 45 56 83 12 37 31 35 61 86  5 22 50 17 29 83 59 34 79
 67 32 43 23 50  7 99 75 54 97 65 52  8 31 55 10 90 38 83 16 31 92 33 30
 63  2]
[36 30  2 75 57 67 45 56 83 12 37 31 35 61 86  5 22 50 17 29 83 59 34 79
 67 32 43 23 50  7 99 75 54 97 65 52  8 31 55 10 90 38 83 16 31 92 33 30
 63  2]
[36 37 83 99 90 30 31 59 75 38  2 35 34 54 83 75 61 79 97 16 57 86 67 65
 31 67  5 32 52 92 45 22 43  8 33 56 50 23 31 30 83 17 50 55 63 12 29  7
 10  2]


In [None]:
# concatenate: we can concatenate multiple array base on row wise or colum
# np. concatenate((a,b,...n), axis=0/1) axis = 0 means rowwise contenate and 1 means column wise concatenate

a = np.random.randint(1,10,size=(3,3))
b = np.random.randint(20,30,size=(3,3))


print(a)
print(b)

# row wise concatenate
con_row = np.concatenate((a,b), axis=0)
print(con_row)

# column wise contenate
con_col = np.concatenate((a,b), axis=1)
print(con_col)

[[1 6 5]
 [3 3 3]
 [4 3 4]]
[[21 22 27]
 [26 20 29]
 [21 28 28]]
[[ 1  6  5]
 [ 3  3  3]
 [ 4  3  4]
 [21 22 27]
 [26 20 29]
 [21 28 28]]
[[ 1  6  5 21 22 27]
 [ 3  3  3 26 20 29]
 [ 4  3  4 21 28 28]]


In [None]:
# [row_start:row_end:row_step, col_start:col_end:col_step]
# Now craeta a example which is 5*10 matrix where last row is column
a = np.random.randint(50,100,size=(5,10))
print(a)
print()

fetures = a[:,0:a.shape[1]-1]
print(fetures)
print()

target = a[:,a.shape[1]-1:]
print(target)

# some preprocessing done in fetures then we concatenate again target and fetures
a = np.concatenate((fetures,target), axis=1)
print(a)

[[62 98 88 61 52 85 56 66 76 80]
 [77 78 56 65 83 63 67 79 63 69]
 [51 87 72 79 58 53 81 54 94 79]
 [68 64 80 50 86 77 71 68 51 70]
 [98 52 70 87 87 74 86 86 67 57]]

[[62 98 88 61 52 85 56 66 76]
 [77 78 56 65 83 63 67 79 63]
 [51 87 72 79 58 53 81 54 94]
 [68 64 80 50 86 77 71 68 51]
 [98 52 70 87 87 74 86 86 67]]

[[80]
 [69]
 [79]
 [70]
 [57]]
[[62 98 88 61 52 85 56 66 76 80]
 [77 78 56 65 83 63 67 79 63 69]
 [51 87 72 79 58 53 81 54 94 79]
 [68 64 80 50 86 77 71 68 51 70]
 [98 52 70 87 87 74 86 86 67 57]]


In [None]:
# when we concatenate we need alert something like when we do row concatenate no of column both array should same and when column concatenate
# no row should be equal for both array

# you do no column conatenate here

[
    [1,2,3],
    [4,5,6]
]

[
    [1,2,3]
]

# Also we can not row concatenate here
[
    [1,2,3],
    [4,5,6]
]

[
    [1,2]
]

[[1, 2]]

In [None]:
# Transpose Matrix where row can be column ro column can be row
# like we have tow math_marks and science_mark list if convert it to feature we use tranpose here

marks = np.array([
    [80, 90, 98, 86, 78],
    [70, 80, 88, 76, 68],
])

print(marks)

make_to_feature = np.transpose(marks)
print(make_to_feature)

# or

make_to_feature_2 = marks.T
print(make_to_feature_2)


[[80 90 98 86 78]
 [70 80 88 76 68]]
[[80 70]
 [90 80]
 [98 88]
 [86 76]
 [78 68]]
[[80 70]
 [90 80]
 [98 88]
 [86 76]
 [78 68]]


In [None]:
# we need some time solit the array
# np.array_split(arr, no_of_split): try to equally split if not possible one split can be bigger then other
# np.split(a, no_of_split): if not possible equally split throw error

a = np.random.randint(10,20, size=10)
print(a)

splitted_array = np.array_split(a, 3)
print(splitted_array)

# show cause not possible equally split
# splitted_array = np.split(a, 3)


splitted_array = np.split(a, 2)
print(splitted_array)

[17 15 14 17 15 11 18 17 16 13]
[array([17, 15, 14, 17]), array([15, 11, 18]), array([17, 16, 13])]
[array([17, 15, 14, 17, 15]), array([11, 18, 17, 16, 13])]


# **`ndarray` Arithmetic and Mathematical Functions**

NumPy provides highly optimized, element-wise mathematical operations that are significantly faster than using standard Python loops. These functions are the backbone of numerical computation in AI and Machine Learning.

-----

## **1. Basic Arithmetic Operators 🧮**

When you use standard arithmetic operators (`+`, `-`, `*`, `/`, `%`) on two NumPy arrays of the same size, the operation is applied **element-wise**. This means the operation occurs between the elements at the same position in each array.

```python
import numpy as np

# Create two random integer arrays
x = np.array([25, 29, 21, 28, 24])
y = np.array([8, 2, 5, 9, 3])

print(f"x = {x}")
print(f"y = {y}\n")

# Addition
print(f"Addition (x + y):       {x + y}")
# print(np.add(x, y)) # This is the equivalent function call

# Subtraction
print(f"Subtraction (x - y):    {x - y}")

# Multiplication
print(f"Multiplication (x * y): {x * y}")

# Division (results in a float array)
print(f"Division (x / y):       {x / y}")

# Modulus (remainder)
print(f"Modulus (x % y):        {x % y}")
```

**Output:**

```
x = [25 29 21 28 24]
y = [8 2 5 9 3]

Addition (x + y):       [33 31 26 37 27]
Subtraction (x - y):    [17 27 16 19 21]
Multiplication (x * y): [200  58 105 252  72]
Division (x / y):       [3.125      14.5        4.2        3.11111111 8.        ]
Modulus (x % y):        [1 1 1 1 0]
```

-----

## **2. Trigonometric Functions 📐**

NumPy provides a full suite of trigonometric functions that operate on each element of an array. By default, these functions assume the input is in **radians**.

```python
x = np.array([0, 30, 45, 60, 90])
x_rad = np.deg2rad(x) # Convert degrees to radians first

print(f"Angles in Radians: {x_rad}\n")
print(f"Sine:   {np.sin(x_rad)}")
print(f"Cosine: {np.cos(x_rad)}")
```

**Output:**

```
Angles in Radians: [0.         0.52359878 0.78539816 1.04719755 1.57079633]

Sine:   [0.         0.5        0.70710678 0.8660254  1.        ]
Cosine: [1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01
 6.12323400e-17]
```

-----

## **3. Logarithmic Functions**

Logarithms are essential in many ML algorithms, especially for dealing with probabilities and information theory.

  * **`np.log(x)`**: Natural logarithm (base $e$).
  * **`np.log2(x)`**: Base-2 logarithm. Answers the question, "To what power must 2 be raised to get x?"
  * **`np.log10(x)`**: Base-10 logarithm.

<!-- end list -->

```python
x = np.array([2, 8, 32, 100, 1000])

print(f"Base-2 Logarithm (log2): {np.log2(x)}")
print(f"Base-10 Logarithm (log10): {np.log10(x)}")
```

**Output:**

```
Base-2 Logarithm (log2): [1.         3.         5.         6.64385619 9.96578428]
Base-10 Logarithm (log10): [0.30103    0.90309    1.50514998 2.         3.        ]
```

-----

## **4. Other Important Mathematical Functions for AI/ML**

Here are some more functions that you will frequently encounter.

### **Aggregation Functions**

These functions compute a single value from an array.

```python
x = np.array([1, 2, 3, 4, 5])

print(f"Sum: {np.sum(x)}")             # Sum of all elements
print(f"Cumulative Sum: {np.cumsum(x)}")  # Sum as elements are added
print(f"Mean (Average): {np.mean(x)}") # Average value
print(f"Standard Deviation: {np.std(x)}") # Measure of data spread
print(f"Minimum value: {np.min(x)}")    # Smallest value
print(f"Maximum value: {np.max(x)}")    # Largest value
```

**Output:**

```
Sum: 15
Cumulative Sum: [ 1  3  6 10 15]
Mean (Average): 3.0
Standard Deviation: 1.4142135623730951
Minimum value: 1
Maximum value: 5
```

### **Exponential and Power Functions**

These are critical for activation functions in neural networks and for various statistical distributions.

```python
x = np.array([1, 2, 3])

print(f"Exponential (e^x): {np.exp(x)}")  # e raised to the power of each element
print(f"Square Root: {np.sqrt(x)}")       # Square root of each element
```

**Output:**

```
Exponential (e^x): [ 2.71828183  7.3890561  20.08553692]
Square Root: [1.         1.41421356 1.73205081]
```

### **Linear Algebra**

Matrix multiplication is the most common operation in deep learning.

```python
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

# Matrix Multiplication (Dot Product)
dot_product = np.dot(a, b)
# The @ operator is a convenient shorthand for matrix multiplication
dot_product_shorthand = a @ b

print(f"Matrix a:\n{a}\n\nMatrix b:\n{b}\n")
print(f"Dot Product (a @ b):\n{dot_product_shorthand}")
```

**Output:**

```
Matrix a:
[[1 2]
 [3 4]]

Matrix b:
[[5 6]
 [7 8]]

Dot Product (a @ b):
[[19 22]
 [43 50]]
```

___

## **`ndarray` অ্যারিথমেটিক এবং গাণিতিক ফাংশন**

NumPy অত্যন্ত অপ্টিমাইজড, এলিমেন্ট-ওয়াইজ গাণিতিক অপারেশন সরবরাহ করে যা সাধারণ পাইথন লুপ ব্যবহারের চেয়ে অনেক দ্রুত। এই ফাংশনগুলো AI এবং মেশিন লার্নিং-এ নিউমেরিক্যাল কম্পিউটেশনের ভিত্তি।

-----

### **১. বেসিক অ্যারিথমেটিক অপারেটর 🧮**

যখন আপনি একই আকারের দুটি NumPy অ্যারের উপর স্ট্যান্ডার্ড অ্যারিথমেটিক অপারেটর (`+`, `-`, `*`, `/`, `%`) ব্যবহার করেন, তখন অপারেশনটি **এলিমেন্ট-ওয়াইজ** (element-wise) প্রয়োগ করা হয়। এর মানে হলো, প্রতিটি অ্যারের একই অবস্থানে থাকা উপাদানগুলোর মধ্যে অপারেশনটি ঘটে।

```python
import numpy as np

# দুটি র‍্যান্ডম ইন্টিজার অ্যারে তৈরি করা হলো
x = np.array([25, 29, 21, 28, 24])
y = np.array([8, 2, 5, 9, 3])

print(f"x = {x}")
print(f"y = {y}\n")

# যোগ
print(f"যোগ (x + y):       {x + y}")
# print(np.add(x, y)) # এটি সমতুল্য ফাংশন কল

# বিয়োগ
print(f"বিয়োগ (x - y):    {x - y}")

# গুণ
print(f"গুণ (x * y): {x * y}")

# ভাগ (ফলাফল একটি ফ্লোট অ্যারে হয়)
print(f"ভাগ (x / y):       {x / y}")

# মডুলাস (ভাগশেষ)
print(f"মডুলাস (x % y):        {x % y}")
```

**আউটপুট:**

```
x = [25 29 21 28 24]
y = [8 2 5 9 3]

যোগ (x + y):       [33 31 26 37 27]
বিয়োগ (x - y):    [17 27 16 19 21]
গুণ (x * y): [200  58 105 252  72]
ভাগ (x / y):       [3.125      14.5        4.2        3.11111111 8.        ]
মডুলাস (x % y):        [1 1 1 1 0]
```

-----

### **২. ত্রিকোণমিতিক ফাংশন 📐**

NumPy ত্রিকোণমিতিক ফাংশনগুলোর একটি সম্পূর্ণ সেট সরবরাহ করে যা একটি অ্যারের প্রতিটি উপাদানের উপর কাজ করে। ডিফল্টভাবে, এই ফাংশনগুলো ধরে নেয় যে ইনপুটটি **রেডিয়ানে (radians)** আছে।

```python
x = np.array([0, 30, 45, 60, 90])
x_rad = np.deg2rad(x) # প্রথমে ডিগ্রী থেকে রেডিয়ানে রূপান্তর

print(f"রেডিয়ানে কোণ: {x_rad}\n")
print(f"Sine:   {np.sin(x_rad)}")
print(f"Cosine: {np.cos(x_rad)}")
```

**আউটপুট:**

```
রেডিয়ানে কোণ: [0.         0.52359878 0.78539816 1.04719755 1.57079633]

Sine:   [0.         0.5        0.70710678 0.8660254  1.        ]
Cosine: [1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01
 6.12323400e-17]
```

-----

### **৩. লগারিদমিক ফাংশন**

অনেক মেশিন লার্নিং অ্যালগরিদমে, বিশেষ করে সম্ভাব্যতা এবং ইনফরমেশন থিওরিতে লগারিদম অপরিহার্য।

  * **`np.log(x)`**: স্বাভাবিক লগারিদম (বেস $e$)।
  * **`np.log2(x)`**: বেস-২ লগারিদম। "২-কে কত পাওয়ারে উন্নীত করলে x পাওয়া যাবে?" এই প্রশ্নের উত্তর দেয়।
  * **`np.log10(x)`**: বেস-১০ লগারিদম।

<!-- end list -->

```python
x = np.array([2, 8, 32, 100, 1000])

print(f"বেস-২ লগারিদম (log2): {np.log2(x)}")
print(f"বেস-১০ লগারিদম (log10): {np.log10(x)}")
```

**আউটপুট:**

```
বেস-২ লগারিদম (log2): [1.         3.         5.         6.64385619 9.96578428]
বেস-১০ লগারিদম (log10): [0.30103    0.90309    1.50514998 2.         3.        ]
```

-----

### **৪. AI/ML-এর জন্য অন্যান্য গুরুত্বপূর্ণ গাণিতিক ফাংশন**

এখানে আরও কিছু ফাংশন রয়েছে যা আপনি প্রায়শই দেখবেন।

### **অ্যাগ্রিগেশন ফাংশন (Aggregation Functions)**

এই ফাংশনগুলো একটি অ্যারে থেকে একটি একক মান গণনা করে।

```python
x = np.array([1, 2, 3, 4, 5])

print(f"যোগফল: {np.sum(x)}")             # সমস্ত উপাদানের যোগফল
print(f"ক্রমযোজিত যোগফল: {np.cumsum(x)}")  # উপাদান যোগ হওয়ার সাথে সাথে যোগফল
print(f"গড়: {np.mean(x)}") # গড় মান
print(f"স্ট্যান্ডার্ড ডেভিয়েশন: {np.std(x)}") # ডেটার বিস্তৃতির পরিমাপ
print(f"সর্বনিম্ন মান: {np.min(x)}")    # সবচেয়ে ছোট মান
print(f"সর্বোচ্চ মান: {np.max(x)}")    # সবচেয়ে বড় মান
```

**আউটপুট:**

```
যোগফল: 15
ক্রমযোজিত যোগফল: [ 1  3  6 10 15]
গড়: 3.0
স্ট্যান্ডার্ড ডেভিয়েশন: 1.4142135623730951
সর্বনিম্ন মান: 1
সর্বোচ্চ মান: 5
```

### **এক্সপোনেনশিয়াল এবং পাওয়ার ফাংশন**

নিউরাল নেটওয়ার্কের অ্যাক্টিভেশন ফাংশন এবং বিভিন্ন পরিসংখ্যানগত ডিস্ট্রিবিউশনের জন্য এগুলো অত্যন্ত গুরুত্বপূর্ণ।

```python
x = np.array([1, 2, 3])

print(f"এক্সপোনেনশিয়াল (e^x): {np.exp(x)}")  # e-কে প্রতিটি উপাদানের পাওয়ারে উন্নীত করা
print(f"বর্গমূল: {np.sqrt(x)}")       # প্রতিটি উপাদানের বর্গমূল
```

**আউটপুট:**

```
এক্সপোনেনশিয়াল (e^x): [ 2.71828183  7.3890561  20.08553692]
বর্গমূল: [1.         1.41421356 1.73205081]
```

### **রৈখিক বীজগণিত (Linear Algebra)**

ডিপ লার্নিং-এ ম্যাট্রিক্স গুণন সবচেয়ে সাধারণ অপারেশন।

```python
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

# ম্যাট্রিক্স গুণন (ডট প্রোডাক্ট)
dot_product = np.dot(a, b)
# @ অপারেটরটি ম্যাট্রিক্স গুণনের জন্য একটি সুবিধাজনক শর্টহ্যান্ড
dot_product_shorthand = a @ b

print(f"ম্যাট্রিক্স a:\n{a}\n\nম্যাট্রিক্স b:\n{b}\n")
print(f"ডট প্রোডাক্ট (a @ b):\n{dot_product_shorthand}")
```

**আউটপুট:**

```
ম্যাট্রিক্স a:
[[1 2]
 [3 4]]

ম্যাট্রিক্স b:
[[5 6]
 [7 8]]

ডট প্রোডাক্ট (a @ b):
[[19 22]
 [43 50]]
```

In [None]:
# We need Sometimes apply mathematical operation on arrays item numpy gives efficient solutioon for it
x = np.random.randint(20,30, 10)
y = np.random.randint(1,10, 10)
print(x)
print(y)

# addition
print(f"Addition: {x+y}")
# print(f"Addition: {np.add(x,y)}")

# subtraction
print(f"Subtraction: {x-y}")

# Multiplication
print(f"Multiplication: {x*y}")

# Division
print(f"Division: {x/y}")

# Modulas
print(f"Modulas: {x%y}")

[27 20 24 25 22 26 25 20 24 23]
[3 9 3 6 2 8 4 7 8 7]
Addition: [30 29 27 31 24 34 29 27 32 30]
Subtraction: [24 11 21 19 20 18 21 13 16 16]
Multiplication: [ 81 180  72 150  44 208 100 140 192 161]
Division: [ 9.          2.22222222  8.          4.16666667 11.          3.25
  6.25        2.85714286  3.          3.28571429]
Modulas: [0 2 0 1 0 2 1 6 0 2]


In [None]:
# there also provide trigonometry function
# like sin, cos, tan, deg to radian, radian to degree

# Degree to radian = degree(theata) * (pi/180)
# Radian to Degree = raidan * (180/pi)


x = np.random.randint(20,30, 10)
print(x)
print(np.sin(x))
print(np.cos(x))
print(np.tan(x))

radian_to_degree = np.rad2deg(x)
print(radian_to_degree)
print(np.deg2rad(radian_to_degree))

[25 21 22 28 22 29 25 27 23 27]
[-0.13235175  0.83665564 -0.00885131  0.27090579 -0.00885131 -0.66363388
 -0.13235175  0.95637593 -0.8462204   0.95637593]
[ 0.99120281 -0.54772926 -0.99996083 -0.96260587 -0.99996083 -0.74805753
  0.99120281 -0.29213881 -0.53283302 -0.29213881]
[-0.13352641 -1.52749853  0.00885166 -0.2814296   0.00885166  0.88714284
 -0.13352641 -3.2737038   1.58815308 -3.2737038 ]
[1432.39448783 1203.21136977 1260.50714929 1604.28182637 1260.50714929
 1661.57760588 1432.39448783 1546.98604685 1317.8029288  1546.98604685]
[25. 21. 22. 28. 22. 29. 25. 27. 23. 27.]


In [None]:
# log
# log10: how many times we divide a number with 10 until quotient is 1
# log2: how many times we divide a number with 2 until quotient is 1

x = np.array([2,8,32,100, 110])
print(np.log10(x))
print(np.log2(x))


[0.30103    0.90308999 1.50514998 2.         2.04139269]
[1.         3.         5.         6.64385619 6.78135971]


In [None]:
# some other
# sum of list
print(np.sum(x))

# cumulative sum
print(np.cumsum(x))


252
[  2  10  42 142 252]


# **NumPy Broadcasting**

Broadcasting is a powerful mechanism in NumPy that allows you to perform arithmetic operations on arrays of **different shapes**. It provides a convenient way of vectorizing array operations so that looping occurs in efficient, pre-compiled C code. When operating on two arrays, NumPy compares their shapes element-wise. It starts with the trailing (i.e., rightmost) dimensions and works its way left.

-----

## **The Simplest Case: Array and a Scalar**

The most common example of broadcasting is when you perform an operation between an array and a single number (a scalar). In this case, NumPy conceptually "stretches" or "duplicates" the scalar to match the shape of the array.

```python
import numpy as np

x = np.array([10, 8, 16, 100])

# Here, the scalar 2 is "broadcast" across the array x
result = x + 2
print(f"Scalar Addition:\n{result}")
```

**Output:**

```
Scalar Addition:
[ 12  10  18 102]
```

This also works for multi-dimensional arrays. The scalar is broadcast to every single element.

```python
matrix = np.array([
    [10, 20, 30],
    [40, 50, 60]
])

# The scalar 2 is added to every element in the matrix
print(f"\nMatrix + Scalar:\n{matrix + 2}")
```

**Output:**

```
Matrix + Scalar:
[[12 22 32]
 [42 52 62]]
```

-----

## **The Rules of Broadcasting 📜**

For an operation between two arrays to be valid, NumPy follows two simple rules, checked dimension by dimension from right to left:

1.  **Rule 1:** If the two arrays have a different number of dimensions, the shape of the one with fewer dimensions is **padded with ones** on its left side.
2.  **Rule 2:** In any dimension, the sizes must either be **equal**, or one of them must be **1**.

If these conditions are met, the arrays are compatible. If not, a `ValueError` is raised. During the operation, any dimension with size 1 is stretched to match the other array's size in that dimension.

### **Example 1: 2D Matrix + 1D Vector**

Let's see how the rules apply when adding a matrix and a vector.

```python
matrix = np.array([
    [10, 20, 30],
    [40, 50, 60]
])
vector = np.array([1, 2, 3])

# Operation: matrix + vector
# Matrix Shape: (2, 3)
# Vector Shape: (3,)

# Rule 1: Pad the vector's shape with a 1 -> (1, 3)
# Rule 2: Compare dimensions from right to left:
# - Trailing dim: 3 == 3 (OK)
# - Next dim:     2 vs 1 (OK, 1 can be stretched to 2)

# The vector [1, 2, 3] is stretched to become [[1, 2, 3], [1, 2, 3]]
# and then added to the matrix.

result = matrix + vector
print(f"Matrix (2,3) + Vector (3,):\n{result}")
```

**Output:**

```
Matrix (2,3) + Vector (3,):
[[11 22 33]
 [41 52 63]]
```

### **Example 2: 3D Matrix + 2D Matrix**

The same rules apply to higher dimensions.

```python
matrix_3d = np.array([
  [
    [10, 20, 30],
    [40, 50, 60]
  ],
  [
    [50, 60, 70],
    [80, 90, 100]
  ]
])

matrix_2d = np.array([[1, 2, 3], [4, 5, 6]])

# Operation: matrix_3d + matrix_2d
# 3D Matrix Shape: (2, 2, 3)
# 2D Matrix Shape: (2, 3)

# Rule 1: Pad the 2D matrix's shape -> (1, 2, 3)
# Rule 2: Compare dimensions from right to left:
# - Trailing dim: 3 == 3 (OK)
# - Next dim:     2 == 2 (OK)
# - Leading dim:  2 vs 1 (OK, 1 can be stretched to 2)

# The 2D matrix is duplicated along the new leading dimension and
# added to each "layer" of the 3D matrix.

result = matrix_3d + matrix_2d
print(f"\n3D Matrix (2,2,3) + 2D Matrix (2,3):\n{result}")
```

**Output:**

```
3D Matrix (2,2,3) + 2D Matrix (2,3):
[[[ 11  22  33]
  [ 44  55  66]]

 [[ 51  62  73]
  [ 84  95 106]]]
```
------


## **NumPy ব্রডকাস্টিং (Broadcasting)**

ব্রডকাস্টিং হলো NumPy-এর একটি শক্তিশালী কৌশল যা আপনাকে **ভিন্ন ভিন্ন শেপের** অ্যারেগুলোর মধ্যে গাণিতিক অপারেশন চালানোর সুযোগ দেয়। এটি অ্যারে অপারেশনগুলোকে ভেক্টরাইজ করার একটি সুবিধাজনক উপায়, যার ফলে লুপিংয়ের কাজটি দক্ষ, প্রি-কম্পাইলড C কোডে সম্পন্ন হয়। দুটি অ্যারের উপর অপারেশন করার সময়, NumPy তাদের শেপগুলোকে এলিমেন্ট-ওয়াইজ তুলনা করে। এটি ডানদিকের (trailing) ডাইমেনশন থেকে শুরু করে বাম দিকে অগ্রসর হয়।

-----

### **সবচেয়ে সহজ উদাহরণ: অ্যারে এবং একটি স্কেলার**

ব্রডকাস্টিংয়ের সবচেয়ে সাধারণ উদাহরণ হলো যখন আপনি একটি অ্যারে এবং একটি একক সংখ্যার (স্কেলার) মধ্যে অপারেশন করেন। এক্ষেত্রে, NumPy অ্যারের শেপের সাথে মেলানোর জন্য স্কেলারটিকে ধারণাগতভাবে "প্রসারিত" বা "ডুপ্লিকেট" করে।

```python
import numpy as np

x = np.array([10, 8, 16, 100])

# এখানে, স্কেলার 2-কে অ্যারে x জুড়ে "ব্রডকাস্ট" করা হয়েছে
result = x + 2
print(f"স্কেলার যোগ:\n{result}")
```

**আউটপুট:**

```
স্কেলার যোগ:
[ 12  10  18 102]
```

এটি বহুমাত্রিক (multi-dimensional) অ্যারের ক্ষেত্রেও কাজ করে। স্কেলারটি প্রতিটি উপাদানের সাথে ব্রডকাস্ট করা হয়।

```python
matrix = np.array([
    [10, 20, 30],
    [40, 50, 60]
])

# স্কেলার 2 ম্যাট্রিক্সের প্রতিটি উপাদানের সাথে যোগ করা হয়েছে
print(f"\nম্যাট্রিক্স + স্কেলার:\n{matrix + 2}")
```

**আউটপুট:**

```
ম্যাট্রিক্স + স্কেলার:
[[12 22 32]
 [42 52 62]]
```

-----

### **ব্রডকাস্টিংয়ের নিয়মাবলী 📜**

দুটি অ্যারের মধ্যে একটি অপারেশন বৈধ হওয়ার জন্য, NumPy ডান থেকে বামে ডাইমেনশন-বাই-ডাইমেনশন দুটি সহজ নিয়ম অনুসরণ করে:

1.  **নিয়ম ১:** যদি দুটি অ্যারের ডাইমেনশন সংখ্যা ভিন্ন হয়, তবে কম ডাইমেনশনযুক্ত অ্যারের শেপের বাম দিকে **এক (`1`)** দিয়ে প্যাডিং করা হয়।
2.  **নিয়ম ২:** যেকোনো ডাইমেনশনে, আকারগুলো হয় **সমান** হতে হবে, অথবা তাদের মধ্যে একটির আকার **১** হতে হবে।

যদি এই শর্তগুলো পূরণ হয়, তবে অ্যারেগুলো সামঞ্জস্যপূর্ণ। যদি না হয়, তবে একটি `ValueError` দেখানো হয়। অপারেশনের সময়, ১ আকারের যেকোনো ডাইমেনশনকে অন্য অ্যারের সেই ডাইমেনশনের আকারের সাথে মেলানোর জন্য প্রসারিত করা হয়।

#### **উদাহরণ ১: 2D ম্যাট্রিক্স + 1D ভেক্টর**

চলুন দেখি একটি ম্যাট্রিক্স এবং একটি ভেক্টর যোগ করার সময় নিয়মগুলো কীভাবে প্রযোজ্য হয়।

```python
matrix = np.array([
    [10, 20, 30],
    [40, 50, 60]
])
vector = np.array([1, 2, 3])

# অপারেশন: matrix + vector
# ম্যাট্রিক্সের শেপ: (2, 3)
# ভেক্টরের শেপ: (3,)

# নিয়ম ১: ভেক্টরের শেপকে ১ দিয়ে প্যাড করা হলো -> (1, 3)
# নিয়ম ২: ডান থেকে বামে ডাইমেনশন তুলনা:
# - শেষ ডাইমেনশন: 3 == 3 (ঠিক আছে)
# - পরবর্তী ডাইমেনশন: 2 বনাম 1 (ঠিক আছে, 1-কে 2 পর্যন্ত প্রসারিত করা যেতে পারে)

# ভেক্টর [1, 2, 3]-কে প্রসারিত করে [[1, 2, 3], [1, 2, 3]] বানানো হয়
# এবং তারপর ম্যাট্রিক্সের সাথে যোগ করা হয়।

result = matrix + vector
print(f"ম্যাট্রিক্স (2,3) + ভেক্টর (3,):\n{result}")
```

**আউটপুট:**

```
ম্যাট্রিক্স (2,3) + ভেক্টর (3,):
[[11 22 33]
 [41 52 63]]
```

#### **উদাহরণ ২: 3D ম্যাট্রিক্স + 2D ম্যাট্রিক্স**

একই নিয়ম উচ্চতর ডাইমেনশনের ক্ষেত্রেও প্রযোজ্য।

```python
matrix_3d = np.array([
  [
    [10, 20, 30],
    [40, 50, 60]
  ],
  [
    [50, 60, 70],
    [80, 90, 100]
  ]
])

matrix_2d = np.array([[1, 2, 3], [4, 5, 6]])

# অপারেশন: matrix_3d + matrix_2d
# 3D ম্যাট্রিক্সের শেপ: (2, 2, 3)
# 2D ম্যাট্রিক্সের শেপ: (2, 3)

# নিয়ম ১: 2D ম্যাট্রিক্সের শেপকে প্যাড করা হলো -> (1, 2, 3)
# নিয়ম ২: ডান থেকে বামে ডাইমেনশন তুলনা:
# - শেষ ডাইমেনশন: 3 == 3 (ঠিক আছে)
# - পরবর্তী ডাইমেনশন: 2 == 2 (ঠিক আছে)
# - প্রথম ডাইমেনশন: 2 বনাম 1 (ঠিক আছে, 1-কে 2 পর্যন্ত প্রসারিত করা যেতে পারে)

# 2D ম্যাট্রিক্সটিকে নতুন প্রথম ডাইমেনশন বরাবর ডুপ্লিকেট করা হয় এবং
# 3D ম্যাট্রিক্সের প্রতিটি "স্তরের" সাথে যোগ করা হয়।

result = matrix_3d + matrix_2d
print(f"\n3D ম্যাট্রিক্স (2,2,3) + 2D ম্যাট্রিক্স (2,3):\n{result}")
```

**আউটপুট:**

```
3D ম্যাট্রিক্স (2,2,3) + 2D ম্যাট্রিক্স (2,3):
[[[ 11  22  33]
  [ 44  55  66]]

 [[ 51  62  73]
  [ 84  95 106]]]
```

In [None]:
x = np.array([10, 8, 16, 100])

result = x ** 2

print(result)

# what happen here?  when we  x ** 2 write this expression it make another array of x size and put [2,2,2,2] and then square to the all element of x

# We can also do additon, multplication, moudlas etc
result = x + 2
print(result)

[  100    64   256 10000]
[ 12  10  18 102]


In [None]:
# It also work on 2d 3d array
matrix = np.array([
    [10, 20, 30],
    [40, 50, 60]
])


print(matrix+2)

vector = np.array([1, 2, 3])
result = matrix + vector
print(result)

# it workd like:
#  10, 20, 30
# +1, 2, 3

# 40, 50, 60
# +1, 2, 3

# if colum size matrix and vector same it shows error

[[12 22 32]
 [42 52 62]]
[[11 22 33]
 [41 52 63]]


In [None]:
matrix = np.array([
  [
    [10, 20, 30],
    [40, 50, 60]
  ],
  [
    [50, 60, 70],
    [80, 90, 100]
  ]
])

result = matrix +  2
print(result)
print()

vector = np.array([[1, 2, 3],[3,4,5]])
result = matrix + vector
print(result)


[[[ 12  22  32]
  [ 42  52  62]]

 [[ 52  62  72]
  [ 82  92 102]]]

[[[ 11  22  33]
  [ 43  54  65]]

 [[ 51  62  73]
  [ 83  94 105]]]


# **NumPy Logical Functions 🧠**

Logical functions in NumPy are essential for data analysis and machine learning, allowing you to perform element-wise comparisons and create "masks" to filter your data based on certain conditions.

-----

## **1. Element-wise Comparisons**

Just like arithmetic operators, logical comparison operators (`>`, `<`, `==`, `!=`) work on an **element-wise** basis when applied to NumPy arrays of the same shape. They compare the elements at each corresponding position and return a new **boolean array** of `True` or `False` values.

```python
import numpy as np

x = np.array([10, 20, 30, 40, 50])
y = np.array([1, 2, 30, 4, 5])

print(f"Array x: {x}")
print(f"Array y: {y}\n")

# Is each element in x GREATER THAN the corresponding element in y?
x_is_greater_than_y = x > y
print(f"x > y : {x_is_greater_than_y}")

# Is each element in x LESS THAN the corresponding element in y?
x_is_less_than_y = x < y
print(f"x < y : {x_is_less_than_y}")

# Is each element in x EQUAL TO the corresponding element in y?
x_is_equal_to_y = x == y
print(f"x == y: {x_is_equal_to_y}")
```

**Output:**

```
Array x: [10 20 30 40 50]
Array y: [ 1  2 30  4  5]

x > y : [ True  True False  True  True]
x < y : [False False False False False]
x == y: [False False  True False False]
```

Notice how the result at index 2 for `x > y` is `False` and `x == y` is `True`, because `30` is not greater than `30`, but it is equal.

-----

## **2. `np.all()` - Checking if Everything is True**

The `np.all()` function takes a boolean array as input and returns a single `True` value only if **every single element** in that array is `True`. Otherwise, it returns `False`.

```python
# Are ALL elements in x greater than their counterparts in y?
print(f"np.all(x > y): {np.all(x_is_greater_than_y)}")

# Are ALL elements in x less than their counterparts in y?
print(f"np.all(x < y): {np.all(x_is_less_than_y)}")
```

**Output:**

```
np.all(x > y): False
np.all(x < y): False
```

The first result is `False` because the comparison `x > y` resulted in a boolean array that contained one `False` value.

-----

## **3. `np.any()` - Checking if Anything is True**

The `np.any()` function takes a boolean array as input and returns `True` if **at least one element** in that array is `True`. It only returns `False` if all elements are `False`.

```python
# Is THERE ANY element in x that is greater than its counterpart in y?
print(f"np.any(x > y): {np.any(x_is_greater_than_y)}")

# Is THERE ANY element in x that is equal to its counterpart in y?
print(f"np.any(x == y): {np.any(x_is_equal_to_y)}")

# Is THERE ANY element in x that is less than its counterpart in y?
print(f"np.any(x < y): {np.any(x_is_less_than_y)}")
```

**Output:**

```
np.any(x > y): True
np.any(x == y): True
np.any(x < y): False
```

The last result is `False` because the comparison `x < y` produced an array containing only `False` values.

---

## **NumPy লজিক্যাল ফাংশন 🧠**

ডেটা বিশ্লেষণ এবং মেশিন লার্নিং-এর জন্য NumPy-এর লজিক্যাল ফাংশনগুলো অপরিহার্য। এগুলো আপনাকে এলিমেন্ট-ওয়াইজ তুলনা করতে এবং নির্দিষ্ট শর্তের উপর ভিত্তি করে আপনার ডেটা ফিল্টার করার জন্য "মাস্ক" (mask) তৈরি করতে সাহায্য করে।

-----

### **১. এলিমেন্ট-ওয়াইজ তুলনা**

অ্যারিথমেটিক অপারেটরগুলোর মতোই, লজিক্যাল কম্পারিজন অপারেটর (`>`, `<`, `==`, `!=`) একই আকারের NumPy অ্যারের উপর **এলিমেন্ট-ওয়াইজ** (element-wise) ভিত্তিতে কাজ করে। এগুলো প্রতিটি সংশ্লিষ্ট অবস্থানের উপাদানগুলোর মধ্যে তুলনা করে এবং `True` বা `False` মান সহ একটি নতুন **বুলিয়ান অ্যারে** রিটার্ন করে।

```python
import numpy as np

x = np.array([10, 20, 30, 40, 50])
y = np.array([1, 2, 30, 4, 5])

print(f"অ্যারে x: {x}")
print(f"অ্যারে y: {y}\n")

# x-এর প্রতিটি উপাদান কি y-এর সংশ্লিষ্ট উপাদানের চেয়ে বড়?
x_is_greater_than_y = x > y
print(f"x > y : {x_is_greater_than_y}")

# x-এর প্রতিটি উপাদান কি y-এর সংশ্লিষ্ট উপাদানের চেয়ে ছোট?
x_is_less_than_y = x < y
print(f"x < y : {x_is_less_than_y}")

# x-এর প্রতিটি উপাদান কি y-এর সংশ্লিষ্ট উপাদানের সমান?
x_is_equal_to_y = x == y
print(f"x == y: {x_is_equal_to_y}")
```

**আউটপুট:**

```
অ্যারে x: [10 20 30 40 50]
অ্যারে y: [ 1  2 30  4  5]

x > y : [ True  True False  True  True]
x < y : [False False False False False]
x == y: [False False  True False False]
```

লক্ষ্য করুন, `x > y`-এর জন্য ইনডেক্স ২-এর ফলাফল `False` এবং `x == y`-এর জন্য `True` হয়েছে, কারণ `30`, `30`-এর চেয়ে বড় নয়, কিন্তু এটি সমান।

-----

### **২. `np.all()` - সবকিছু True কিনা তা পরীক্ষা করা**

`np.all()` ফাংশনটি একটি বুলিয়ান অ্যারে ইনপুট হিসেবে নেয় এবং শুধুমাত্র তখনই একটি `True` মান রিটার্ন করে যদি সেই অ্যারের **প্রতিটি উপাদান** `True` হয়। অন্যথায়, এটি `False` রিটার্ন করে।

```python
# x-এর সমস্ত উপাদান কি y-এর প্রতিরূপের চেয়ে বড়?
print(f"np.all(x > y): {np.all(x_is_greater_than_y)}")

# x-এর সমস্ত উপাদান কি y-এর প্রতিরূপের চেয়ে ছোট?
print(f"np.all(x < y): {np.all(x_is_less_than_y)}")
```

**আউটপুট:**

```
np.all(x > y): False
np.all(x < y): False
```

প্রথম ফলাফলটি `False` কারণ `x > y` তুলনার ফলে যে বুলিয়ান অ্যারেটি তৈরি হয়েছিল, তাতে একটি `False` মান ছিল।

-----

### **৩. `np.any()` - কোনো কিছু True কিনা তা পরীক্ষা করা**

`np.any()` ফাংশনটি একটি বুলিয়ান অ্যারে ইনপুট হিসেবে নেয় এবং যদি সেই অ্যারেতে **অন্তত একটি উপাদান** `True` থাকে, তবে এটি `True` রিটার্ন করে। এটি শুধুমাত্র তখনই `False` রিটার্ন করে যখন সমস্ত উপাদান `False` থাকে।

```python
# x-এ কি এমন কোনো উপাদান আছে যা y-এর প্রতিরূপের চেয়ে বড়?
print(f"np.any(x > y): {np.any(x_is_greater_than_y)}")

# x-এ কি এমন কোনো উপাদান আছে যা y-এর প্রতিরূপের সমান?
print(f"np.any(x == y): {np.any(x_is_equal_to_y)}")

# x-এ কি এমন কোনো উপাদান আছে যা y-এর প্রতিরূপের চেয়ে ছোট?
print(f"np.any(x < y): {np.any(x_is_less_than_y)}")
```

**আউটপুট:**

```
np.any(x > y): True
np.any(x == y): True
np.any(x < y): False
```

শেষ ফলাফলটি `False` কারণ `x < y` তুলনার ফলে শুধুমাত্র `False` মানযুক্ত একটি অ্যারে তৈরি হয়েছিল।

In [None]:
x = np.array([10,20,30,40,50])
y = np.array([1,2,3,4,5])

# check all is all greater or less than
x_is_greaer_than_y = x > y
print(x_is_greaer_then_y)


x_is_less_than_y = x < y
print(x_is_less_than_y)


x_is_equal_to_y = x == y
print(x_is_less_than_y)

# check all value is True in list or not
print(np.all(x_is_greaer_than_y))
print(np.all(x_is_less_than_y))
print(np.all(x_is_equal_to_y))


# Check if any value True in list or not
print(np.any(x_is_greaer_than_y))
print(np.any(x_is_less_than_y))
print(np.any(x_is_equal_to_y))


[ True  True  True  True  True]
[False False False False False]
[False False False False False]
True
False
False
True
False
False


# **`ndarray` Sorting**



Sorting is a common operation used to arrange the elements of an array in a specific order (usually ascending). NumPy provides efficient and flexible functions for sorting arrays of any dimension.

It's important to understand the two main ways sorting can be done:

  * **In-place sort**: The original array is modified directly.
  * **Copy sort**: A new, sorted copy of the array is created, leaving the original array unchanged.

-----

## **1. Sorting 1D Arrays**

### **In-place Sorting: `.sort()` Method**

The `.sort()` method is called directly on a NumPy array object and sorts it **in-place**.

```python
import numpy as np

x = np.array([50, 30, 40, 10, 20])
print(f"Original array: {x}")

# The .sort() method modifies the array 'x' directly
x.sort()
print(f"Array after in-place sort: {x}")
```

**Output:**

```
Original array: [50 30 40 10 20]
Array after in--place sort: [10 20 30 40 50]
```

### **Copy Sorting: `np.sort()` Function**

The `np.sort()` function takes an array as an argument and returns a **new, sorted copy**, leaving the original array untouched.

```python
x = np.array([50, 30, 40, 10, 20])
print(f"Original array: {x}")

# np.sort() returns a sorted copy
z = np.sort(x)

print(f"The new sorted array (copy): {z}")
print(f"The original array is unchanged: {x}")
```

**Output:**

```
Original array: [50 30 40 10 20]
The new sorted array (copy): [10 20 30 40 50]
The original array is unchanged: [50 30 40 10 20]
```

-----

## **2. Sorting Multi-dimensional Arrays**

For 2D or 3D arrays, you can specify the `axis` along which to sort.

  * **`axis=1` (Horizontal Sort)**: Sorts the elements **within each row**. This is the default behavior.
  * **`axis=0` (Vertical Sort)**: Sorts the elements **down each column**.

### **Sorting a 2D Array**

```python
matrix = np.array([
    [20, 10, 8],
    [21, 4, 3]
])
print(f"Original 2D matrix:\n{matrix}\n")

# Horizontal sort (across columns, within each row)
sort_horizontal = np.sort(matrix, axis=1) # axis=1 is the default
print(f"Horizontal sort (axis=1):\n{sort_horizontal}\n")

# Vertical sort (down rows, within each column)
sort_vertical = np.sort(matrix, axis=0)
print(f"Vertical sort (axis=0):\n{sort_vertical}")
```

**Output:**

```
Original 2D matrix:
[[20 10  8]
 [21  4  3]]

Horizontal sort (axis=1):
[[ 8 10 20]
 [ 3  4 21]]

Vertical sort (axis=0):
[[20  4  3]
 [21 10  8]]
```

### **Sorting a 3D Array**

The same axis logic applies to 3D arrays. `axis=1` will sort within each "row" of each 2D slice, while `axis=0` will sort "vertically" across the different 2D slices.

```python
matrix_3d = np.array([
  [
    [20, 30, 10],
    [60, 40, 50]
  ],
  [
    [80, 50, 90],
    [100, 90, 10]
  ]
])
print(f"Original 3D matrix:\n{matrix_3d}\n")

# Horizontal sort (axis=1 is the default for 3D as well)
sort_horizontal_3d = np.sort(matrix_3d, axis=1)
print(f"Horizontal sort (axis=1) on 3D array:\n{sort_horizontal_3d}\n")

# Vertical sort (axis=0)
sort_vertical_3d = np.sort(matrix_3d, axis=0)
print(f"Vertical sort (axis=0) on 3D array:\n{sort_vertical_3d}")
```

**Output:**

```
Original 3D matrix:
[[[ 20  30  10]
  [ 60  40  50]]

 [[ 80  50  90]
  [100  90  10]]]

Horizontal sort (axis=1) on 3D array:
[[[ 10  20  30]
  [ 40  50  60]]

 [[ 50  80  90]
  [ 10  90 100]]]

Vertical sort (axis=0) on 3D array:
[[[ 20  30  10]
  [ 60  40  10]]

 [[ 80  50  90]
  [100  90  50]]]
```

__



## **`ndarray` সর্টিং (Sorting)**

সর্টিং একটি সাধারণ অপারেশন যা একটি অ্যারের উপাদানগুলোকে একটি নির্দিষ্ট ক্রমে (সাধারণত ঊর্ধক্রমে) সাজাতে ব্যবহৃত হয়। NumPy যেকোনো ডাইমেনশনের অ্যারে সর্ট করার জন্য কার্যকর এবং নমনীয় ফাংশন সরবরাহ করে।

সর্টিং করার দুটি প্রধান উপায় বোঝা গুরুত্বপূর্ণ:

  * **ইন-প্লেস সর্ট (In-place sort)**: মূল অ্যারেটি সরাসরি পরিবর্তিত হয়।
  * **কপি সর্ট (Copy sort)**: অ্যারের একটি নতুন, সর্ট করা কপি তৈরি হয়, যা মূল অ্যারেটিকে অপরিবর্তিত রাখে।

-----

### **১. 1D অ্যারে সর্টিং**

#### **ইন-প্লেস সর্টিং: `.sort()` মেথড**

`.sort()` মেথডটি সরাসরি একটি NumPy অ্যারে অবজেক্টের উপর কল করা হয় এবং এটিকে **ইন-প্লেস** সর্ট করে।

```python
import numpy as np

x = np.array([50, 30, 40, 10, 20])
print(f"মূল অ্যারে: {x}")

# .sort() মেথডটি 'x' অ্যারেটিকে সরাসরি পরিবর্তন করে
x.sort()
print(f"ইন-প্লেস সর্টের পর অ্যারে: {x}")
```

**আউটপুট:**

```
মূল অ্যারে: [50 30 40 10 20]
ইন-প্লেস সর্টের পর অ্যারে: [10 20 30 40 50]
```

#### **কপি সর্টিং: `np.sort()` ফাংশন**

`np.sort()` ফাংশনটি একটি অ্যারে আর্গুমেন্ট হিসেবে নেয় এবং একটি **নতুন, সর্ট করা কপি** রিটার্ন করে, যা মূল অ্যারেটিকে অপরিবর্তিত রাখে।

```python
x = np.array([50, 30, 40, 10, 20])
print(f"মূল অ্যারে: {x}")

# np.sort() একটি সর্ট করা কপি রিটার্ন করে
z = np.sort(x)

print(f"নতুন সর্ট করা অ্যারে (কপি): {z}")
print(f"মূল অ্যারেটি অপরিবর্তিত আছে: {x}")
```

**আউটপুট:**

```
মূল অ্যারে: [50 30 40 10 20]
নতুন সর্ট করা অ্যারে (কপি): [10 20 30 40 50]
মূল অ্যারেটি অপরিবর্তিত আছে: [50 30 40 10 20]
```

-----

### **২. বহুমাত্রিক (Multi-dimensional) অ্যারে সর্টিং**

2D বা 3D অ্যারের জন্য, আপনি কোন `axis` বরাবর সর্ট করতে চান তা নির্দিষ্ট করতে পারেন।

  * **`axis=1` (আনুভূমিক বা Horizontal Sort)**: **প্রতিটি সারির মধ্যে** উপাদানগুলোকে সর্ট করে। এটি ডিফল্ট আচরণ।
  * **`axis=0` (উল্লম্ব বা Vertical Sort)**: **প্রতিটি কলাম বরাবর নিচের দিকে** উপাদানগুলোকে সর্ট করে।

#### **2D অ্যারে সর্টিং**

```python
matrix = np.array([
    [20, 10, 8],
    [21, 4, 3]
])
print(f"মূল 2D ম্যাট্রিক্স:\n{matrix}\n")

# আনুভূমিক সর্ট (কলাম বরাবর, প্রতিটি সারির মধ্যে)
sort_horizontal = np.sort(matrix, axis=1) # axis=1 ডিফল্ট
print(f"আনুভূমিক সর্ট (axis=1):\n{sort_horizontal}\n")

# উল্লম্ব সর্ট (সারি বরাবর নিচে, প্রতিটি কলামের মধ্যে)
sort_vertical = np.sort(matrix, axis=0)
print(f"উল্লম্ব সর্ট (axis=0):\n{sort_vertical}")
```

**আউটপুট:**

```
মূল 2D ম্যাট্রিক্স:
[[20 10  8]
 [21  4  3]]

আনুভূমিক সর্ট (axis=1):
[[ 8 10 20]
 [ 3  4 21]]

উল্লম্ব সর্ট (axis=0):
[[20  4  3]
 [21 10  8]]
```

#### **3D অ্যারে সর্টিং**

একই axis-এর যুক্তি 3D অ্যারের ক্ষেত্রেও প্রযোজ্য।

```python
matrix_3d = np.array([
  [
    [20, 30, 10],
    [60, 40, 50]
  ],
  [
    [80, 50, 90],
    [100, 90, 10]
  ]
])
print(f"মূল 3D ম্যাট্রিক্স:\n{matrix_3d}\n")

# আনুভূমিক সর্ট (axis=1)
sort_horizontal_3d = np.sort(matrix_3d, axis=1)
print(f"3D অ্যারেতে আনুভূমিক সর্ট (axis=1):\n{sort_horizontal_3d}\n")

# উল্লম্ব সর্ট (axis=0)
sort_vertical_3d = np.sort(matrix_3d, axis=0)
print(f"3D অ্যারেতে উল্লম্ব সর্ট (axis=0):\n{sort_vertical_3d}")
```

**আউটপুট:**

```
মূল 3D ম্যাট্রিক্স:
[[[ 20  30  10]
  [ 60  40  50]]

 [[ 80  50  90]
  [100  90  10]]]

3D অ্যারেতে আনুভূমিক সর্ট (axis=1):
[[[ 10  20  30]
  [ 40  50  60]]

 [[ 50  80  90]
  [ 10  90 100]]]

3D অ্যারেতে উল্লম্ব সর্ট (axis=0):
[[[ 20  30  10]
  [ 60  40  10]]

 [[ 80  50  90]
  [100  90  50]]]
```

In [None]:
# inplace sort 1d
x = np.array([50,30,40,10,20])
z = x.copy()

print(z)
z.sort() # sort z and store in z
print(z)

[50 30 40 10 20]
[10 20 30 40 50]


In [None]:
# copy sorting
x = np.array([50,30,40,10,20])
z = np.sort(x) # it make copy of x and sort store it to z


print(z)
print(x)

[10 20 30 40 50]
[50 30 40 10 20]


In [None]:
# 2d sorting
# It can be horizonatl sort or vertical
# horizon: axis= 1
# vertical: axis = 0


matrix=  [
    [20, 10, 8],
    [21, 4, 3]
  ]

sort_horizontal = np.sort(matrix) # by defaul it sort horizontally
print(sort_horizontal)

sort_vertical = np.sort(matrix, axis=0)
print(sort_vertical)

print()
matrix = np.array([
  [
    [20,30, 10 ],
    [60, 40, 50]
  ],
  [
    [80, 50, 90],
    [100, 90, 10]
  ]
])

# 3d
sort_horizontal = np.sort(matrix) # by defaul it sort horizontally
print(sort_horizontal)
print()
sort_vertical = np.sort(matrix, axis=0)
print(sort_vertical)

[[ 8 10 20]
 [ 3  4 21]]
[[20  4  3]
 [21 10  8]]

[[[ 10  20  30]
  [ 40  50  60]]

 [[ 50  80  90]
  [ 10  90 100]]]

[[[ 20  30  10]
  [ 60  40  10]]

 [[ 80  50  90]
  [100  90  50]]]


# **`ndarray` Searching and Counting**

Finding elements that meet certain criteria and counting their occurrences are fundamental tasks in data analysis. NumPy provides highly optimized functions for these operations.

-----

## **1. Searching for Elements**

### **`np.where()` - Finding Indices**

The `np.where()` function is incredibly versatile for finding the indices of elements that satisfy a condition.

**Syntax 1: `np.where(condition)`**
This returns a tuple of arrays, one for each dimension, containing the indices of the elements where the condition is `True`.

```python
import numpy as np

x = np.array([50, 30, 40, 10, 20])

# Find the index where the value is exactly 10
index_eq = np.where(x == 10)
print(f"Index where x == 10: {index_eq}")

# Find indices where values are greater than 20
index_gt = np.where(x > 20)
print(f"Indices where x > 20: {index_gt}")
```

**Output:**

```
Index where x == 10: (array([3]),)
Indices where x > 20: (array([0, 1, 2]),)
```

For a 2D array, the output is a tuple of two arrays: `(row_indices, column_indices)`.

```python
matrix = np.array([
    [20, 10, 8],
    [21, 4, 3]
])
index_2d = np.where(matrix >= 20)
print(f"\nIndices in 2D array >= 20: {index_2d}")
```

**Output:**

```
Indices in 2D array >= 20: (array([0, 1]), array([0, 0]))
```

This means the condition is met at `(row 0, col 0)` and `(row 1, col 0)`.

-----

**Syntax 2: `np.where(condition, x, y)`**
This is a powerful conditional operation. It returns a new array where elements are taken from `x` if the condition is `True`, and from `y` if the condition is `False`.

```python
y = np.array([60, 30, 30, 10, 40])

# If x > y, the new element is 1, otherwise it's 0
new_arr = np.where(x > y, 1, 0)
print(f"\nConditional replacement (x > y): {new_arr}")
```

**Output:**

```
Conditional replacement (x > y): [0 0 1 0 0]
```

-----

### **`np.argmax()` and `np.argmin()` - Finding Extrema Indices**

These functions return the index of the **first occurrence** of the maximum or minimum value in an array. For a 2D array, it first flattens the array and then finds the index.

```python
x = np.array([50, 30, 40, 10, 50]) # 50 appears twice

# Find the index of the maximum value
max_val_index = np.argmax(x)
print(f"\nIndex of first max value: {max_val_index}")

# Find the index of the minimum value
min_val_index = np.argmin(x)
print(f"Index of min value: {min_val_index}")
```

**Output:**

```
Index of first max value: 0
Index of min value: 3
```

-----

## **2. Counting Elements**

### **`np.count_nonzero()` - Counting Based on a Condition**

A clever way to count elements that satisfy a condition is to use `np.count_nonzero()`. The conditional expression (e.g., `a > 43`) creates a boolean array (`True`/`False`), and `count_nonzero` effectively counts the number of `True` values.

```python
a = np.array([50, 12, 43, 88, 43, 99])

print(f"Count of elements > 43: {np.count_nonzero(a > 43)}")
print(f"Count of elements == 43: {np.count_nonzero(a == 43)}")
```

**Output:**

```
Count of elements > 43: 3
Count of elements == 43: 2
```

-----

### **`np.unique()` - Finding and Counting Unique Values**

The `np.unique()` function is used to find the unique elements in an array. It can also be configured to return the counts of each unique element.

**Syntax:** `np.unique(ar, return_counts=False)`

```python
a = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

# Find only the unique values
unique_values = np.unique(a)
print(f"\nUnique values: {unique_values}\n")

# Find unique values and their corresponding counts
uni_value, count_univalue = np.unique(a, return_counts=True)

print("Unique Values | Counts")
print("-----------------------")
for val, count in zip(uni_value, count_univalue):
    print(f"{val:13} | {count}")
```

**Output:**

```
Unique values: [1 2 3 4]

Unique Values | Counts
-----------------------
            1 | 1
            2 | 2
            3 | 3
            4 | 4
```

___

## **`ndarray` সার্চিং এবং কাউন্টিং**

নির্দিষ্ট শর্ত পূরণকারী উপাদান খুঁজে বের করা এবং তাদের সংখ্যা গণনা করা ডেটা বিশ্লেষণের মৌলিক কাজ। NumPy এই অপারেশনগুলোর জন্য অত্যন্ত অপ্টিমাইজড ফাংশন সরবরাহ করে।

-----

### **১. উপাদান খোঁজা (Searching for Elements)**

#### **`np.where()` - ইনডেক্স খোঁজা**

`np.where()` ফাংশনটি কোনো শর্ত পূরণকারী উপাদানগুলোর ইনডেক্স খুঁজে বের করার জন্য অত্যন্ত বহুমুখী।

**সিনট্যাক্স ১: `np.where(condition)`**
এটি ডাইমেনশন অনুযায়ী একটি টুপল রিটার্ন করে, যেখানে শর্তটি `True` হয় এমন উপাদানগুলোর ইনডেক্স থাকে।

```python
import numpy as np

x = np.array([50, 30, 40, 10, 20])

# যে ইনডেক্সে মান 10 আছে তা খোঁজা
index_eq = np.where(x == 10)
print(f"যেখানে x == 10 তার ইনডেক্স: {index_eq}")

# যে ইনডেক্সগুলোতে মান 20 এর চেয়ে বড় তা খোঁজা
index_gt = np.where(x > 20)
print(f"যেখানে x > 20 তার ইনডেক্স: {index_gt}")
```

**আউটপুট:**

```
যেখানে x == 10 তার ইনডেক্স: (array([3]),)
যেখানে x > 20 তার ইনডেক্স: (array([0, 1, 2]),)
```

একটি 2D অ্যারের জন্য, আউটপুটটি দুটি অ্যারের একটি টুপল হয়: `(সারি_ইনডেক্স, কলাম_ইনডেক্স)`।

```python
matrix = np.array([
    [20, 10, 8],
    [21, 4, 3]
])
index_2d = np.where(matrix >= 20)
print(f"\n2D অ্যারেতে >= 20 এমন ইনডেক্স: {index_2d}")
```

**আউটপুট:**

```
2D অ্যারেতে >= 20 এমন ইনডেক্স: (array([0, 1]), array([0, 0]))
```

এর মানে হলো শর্তটি `(সারি ০, কলাম ০)` এবং `(সারি ১, কলাম ০)` অবস্থানে পূরণ হয়েছে।

-----

**সিনট্যাক্স ২: `np.where(condition, x, y)`**
এটি একটি শক্তিশালী শর্তসাপেক্ষ অপারেশন। এটি একটি নতুন অ্যারে রিটার্ন করে যেখানে শর্তটি `True` হলে `x` থেকে এবং `False` হলে `y` থেকে উপাদান নেওয়া হয়।

```python
y = np.array([60, 30, 30, 10, 40])

# যদি x > y হয়, নতুন উপাদান হবে 1, অন্যথায় 0
new_arr = np.where(x > y, 1, 0)
print(f"\nশর্তসাপেক্ষ প্রতিস্থাপন (x > y): {new_arr}")
```

**আউটপুট:**

```
শর্তসাপেক্ষ প্রতিস্থাপন (x > y): [0 0 1 0 0]
```

-----

#### **`np.argmax()` এবং `np.argmin()` - এক্সট্রিমা ইনডেক্স খোঁজা**

এই ফাংশনগুলো একটি অ্যারের মধ্যে সর্বোচ্চ বা সর্বনিম্ন মানের **প্রথম ocorrência** (প্রথমবার যেখানে পাওয়া গেছে)-এর ইনডেক্স রিটার্ন করে। 2D অ্যারের ক্ষেত্রে, এটি প্রথমে অ্যারেটিকে ফ্ল্যাট করে তারপর ইনডেক্স খুঁজে বের করে।

```python
x = np.array([50, 30, 40, 10, 50]) # 50 দুইবার আছে

# সর্বোচ্চ মানের ইনডেক্স খোঁজা
max_val_index = np.argmax(x)
print(f"\nপ্রথম সর্বোচ্চ মানের ইনডেক্স: {max_val_index}")

# সর্বনিম্ন মানের ইনডেক্স খোঁজা
min_val_index = np.argmin(x)
print(f"সর্বনিম্ন মানের ইনডেক্স: {min_val_index}")
```

**আউটপুট:**

```
প্রথম সর্বোচ্চ মানের ইনডেক্স: 0
সর্বনিম্ন মানের ইনডেক্স: 3
```

-----

### **২. উপাদান গণনা করা (Counting Elements)**

#### **`np.count_nonzero()` - শর্তের উপর ভিত্তি করে গণনা**

একটি শর্ত পূরণকারী উপাদান গণনা করার একটি চতুর উপায় হলো `np.count_nonzero()` ব্যবহার করা। শর্তমূলক এক্সপ্রেশন (যেমন, `a > 43`) একটি বুলিয়ান অ্যারে (`True`/`False`) তৈরি করে এবং `count_nonzero` কার্যকরভাবে `True` মানের সংখ্যা গণনা করে।

```python
a = np.array([50, 12, 43, 88, 43, 99])

print(f"43 এর চেয়ে বড় উপাদানের সংখ্যা: {np.count_nonzero(a > 43)}")
print(f"43 এর সমান উপাদানের সংখ্যা: {np.count_nonzero(a == 43)}")
```

**আউটপুট:**

```
43 এর চেয়ে বড় উপাদানের সংখ্যা: 3
43 এর সমান উপাদানের সংখ্যা: 2
```

-----

#### **`np.unique()` - ইউনিক মান খোঁজা এবং গণনা**

`np.unique()` ফাংশনটি একটি অ্যারের মধ্যে ইউনিক বা স্বতন্ত্র উপাদানগুলো খুঁজে বের করতে ব্যবহৃত হয়। এটি প্রতিটি ইউনিক উপাদানের সংখ্যা গণনা করার জন্যও কনফিগার করা যেতে পারে।

**সিনট্যাক্স:** `np.unique(ar, return_counts=False)`

```python
a = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

# শুধুমাত্র ইউনিক মানগুলো খোঁজা
unique_values = np.unique(a)
print(f"\nইউনিক মানসমূহ: {unique_values}\n")

# ইউনিক মান এবং তাদের নিজ নিজ সংখ্যা খোঁজা
uni_value, count_univalue = np.unique(a, return_counts=True)

print("ইউনিক মান | সংখ্যা")
print("-----------------------")
for val, count in zip(uni_value, count_univalue):
    print(f"{val:10} | {count}")
```

**আউটপুট:**

```
ইউনিক মানসমূহ: [1 2 3 4]

ইউনিক মান | সংখ্যা
-----------------------
         1 | 1
         2 | 2
         3 | 3
         4 | 4
```

In [None]:
x = np.array([50, 30, 40, 10, 20])

# np.where
# find any item in x if find return the index
index = np.where(x==10) # retrun index

print(index)

# find index of value gretger 20
index = np.where(x>20)
print(index)

# find index of value less 20
index = np.where(x<20) # retrun indexs
print(index)


# np.where(conditon, x, y) if ture x, other wise y
y = np.array([60, 30, 30, 10, 40])
new_arr = np.array(np.where(x>y, 1, 0)) # retrun array
print(new_arr)

(array([3]),)
(array([0, 1, 2]),)
(array([3]),)
[0 0 1 0 0]


In [None]:
# working with 2d array
matrix = np.array([
    [20, 10, 8],
    [21, 4, 3]
])

index = np.where(matrix>=20)
print(index)


# here first portion is row No(array([0, 1]), and second portion is colum no array([0, 0]))

# we also replace with other value with conditon
arr = np.where(matrix>=20, 1, 0)
print(arr)

(array([0, 1]), array([0, 0]))
[[1 0 0]
 [1 0 0]]
[[20 10  8]
 [21  4  3]]


In [None]:

x = np.array([50, 30, 40, 10, 50])

# find maximu value index from arr
max_val_index = np.argmax(x)
print(max_val_index)

# find minimum value index from arr
min_val_index = np.argmin(x)
print(min_val_index)
#note if maximum or minimum value morte than one it always return first one index


0
3


In [None]:
matrix = np.array([
    [20, 10, 8],
    [21, 40, 500],
    [21, 40, 500]

])
# for 2d array it flatted array rowwise and find max value index
max_val_index = np.argmax(matrix)
print(max_val_index)

5


In [None]:
# counting

a = np.random.randint(1,100,100)
print(a)

# count no base on conditon: np.count_nonzero()
print(np.count_nonzero(a>43))
print(np.count_nonzero(a<43))
print(np.count_nonzero(a==43))
print(np.count_nonzero(a>100))

[35 44 70 10 26 45 93 18 22 61 56 33 14 95 81 73  8 81  8  6 45 82 46 52
 64 97 92 53 48 81 75 91  5 46 11 11 27  5 39 51 57 82 57 89 62 28  8 11
 49 37  9 31 48 63 33 45 10 20 71 76 53 14 13 64 83  9 43 60 68 74 86 39
 63 64 26 90 23 25 29 72 76 29 32 17 12  4  4 44  4 53 75 13 57 55 25 36
 57 71 82 38]
55
44
1
0


In [None]:
# numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)
a = np.random.randint(1,100,100)
print(a)

# Find unique value
print(np.unique(a))

print()
# find unique value occurs
uni_value, count_univalue = np.unique(a, return_counts=True)
print(uni_value)
print(count_univalue)

[94 48 31  1 81 91 74 62 20 39 99 13 12 40 43 45 82 81 90 83 32 44 83 27
 98 28 28 24 11 19 20  9 90 35 67 29 69 41 60 29 48 13 36 76  6 30 15 75
 47 16 59 86  6  4 32 78 32 64 49 85 18 21  2 75 27 37 25 56 10  8  9 86
 99 84 11 61 86 44  8 67 57  2 47 19 32 95 53 73 88 57 64 64 89  6 47 79
 22 97 99 31]
[ 1  2  4  6  8  9 10 11 12 13 15 16 18 19 20 21 22 24 25 27 28 29 30 31
 32 35 36 37 39 40 41 43 44 45 47 48 49 53 56 57 59 60 61 62 64 67 69 73
 74 75 76 78 79 81 82 83 84 85 86 88 89 90 91 94 95 97 98 99]

[ 1  2  4  6  8  9 10 11 12 13 15 16 18 19 20 21 22 24 25 27 28 29 30 31
 32 35 36 37 39 40 41 43 44 45 47 48 49 53 56 57 59 60 61 62 64 67 69 73
 74 75 76 78 79 81 82 83 84 85 86 88 89 90 91 94 95 97 98 99]
[1 2 1 3 2 2 1 2 1 2 1 1 1 2 2 1 1 1 1 2 2 2 1 2 4 1 1 1 1 1 1 1 2 1 3 2 1
 1 1 2 1 1 1 1 3 2 1 1 1 2 1 1 1 2 1 2 1 1 3 1 1 2 1 1 1 1 1 3]


# **Statistical Functions in NumPy 📊**

NumPy is a cornerstone of data analysis and machine learning in Python because it provides a wide array of fast, C-optimized statistical functions. These functions can quickly summarize, or "describe," large amounts of data.

-----

## **Key Statistical Concepts Explained**

Before we look at the code, let's clarify three of the most important statistical measures you'll use.

### **What is the Median?**

The **median** is the **middle value** in a dataset that has been sorted. It's a measure of central tendency, similar to the mean (average), but with one huge advantage: it is **not affected by outliers** (extremely high or low values).

  * **Example:**
      * Dataset: `[10, 20, 30, 40, 50]`
      * Median: **30** (the middle number)
  * **Example (with an outlier):**
      * Dataset: `[10, 20, 30, 40, 1000]`
      * Median: **30** (still the middle number)
      * Mean (Average): 220 (The mean is skewed by the 1000, making it a poor representation of the data's center).
  * **When to use it:** Use the median when you want to find the "typical" value in a dataset that might have extreme outliers, such as housing prices or income.

### **What is Standard Deviation (`np.std`)?**

The **standard deviation (std)** is a number that tells you how **spread out** your data is from the mean (average).

  * A **low standard deviation** means your data points are all very close to the average. The data is **consistent**.

  * A **high standard deviation** means your data points are spread far apart from the average. The data is **inconsistent** or volatile.

  * **Example:**

      * Student A's scores: `[80, 81, 79, 80, 80]`
      * Mean: 80, **Std: \~0.8** (Very low std, very consistent scores)
      * Student B's scores: `[60, 100, 70, 90, 80]`
      * Mean: 80, **Std: \~14.1** (High std, very inconsistent scores)

### **What is Correlation (`np.corrcoef`)?**

The **correlation coefficient** measures the **strength and direction of a linear relationship** between two variables. It returns a value between -1 and +1.

  * **+1 (Positive Correlation):** As one variable goes up, the other variable goes up. (e.g., study hours and exam scores).
  * **-1 (Negative Correlation):** As one variable goes up, the other variable goes down. (e.g., car speed and travel time).
  * **0 (No Correlation):** There is no *linear* relationship between the variables.

[Image of scatter plot correlation examples]

When you use `np.corrcoef(a, b)`, it returns a **2x2 correlation matrix**:

```
[[  1.0,   0.98 ]  <-- [ Corr(a,a), Corr(a,b) ]
 [ 0.98,   1.0  ]]  <-- [ Corr(b,a), Corr(b,b) ]
```

The value you care about is the one that shows the correlation between your two different variables (in this case, 0.98).

-----

## **Code Example: Descriptive Statistics**

Let's use your example of student marks.

```python
import numpy as np

# Assume 20 students, 3 subjects (Math, English, Physics)
numbers = np.random.randint(40, 100, (20, 3))
print(f"Full dataset (shape {numbers.shape}):\n{numbers}\n")

# Slice the data into individual subjects
math_marks = numbers[:, 0]
english_marks = numbers[:, 1]
physics_marks = numbers[:, 2]

# --- Find Max / Min ---
print(f"Max Math Mark: {np.max(math_marks)}")
print(f"Min English Mark: {np.min(english_marks)}\n")

# --- Find Measures of Center ---
print(f"Mean (Average) Physics Mark: {np.mean(physics_marks):.2f}")
print(f"Median Math Mark: {np.median(math_marks)}\n")

# --- Find Measures of Spread ---
print(f"Std Deviation of Math: {np.std(math_marks):.2f}")
print(f"Std Deviation of English: {np.std(english_marks):.2f}")
```

**Output (will vary due to random numbers):**

```
Full dataset (shape (20, 3)):
[[85 86 52]
 [83 93 42]
 ...
 [74 46 87]
 [61 88 51]]

Max Math Mark: 99
Min English Mark: 41

Mean (Average) Physics Mark: 68.25
Median Math Mark: 74.5

Std Deviation of Math: 16.52
Std Deviation of English: 17.18
```

### **A More Efficient Way (Using the `axis` Parameter)**

Instead of slicing, you can perform these calculations on the whole matrix by specifying an axis. `axis=0` calculates the statistic **down the columns**.

```python
# Calculate the mean for each subject (down the columns)
all_means = np.mean(numbers, axis=0)
print(f"\nMean for (Math, English, Physics): {all_means}\n")

# Calculate the max for each subject
all_max = np.max(numbers, axis=0)
print(f"Max for (Math, English, Physics): {all_max}")
```

**Output (will vary):**

```
Mean for (Math, English, Physics): [74.5  69.85 68.25]

Max for (Math, English, Physics): [99 97 99]
```

-----

## **Code Example: Correlation**

Let's use your example to see if there is a relationship between hours studied and exam scores.

```python
study_hours = np.array([2, 4, 5, 6, 8])
exam_score = np.array([60, 70, 80, 90, 99])

# Calculate the correlation coefficient matrix
correlation_matrix = np.corrcoef(study_hours, exam_score)

print(f"\nCorrelation Matrix:\n{correlation_matrix}\n")
print(f"The correlation is: {correlation_matrix[0, 1]:.4f}")
```

**Output:**

```
Correlation Matrix:
[[1.         0.98863695]
 [0.98863695 1.        ]]

The correlation is: 0.9886
```

This result (0.9886) is very close to +1, indicating a **very strong positive correlation**, which makes sense: more study hours are linked to higher exam scores.


-----
## **NumPy-তে পরিসংখ্যানগত ফাংশন 📊**

পাইথনে ডেটা বিশ্লেষণ এবং মেশিন লার্নিং-এর একটি মূল ভিত্তি হলো NumPy, কারণ এটি দ্রুতগতিসম্পন্ন, C-অপ্টিমাইজড পরিসংখ্যানগত ফাংশনের এক বিশাল ভাণ্ডার সরবরাহ করে। এই ফাংশনগুলো খুব দ্রুত বিপুল পরিমাণ ডেটাকে সংক্ষিপ্ত বা "বর্ণনা" করতে পারে।

-----

### **মূল পরিসংখ্যানগত ধারণাগুলির ব্যাখ্যা**

কোড দেখার আগে, চলুন তিনটি সবচেয়ে গুরুত্বপূর্ণ পরিসংখ্যানগত পরিমাপ স্পষ্ট করে নিই যা আপনি প্রায়শই ব্যবহার করবেন।

#### **মধ্যক (Median) কী?**

**মধ্যক** হলো এমন একটি ডেটাসেটের **মাঝখানের মান** যা ক্রমানুসারে সাজানো হয়েছে। এটি কেন্দ্রীয় প্রবণতার (central tendency) একটি পরিমাপ, গড়ের (mean) মতোই, তবে এর একটি বিশাল সুবিধা রয়েছে: এটি **আউটলায়ার** (outliers) বা চরম (খুব বেশি বা খুব কম) মান দ্বারা প্রভাবিত হয় না।

  * **উদাহরণ:**
      * ডেটাসেট: `[10, 20, 30, 40, 50]`
      * মধ্যক: **30** (মাঝখানের সংখ্যা)
  * **উদাহরণ (আউটলায়ার সহ):**
      * ডেটাসেট: `[10, 20, 30, 40, 1000]`
      * মধ্যক: **30** (এখনও মাঝখানের সংখ্যা)
      * গড় (Mean): 220 (গড়টি 1000 দ্বারা প্রভাবিত হয়েছে, যা ডেটার কেন্দ্রকে সঠিকভাবে উপস্থাপন করছে না)।
  * **কখন ব্যবহার করবেন:** যখন আপনি এমন একটি ডেটাসেটের "সাধারণ" মান খুঁজে পেতে চান যাতে চরম আউটলায়ার থাকতে পারে, যেমন বাড়ির দাম বা আয়ের হিসাব।

#### **স্ট্যান্ডার্ড ডেভিয়েশন (`np.std`) কী?**

**স্ট্যান্ডার্ড ডেভিয়েশন (std)** বা আদর্শ বিচ্যুতি হলো এমন একটি সংখ্যা যা আপনাকে বলে যে আপনার ডেটা পয়েন্টগুলো গড় (mean) থেকে কতটা **ছড়িয়ে ছিটিয়ে** আছে।

  * একটি **কম স্ট্যান্ডার্ড ডেভিয়েশন** মানে আপনার ডেটা পয়েন্টগুলো সব গড়ের খুব কাছাকাছি। ডেটা **সামঞ্জস্যপূর্ণ**।

  * একটি **উচ্চ স্ট্যান্ডার্ড ডেভিয়েশন** মানে আপনার ডেটা পয়েন্টগুলো গড় থেকে অনেক দূরে ছড়িয়ে আছে। ডেটা **অসামঞ্জস্যপূর্ণ** বা পরিবর্তনশীল।

  * **উদাহরণ:**

      * ছাত্র ক-এর স্কোর: `[80, 81, 79, 80, 80]`
      * গড়: 80, **স্ট্যান্ডার্ড ডেভিয়েশন: \~0.8** (খুব কম, খুবই সামঞ্জস্যপূর্ণ স্কোর)
      * ছাত্র খ-এর স্কোর: `[60, 100, 70, 90, 80]`
      * গড়: 80, **স্ট্যান্ডার্ড ডেভিয়েশন: \~14.1** (উচ্চ, খুবই অসামঞ্জস্যপূর্ণ স্কোর)

#### **কোরিলেশন (`np.corrcoef`) কী?**

**কোরিলেশন কোএফিসিয়েন্ট** বা সহসম্পর্ক সহগ দুটি ভেরিয়েবলের মধ্যে **রৈখিক সম্পর্কের শক্তি এবং দিক** পরিমাপ করে। এটি -1 এবং +1 এর মধ্যে একটি মান প্রদান করে।

  * **+1 (ধনাত্মক সহসম্পর্ক):** যখন একটি ভেরিয়েবল বাড়ে, তখন অন্য ভেরিয়েবলটিও বাড়ে। (যেমন, পড়ার সময় এবং পরীক্ষার স্কোর)।
  * **-1 (ঋণাত্মক সহসম্পর্ক):** যখন একটি ভেরিয়েবল বাড়ে, তখন অন্য ভেরিয়েবলটি কমে। (যেমন, গাড়ির গতি এবং ভ্রমণের সময়)।
  * **0 (কোনো সহসম্পর্ক নেই):** ভেরিয়েবলগুলোর মধ্যে কোনো *রৈখিক* সম্পর্ক নেই।

[Image of scatter plot correlation examples]

যখন আপনি `np.corrcoef(a, b)` ব্যবহার করেন, তখন এটি একটি **2x2 কোরিলেশন ম্যাট্রিক্স** রিটার্ন করে:

```
[[  1.0,   0.98 ]  <-- [ Corr(a,a), Corr(a,b) ]
 [ 0.98,   1.0  ]]  <-- [ Corr(b,a), Corr(b,b) ]
```

আপনার যে মানটি প্রয়োজন তা হলো আপনার দুটি ভিন্ন ভেরিয়েবলের মধ্যেকার সহসম্পর্ক (এক্ষেত্রে 0.98)।

-----

### **কোড উদাহরণ: বর্ণনামূলক পরিসংখ্যান (Descriptive Statistics)**

চলুন ছাত্রের নম্বরের উদাহরণটি ব্যবহার করি।

```python
import numpy as np

# ধরা যাক ২০ জন ছাত্র, ৩টি বিষয় (গণিত, ইংরেজি, পদার্থবিজ্ঞান)
numbers = np.random.randint(40, 100, (20, 3))
print(f"সম্পূর্ণ ডেটাসেট (শেপ {numbers.shape}):\n{numbers}\n")

# ডেটাকে বিষয়ভিত্তিক স্লাইস করা
math_marks = numbers[:, 0]
english_marks = numbers[:, 1]
physics_marks = numbers[:, 2]

# --- সর্বোচ্চ / সর্বনিম্ন নম্বর খোঁজা ---
print(f"গণিতে সর্বোচ্চ নম্বর: {np.max(math_marks)}")
print(f"ইংরেজিতে সর্বনিম্ন নম্বর: {np.min(english_marks)}\n")

# --- কেন্দ্রীয় প্রবণতা খোঁজা ---
print(f"পদার্থবিজ্ঞানে গড় নম্বর: {np.mean(physics_marks):.2f}")
print(f"গণিতে মধ্যক নম্বর: {np.median(math_marks)}\n")

# --- বিস্তৃতির পরিমাপ খোঁজা ---
print(f"গণিতের স্ট্যান্ডার্ড ডেভিয়েশন: {np.std(math_marks):.2f}")
print(f"ইংরেজির স্ট্যান্ডার্ড ডেভিয়েশন: {np.std(english_marks):.2f}")
```

**আউটপুট (র‍্যান্ডম নম্বরের কারণে পরিবর্তিত হবে):**

```
সম্পূর্ণ ডেটাসেট (শেপ (20, 3)):
[[85 86 52]
 [83 93 42]
 ...
 [74 46 87]
 [61 88 51]]

গণিতে সর্বোচ্চ নম্বর: 99
ইংরেজিতে সর্বনিম্ন নম্বর: 41

পদার্থবিজ্ঞানে গড় নম্বর: 68.25
গণিতে মধ্যক নম্বর: 74.5

গণিতের স্ট্যান্ডার্ড ডেভিয়েশন: 16.52
ইংরেজির স্ট্যান্ডার্ড ডেভিয়েশন: 17.18
```

#### **আরও কার্যকর উপায় (`axis` প্যারামিটার ব্যবহার করে)**

স্লাইস করার পরিবর্তে, আপনি `axis` নির্দিষ্ট করে পুরো ম্যাট্রিক্সের উপর এই গণনাগুলো সম্পাদন করতে পারেন। `axis=0` **কলাম বরাবর নিচের দিকে** পরিসংখ্যান গণনা করে।

```python
# প্রতিটি বিষয়ের জন্য গড় গণনা (কলাম বরাবর)
all_means = np.mean(numbers, axis=0)
print(f"\nপ্রতি বিষয়ের গড় (গণিত, ইংরেজি, পদার্থবিজ্ঞান): {all_means}\n")

# প্রতিটি বিষয়ের জন্য সর্বোচ্চ নম্বর
all_max = np.max(numbers, axis=0)
print(f"প্রতি বিষয়ের সর্বোচ্চ (গণিত, ইংরেজি, পদার্থবিজ্ঞান): {all_max}")
```

**আউটপুট (পরিবর্তিত হবে):**

```
প্রতি বিষয়ের গড় (গণিত, ইংরেজি, পদার্থবিজ্ঞান): [74.5  69.85 68.25]

প্রতি বিষয়ের সর্বোচ্চ (গণিত, ইংরেজি, পদার্থবিজ্ঞান): [99 97 99]
```

-----

### **কোড উদাহরণ: কোরিলেশন (Correlation)**

চলুন আপনার উদাহরণটি ব্যবহার করে দেখি যে পড়ার সময় এবং পরীক্ষার স্কোরের মধ্যে কোনো সম্পর্ক আছে কিনা।

```python
study_hours = np.array([2, 4, 5, 6, 8])
exam_score = np.array([60, 70, 80, 90, 99])

# কোরিলেশন কোএফিসিয়েন্ট ম্যাট্রিক্স গণনা
correlation_matrix = np.corrcoef(study_hours, exam_score)

print(f"\nকোরিলেশন ম্যাট্রিক্স:\n{correlation_matrix}\n")
print(f"সহসম্পর্ক হলো: {correlation_matrix[0, 1]:.4f}")
```

**আউটপুট:**

```
কোরিলেশন ম্যাট্রিক্স:
[[1.         0.98863695]
 [0.98863695 1.        ]]

সহসম্পর্ক হলো: 0.9886
```

এই ফলাফল (0.9886) +1 এর খুব কাছাকাছি, যা একটি **খুব শক্তিশালী ধনাত্মক সহসম্পর্ক** নির্দেশ করে। এটাই স্বাভাবিক: বেশি সময় ধরে পড়াশোনা করলে পরীক্ষার স্কোর বেশি হওয়ার সম্ভাবনা বাড়ে।

In [None]:
numbers = np.random.randint(40,100,(20,3))
print(numbers)

# Here we assume col_0= math_marks, col_1= english_marks, col_2 = physics_marks

math_marks = numbers[:,0]
english_marks = numbers[:,1]
physics_marks = numbers[:,2]

print(math_marks)
print(english_marks)
print(physics_marks)

# find max marks from math,english and physics
print(np.max(math_marks))
print(np.max(english_marks))
print(np.max(physics_marks))

# find min marks from math, english and physics
print(np.min(math_marks))
print(np.min(english_marks))
print(np.min(physics_marks))

# fidn average marks of math, english and physics
print(np.mean(math_marks))
print(np.mean(english_marks))
print(np.mean(physics_marks))

# find medain marks of math, english and physics
print(np.median(math_marks))
print(np.median(english_marks))
print(np.median(physics_marks))

#find std devivation math, english and physics marks
print(np.std(math_marks))
print(np.std(english_marks))
print(np.std(physics_marks))

#find coorealtion
study_hours = np.array([2, 4, 5, 6, 8])
exam_score = np.array([60, 70, 80, 90, 99])
coorelaation = np.corrcoef(study_hours, exam_score)
print(coorelaation)


[[58 63 95]
 [52 76 51]
 [76 74 99]
 [65 52 77]
 [51 48 60]
 [49 40 47]
 [97 75 90]
 [67 45 63]
 [49 82 91]
 [74 71 63]
 [95 48 71]
 [47 45 49]
 [61 92 86]
 [79 76 68]
 [71 41 92]
 [44 53 72]
 [54 57 73]
 [83 47 84]
 [78 83 94]
 [62 75 79]]
[58 52 76 65 51 49 97 67 49 74 95 47 61 79 71 44 54 83 78 62]
[63 76 74 52 48 40 75 45 82 71 48 45 92 76 41 53 57 47 83 75]
[95 51 99 77 60 47 90 63 91 63 71 49 86 68 92 72 73 84 94 79]
97
92
99
44
40
47
65.6
62.15
75.2
63.5
60.0
75.0
15.304901175767194
15.847002871205646
15.740393895960798
[[1.         0.98830063]
 [0.98830063 1.        ]]


# **Linear Algebra with NumPy linalg** 📐

Linear algebra is the core of machine learning and deep learning. NumPy's `linalg` module provides all the essential tools for performing high-speed linear algebra operations.

-----

## **1. Matrix Multiplication: `np.matmul` or `@`**

Matrix multiplication (a dot product) is the most fundamental operation in a neural network. It's how inputs are combined with weights to produce an output.

Let's look at a single forward pass of a neural network layer: **Z = W \* X + B**

```python
import numpy as np

# Input vector X (shape 3x1)
X = np.array([[0.8],
              [0.4],
              [0.3]])

# Weight matrix W1 (shape 3x3)
W1 = np.array([
    [ 0.2, -0.1,  0.3],
    [ 0.05, 0.4, -0.2],
    [ 0.1,  0.0,  0.25]
])

# Bias vector B1 (shape 3x1)
B1 = np.array([[0.01],
               [0.02],
               [-0.03]])

# 1. Perform matrix multiplication (W * X)
# We use @ as the modern, preferred operator
z1 = W1 @ X + B1

# 2. Apply an activation function (ReLU)
def RelU(z):
  return np.where(z > 0, z, 0)

a1 = RelU(z1)

print(f"Z1 (Linear Output):\n{z1}\n")
print(f"A1 (Activation Output):\n{a1}")
```

**Output:**

```
Z1 (Linear Output):
[[0.22 ]
 [0.12 ]
 [0.125]]

A1 (Activation Output):
[[0.22 ]
 [0.12 ]
 [0.125]]
```

-----

## **2. Trace of a Matrix: `np.trace()`**

The **trace** of a square matrix is the **sum of the elements on the main diagonal**.

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# The trace is 1 + 5 + 9
print(f"Matrix:\n{x}\n")
print(f"Trace of x: {np.trace(x)}")
```

**Output:**

```
Matrix:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Trace of x: 15
```

-----

## **3. Determinant of a Matrix: `np.linalg.det()`**

The **determinant** is a scalar value that can be computed from a square matrix. It tells you important properties of the matrix, such as whether it is invertible.

  * If `det(A) == 0`, the matrix `A` is **singular** (it has no inverse).
  * If `det(A) != 0`, the matrix `A` is **invertible**.

<!-- end list -->

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# Calculate the determinant
print(f"Determinant of x: {np.linalg.det(x):.2f}")
```

**Output:**

```
Determinant of x: -0.00
```

*(The result is a very small number close to 0, which tells us this matrix is singular/non-invertible.)*

-----

## **4. Rank of a Matrix: `np.linalg.matrix_rank()`**

The **rank** of a matrix is the number of **linearly independent** rows (or columns) it has. It gives you a measure of the "dimensionality" of the data in the matrix.

  * In ML, a matrix having a rank *lower* than its dimensions (a "low-rank" matrix) implies that the features are correlated and there is redundancy in the data.

<!-- end list -->

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# Calculate the rank
print(f"Rank of x: {np.linalg.matrix_rank(x)}")
```

**Output:**

```
Rank of x: 2
```

*(Even though it's a 3x3 matrix, the rank is 2. This is because the third row is a linear combination of the first two (Row 3 = 2 \* Row 2 - Row 1), so it adds no new information.)*


 ----


## **NumPy দিয়ে রৈখিক বীজগণিত (Linear Algebra) 📐**

রৈখিক বীজগণিত হলো মেশিন লার্নিং এবং ডিপ লার্নিং-এর মূল ভিত্তি। NumPy-এর `linalg` মডিউলটি দ্রুতগতিতে রৈখিক বীজগণিতের বিভিন্ন অপারেশন সম্পাদনের জন্য সমস্ত প্রয়োজনীয় টুল সরবরাহ করে।

-----

### **১. ম্যাট্রিক্স গুণন: `np.matmul` বা `@`**

ম্যাট্রিক্স গুণন (ডট প্রোডাক্ট) একটি নিউরাল নেটওয়ার্কের সবচেয়ে মৌলিক অপারেশন। এর মাধ্যমেই ইনপুটগুলো ওয়েট (weights)-এর সাথে মিলিত হয়ে একটি আউটপুট তৈরি করে।

চলুন একটি নিউরাল নেটওয়ার্ক লেয়ারের একটিমাত্র ফরোয়ার্ড পাসের দিকে নজর দেওয়া যাক: **Z = W \* X + B**

```python
import numpy as np

# ইনপুট ভেক্টর X (শেপ 3x1)
X = np.array([[0.8],
              [0.4],
              [0.3]])

# ওয়েট ম্যাট্রিক্স W1 (শেপ 3x3)
W1 = np.array([
    [ 0.2, -0.1,  0.3],
    [ 0.05, 0.4, -0.2],
    [ 0.1,  0.0,  0.25]
])

# বায়াস ভেক্টর B1 (শেপ 3x1)
B1 = np.array([[0.01],
               [0.02],
               [-0.03]])

# ১. ম্যাট্রিক্স গুণন করা হলো (W * X)
# আমরা আধুনিক এবং পছন্দের অপারেটর @ ব্যবহার করছি
z1 = W1 @ X + B1

# ২. একটি অ্যাক্টিভেশন ফাংশন (ReLU) প্রয়োগ করা হলো
def RelU(z):
  return np.where(z > 0, z, 0)

a1 = RelU(z1)

print(f"Z1 (রৈখিক আউটপুট):\n{z1}\n")
print(f"A1 (অ্যাক্টিভেশন আউটপুট):\n{a1}")
```

**আউটপুট:**

```
Z1 (রৈখিক আউটপুট):
[[0.22 ]
 [0.12 ]
 [0.125]]

A1 (অ্যাক্টিভেশন আউটপুট):
[[0.22 ]
 [0.12 ]
 [0.125]]
```

-----

### **২. ম্যাট্রিক্সের ট্রেস: `np.trace()`**

একটি বর্গ ম্যাট্রিক্সের **ট্রেস** হলো তার **প্রধান কর্ণের উপাদানগুলোর যোগফল**।

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# ট্রেস হলো 1 + 5 + 9
print(f"ম্যাট্রিক্স:\n{x}\n")
print(f"x-এর ট্রেস: {np.trace(x)}")
```

**আউটপুট:**

```
ম্যাট্রিক্স:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

x-এর ট্রেস: 15
```

-----

### **৩. ম্যাট্রিক্সের ডিটারমিন্যান্ট: `np.linalg.det()`**

**ডিটারমিন্যান্ট** হলো একটি স্কেলার মান যা একটি বর্গ ম্যাট্রিক্স থেকে গণনা করা যায়। এটি ম্যাট্রিক্সের গুরুত্বপূর্ণ বৈশিষ্ট্য সম্পর্কে বলে, যেমন এটি ইনভার্টেবল (invertible) কিনা।

  * যদি `det(A) == 0` হয়, তবে ম্যাট্রিক্স `A` **সিঙ্গুলার** (singular) (এর কোনো ইনভার্স নেই)।
  * যদি `det(A) != 0` হয়, তবে ম্যাট্রিক্স `A` **ইনভার্টেবল**।

<!-- end list -->

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# ডিটারমিন্যান্ট গণনা করা হলো
print(f"x-এর ডিটারমিন্যান্ট: {np.linalg.det(x):.2f}")
```

**আউটপুট:**

```
x-এর ডিটারমিন্যান্ট: -0.00
```

*(ফলাফলটি ০-এর খুব কাছাকাছি একটি ছোট সংখ্যা, যা আমাদের বলে যে এই ম্যাট্রিক্সটি সিঙ্গুলার/নন-ইনভার্টেবল।)*

-----

### **৪. ম্যাট্রিক্সের র‍্যাঙ্ক: `np.linalg.matrix_rank()`**

একটি ম্যাট্রিক্সের **র‍্যাঙ্ক** হলো তার **রৈখিকভাবে স্বাধীন** (linearly independent) সারি (বা কলাম)-এর সংখ্যা। এটি আপনাকে ম্যাট্রিক্সের ডেটার "ডাইমেনশনালিটি"-র একটি পরিমাপ দেয়।

  * মেশিন লার্নিং-এ, একটি ম্যাট্রিক্সের র‍্যাঙ্ক তার ডাইমেনশনের চেয়ে কম হওয়া (একটি "লো-র‍্যাঙ্ক" ম্যাট্রিক্স) বোঝায় যে ফিচারগুলো পরস্পর সম্পর্কযুক্ত এবং ডেটাতে অপ্রয়োজনীয় তথ্য রয়েছে।

<!-- end list -->

```python
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# র‍্যাঙ্ক গণনা করা হলো
print(f"x-এর র‍্যাঙ্ক: {np.linalg.matrix_rank(x)}")
```

**আউটপুট:**

```
x-এর র‍্যাঙ্ক: 2
```

*(যদিও এটি একটি 3x3 ম্যাট্রিক্স, এর র‍্যাঙ্ক 2। কারণ তৃতীয় সারিটি প্রথম দুটি সারির একটি রৈখিক সংমিশ্রণ (সারি 3 = 2 \* সারি 2 - সারি 1), তাই এটি কোনো নতুন তথ্য যোগ করে না।)*

In [None]:
#Matrix multiplication
X = np.array([[0.8, 0.40, 0.30]]).T
W1 =  np.array([
      [0.20, -0.10, 0.30],
      [0.05, 0.40, -0.20],
      [0.10, 0.00, 0.25],
    ])
B1 =  np.array([[0.01, 0.02, -0.03]]).T

z1 = np.matmul(W1,X) + B1



def RelU(z):
  return np.where(z>0,z,0)

a1 = RelU(z1)

print(z1)
print(a1)

# trace: giving summation diagnal square matrix
x = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(np.trace(x))

# find determinat of matrix
print(np.linalg.det(x))

#find rank of a matrix
x = np.linalg.matrix_rank(x)
print(x)

[[0.22 ]
 [0.16 ]
 [0.125]]
[[0.22 ]
 [0.16 ]
 [0.125]]
15
0.0
2


# **Practice**

In [None]:
a = np.array([1,2,3,4,5,6])
b = a.reshape(2,3)
b.shape

(2, 3)

In [None]:
np.sin(np.pi/2)

np.float64(1.0)

In [None]:
a = np.array([1,2,3])
b = np.array([4,5,6])

np.std(a)

np.float64(0.816496580927726)

In [None]:
a = np.array([3,1,2])
print(np.sort(a))

[1 2 3]


In [None]:
A = np.array([[1,2],[3,4]])
B = np.array([[5,6],[7,8]])

print(np.dot(A,B))

[[19 22]
 [43 50]]
