# BT01: So sánh thời gian chạy của chương trình nhân ma trận với: C, Python, Numpy.

- Họ và tên: Đoàn Ngọc Mai
- MSSV: 21127104

## 1. Khai báo Thư viện

In [None]:
import numpy as np
import random
import time
import pandas as pd
import matplotlib.pyplot as plt

## 2. Phân tích chương trình

### 2.1 C++

C++ là một ngôn ngữ biên dịch nên có tốc độ thực thi nhanh. Tuy nhiên, khi N tăng lên, thời gian thực thi cũng tăng lên do độ phức tạp của thuật toán nhân ma trận là \(O(N^3)\). 

**Ý tưởng:** 
* Hàm `multiply`: Thực hiện việc nhân ma trận bằng ba vòng lặp for theo công thức `c[i][j] += a[i][k] * b[k][j]`. 
* Biên dịch mã C++ và tạo ra một tệp thực thi tên là `run_time_cpp`. Sau đó, bạn chạy tệp thực thi này và chuyển đầu ra vào tệp `results.txt`. Tiếp đến, chương trình trích xuất thời gian thực thi từ mỗi dòng. Giá trị thời gian được lưu vào danh sách `cpp_times`.

**Ưu điểm:**
- Thực hiện tích chất lượng cao và tối ưu hóa.
- Thời gian thực thi nhanh hơn Python thuần và chậm hơn NumPy.

**Nhược điểm:**
- Khi tăng N, do độ phức tạp của thuật toán mà thời gian gia tăng đáng kể. 

In [None]:
!g++ 21127104.cpp -o run_time_cpp
!./run_time_cpp > results.txt

In [None]:
cpp_times = []

with open('results.txt', 'r') as file:
    lines = file.readlines()
    for line in lines:
        # Lấy giá trị thời gian sau chuỗi "seconds"
        time_value = float(line.split()[-2])
        cpp_times.append(time_value)


### 2.2 Python thuần và Python với Numpy

### 2.2a Python thuần

Python là một ngôn ngữ thông dịch, nên thời gian thực thi thường lâu hơn so với các ngôn ngữ biên dịch như C++. Điều này có thể được thấy rõ qua dữ liệu, khi N tăng, thời gian thực thi của Python thuần tăng lên rất nhiều.

**Ý tưởng:** Sử dụng Python thuần để tính tích ma trận theo cùng công thức như C++.
* Hàm `multiply_pure_python_optimized`: thực hiện phép nhân giữa hai ma trận a và b. Bạn đã tối ưu hóa việc tính toán bằng cách giữ biến sum_value để tích luỹ tổng, thay vì thực hiện việc cộng dồn trực tiếp trên ma trận kết quả.

**Ưu điểm:**
* Dễ đọc và hiểu.

**Nhược điểm:**
* Thời gian thực thi kém hơn C++ và NumPy, đặc biệt với kích thước lớn.

### 2.2b Python với Numpy

Numpy là một thư viện tối ưu cho việc tính toán khoa học trong Python. Các phép toán ma trận trong Numpy thường được tối ưu hóa và thực thi nhanh hơn nhiều so với Python thuần. Điều này rõ ràng qua dữ liệu, thậm chí với N=1000, Numpy chỉ mất 0.0xx giây để nhân hai ma trận.

**Ý tưởng:** Sử dụng thư viện NumPy, cho phép tính toán mảng nhanh hơn trong Python.

**Ưu điểm:**
* Thời gian thực thi nhanh hơn Python thuần và C++, đặc biệt với kích thước lớn.
* Dễ sử dụng với các phép toán ma trận.

**Nhược điểm:**
* Cần cài đặt thêm thư viện NumPy.

In [None]:
def generate_random_matrix(N):
    return [[random.random() for _ in range(N)] for _ in range(N)]

def multiply_pure_python_optimized(a, b, N):
    c = [[0 for _ in range(N)] for _ in range(N)]
    for i in range(N):
        for j in range(N):
            sum_value = 0
            for k in range(N):
                sum_value += a[i][k] * b[k][j]
            c[i][j] = sum_value
    return c

if __name__ == "__main__":
    N_values = [10, 25, 50, 75, 100, 250, 500, 750, 1000, 1250]

    python_times = []
    numpy_times = []

    for N in N_values:
        # For Pure Python Optimized with random values
        a_python = generate_random_matrix(N)
        b_python = generate_random_matrix(N)

        # For Numpy with random values
        a_numpy = np.random.rand(N, N)
        b_numpy = np.random.rand(N, N)

        start_python = time.time()
        c_python = multiply_pure_python_optimized(a_python, b_python, N)
        end_python = time.time()
        python_times.append(end_python - start_python)

        start_numpy = time.time()
        c_numpy = np.dot(a_numpy, b_numpy)
        end_numpy = time.time()
        numpy_times.append(end_numpy - start_numpy)

    for i in range(len(N_values)):
        print(f"N = {N_values[i]} - Pure Python: {python_times[i]} seconds, Numpy: {numpy_times[i]} seconds")


## 3. Trực quan hóa thời gian thực thi chương trình

In [None]:
# Tạo DataFrame
df = pd.DataFrame({
    'N': N_values,
    'C++': cpp_times,
    'Pure Python': python_times,
    'Numpy': numpy_times
})

# In ra bảng dữ liệu
print(df)

# Vẽ biểu đồ
plt.figure(figsize=(12, 6))
plt.plot(df['N'], df['C++'], marker='o', label='C++')
plt.plot(df['N'], df['Pure Python'], marker='o', label='Pure Python')
plt.plot(df['N'], df['Numpy'], marker='o', label='Numpy')
plt.xlabel('Size N')
plt.ylabel('Execution Time (seconds)')
plt.title('Execution Time Comparison')
plt.legend()
plt.grid(True)
plt.show()


## 4. So sánh thời gian thực thi của từng chương trình

* C++: Thời gian thực thi tăng nhanh khi kích thước đầu vào tăng. Đối với N nhỏ, C++ nhanh hơn Python thuần và Numpy. Tuy nhiên, khi N tăng, thời gian thực thi của C++ tăng nhanh. Do đó C++ có thể tối ưu hóa hiệu suất tốt ở mức N nhỏ, nhưng khi xử lý dữ liệu lớn, nó có thể không được tối ưu như các phương pháp khác.
* Pytho thuần: Thời gian thực thi cũng tăng nhanh khi N tăng. Tại mọi điểm dữ liệu, Python thuần có thời gian chạy chậm hơn cả C++ và Nump Điều này không ngạc nhiên vì Python là một ngôn ngữ thông dịch và thường chậm hơn so với ngôn ngữ biên dịch như C++..* Python với 
* Python với Numpy: Dù thời gian thực thi của Numpy tăng khi N tăng, nó vẫn duy trì mức thời gian thực thi thấp nhất trong ba phương pháp, đặc biệt ở các giá trị N  Numpy được thiết kế để xử lý hiệu quả các phép toán ma trận và số học trên dữ liệu lớn. Kết quả cho thấy rằng Numpy thực sự nhanh hơn nhiều so với Python thuần và C++ khi xử lý dữ liệu lớn.lớn.

## 5. Kết luận

* Nếu yêu cầu hiệu suất cao và không muốn sử dụng thư viện bên ngoài, việc viết chương trình bằng C++ là một lựa chọn tốt.
* Sự khác biệt rõ ràng về thời gian thực thi giữa Python thuần và Numpy cho thấy rằng việc tối ưu hóa tính toán ma trận có ý nghĩa quan trọng, đặc biệt trong các ứng dụng yêu cầu hiệu suất cao.
* Đối với các tác vụ tính toán ma trận, nên sử dụng thư viện Numpy trên Python để đạt hiệu suất tối ưu.
* Nếu bạn muốn dễ đọc, không cần tối ưu hóa tối đa và không muốn biên dịch, hãy sử dụng Python thuần.
* Nếu bạn cần thực hiện tính toán ma trận một cách nhanh chóng và dễ dàng, hãy sử dụng NumPy.