## 1. Bản chất của Array ở mức độ thấp: Vùng nhớ liền kề
***Lưu trữ liền kề (Contiguous Storage): Các phần tử của array được lưu trữ nối tiếp nhau trong bộ nhớ máy tính. Giống như các ngôi nhà trong một khu phố được xây sát cạnh nhau, không có mảnh đất trống xen kẽ.

***Kích thước phần tử đồng nhất: Mỗi "ngôi nhà" trong khu phố này (mỗi ô của array) phải có diện tích (số byte) bằng nhau.

***Truy cập tức thời qua chỉ số (Index): Đây chính là sức mạnh lớn nhất của array. Vì các phần tử nằm liền kề và có cùng kích thước, máy tính có thể tính toán ngay lập tức địa chỉ của bất kỳ phần tử nào.

địa_chỉ_phần_tử_thứ_k = địa_chỉ_bắt_đầu + k * kích_thước_mỗi_phần_tử

## 2. Các loại Array trong Python
### A. Mảng Nén (Compact Arrays)
Đây là loại array lưu trữ trực tiếp dữ liệu của phần tử trong vùng nhớ liền kề.

**Bản chất: Chính các bit tạo nên dữ liệu (ký tự, số nguyên) được đặt nối tiếp nhau.

Ví dụ điển hình:

- str (chuỗi ký tự): chuỗi "SAMPLE" lưu trữ các ký tự S, A, M, P, L, E ngay cạnh nhau trong bộ nhớ.

- Module array: Module này cho phép tạo các mảng nén chứa các kiểu dữ liệu nguyên thủy (số nguyên, số thực). Ví dụ, array('i', [2, 3, 5]) sẽ tạo một mảng lưu trữ trực tiếp các số nguyên này, rất tiết kiệm bộ nhớ
** Ưu điểm của Mảng Nén:

- Tiết kiệm bộ nhớ: Không có chi phí lưu trữ phụ trợ cho mỗi phần tử.

- Tính cục bộ của dữ liệu (Spatial Locality): Vì dữ liệu nằm gần nhau, khi CPU cần đọc một phần tử, nó có thể nạp sẵn các phần tử lân cận vào bộ nhớ đệm (cache), giúp tăng tốc độ truy cập sau đó.

### B. Mảng Tham chiếu (Referential Arrays)
Đây là loại array mà vùng nhớ liền kề chỉ lưu trữ các tham chiếu (tức là các địa chỉ bộ nhớ) trỏ đến các đối tượng thực sự. Các đối tượng này có thể nằm rải rác khắp nơi trong bộ nhớ.

**Bản chất: Vùng nhớ liền kề của array giống như một danh bạ, mỗi mục ghi địa chỉ của một đối tượng.

**Ví dụ điển hình:
list và tuple: Đây là lý do tại sao một list trong Python có thể chứa các phần tử với kiểu dữ liệu và kích thước khác nhau (ví dụ: [1, "hello", True]). Bản thân cái list chỉ là một dãy các "con trỏ" có kích thước đồng nhất, mỗi con trỏ trỏ đến một đối tượng khác nhau. 

### C. Mảng Động (Dynamic Arrays) 
Một câu hỏi tự nhiên là: Nếu array ở mức độ thấp phải có kích thước cố định, tại sao list trong Python lại có thể append() (thêm phần tử) một cách thoải mái?

** Cơ chế hoạt động: Python list sử dụng một array ở mức độ thấp, nhưng nó thường cấp phát một array lớn hơn so với số lượng phần tử hiện có. Phần dư ra này gọi là sức chứa dự phòng (surplus capacity).

** Khi append() một phần tử mới, Python sẽ đặt nó vào ô trống tiếp theo trong vùng nhớ dự phòng. Thao tác này rất nhanh (O(1)).
Khi vùng nhớ dự phòng đã hết, một thao tác "tốn kém" sẽ xảy ra:
- Python tạo ra một array mới, lớn hơn (thường là gấp đôi).
- Nó sao chép tất cả các phần tử từ array cũ sang array mới.
- List sẽ trỏ đến array mới này, và array cũ sẽ bị thu hồi.

**  Mặc dù một vài thao tác append() có thể rất chậm (khi phải cấp phát lại bộ nhớ, tốn thời gian O(n)), nhưng hầu hết các thao tác append() khác lại cực kỳ nhanh (O(1)). Phân tích trừ dần chứng minh rằng chi phí trung bình cho mỗi lần append() vẫn là O(1).
 -  Hãy tưởng tượng mỗi lần append() nhanh, bạn "trả" 3 đồng nhưng chỉ tốn 1 đồng chi phí, 2 đồng còn lại bạn "để dành". Khi đến lần append() tốn kém, bạn đã có đủ tiền để dành để chi trả cho việc sao chép. 
 - Việc nhân đôi kích thước array mỗi khi đầy là rất quan trọng. Nếu bạn chỉ tăng thêm một lượng cố định (ví dụ, thêm 10 ô mỗi lần), tổng chi phí cho n lần append() sẽ là O(n²), rất chậm. Bằng cách nhân đôi, tổng chi phí chỉ là O(n), tức là chi phí trung bình (trừ dần) là O(1). 


## Vì sao cần có mảng động, mảng nén, mảng tham chiếu
- Mảng tham chiếu giải quyết vấn đề kiểu dữ liệu không đồng nhất.

- Mảng nén giải quyết vấn đề hiệu quả bộ nhớ và tốc độ cho dữ liệu đồng nhất.

- Mảng động giải quyết vấn đề kích thước không xác định trước.

## 1. Mảng Một Chiều (One-Dimensional Array)
### A. Khái niệm và Tưởng tượng
Hãy tưởng tượng mảng một chiều như:
- Một dãy ghế trong rạp chiếu phim.
- Một danh sách các bài hát trong playlist.
- Các toa tàu nối đuôi nhau.
Về cơ bản, nó là một chuỗi các phần tử được sắp xếp theo một thứ tự tuyến tính, duy nhất. Bạn chỉ cần một chỉ số (index) để xác định vị trí của bất kỳ phần tử nào.
### B. Lưu trữ trong Bộ nhớ (Bản chất)
Như đã nói ở phần trước, mảng một chiều được lưu trữ trong một vùng nhớ liền kề. Đây là hình ảnh "dãy phố" mà chúng ta đã dùng. Vì tất cả các "ngôi nhà" (phần tử) đều nằm sát nhau và có cùng "diện tích" (kích thước), máy tính có thể truy cập bất kỳ ngôi nhà nào ngay lập tức chỉ với địa chỉ bắt đầu và số thứ tự của nó (chỉ số).

Điều này đảm bảo tốc độ truy cập O(1), nghĩa là thời gian để lấy một phần tử không phụ thuộc vào kích thước của mảng.

### C. Trong Python
Trong Python, mảng một chiều được hiện thực hóa qua các cấu trúc dữ liệu quen thuộc:
- list: my_list = [10, 20, 30, 40]
- tuple: my_tuple = (10, 20, 30, 40)
- str: my_string = "hello"

In [4]:
# Tạo một list (mảng động một chiều)
scores = [9, 8, 10, 7, 8.5]

# Truy cập phần tử thứ ba (chỉ số là 2)
third_score = scores[2]  # Lấy giá trị 10

# Thay đổi giá trị
scores[0] = 9.5  # scores trở thành [9.5, 8, 10, 7, 8.5]

## 2. Mảng Hai Chiều (Two-Dimensional Array)
Đây là sự mở rộng tự nhiên của mảng một chiều, dùng để biểu diễn dữ liệu có cấu trúc dạng lưới hoặc bảng.

### A. Khái niệm và Tưởng tượng
Hãy tưởng tượng mảng hai chiều như:
- Một bảng tính Excel (có hàng và cột).
- Một bàn cờ vua (8 hàng, 8 cột).
- Sơ đồ ghế ngồi trong một nhà hát lớn.
- Một bức ảnh kỹ thuật số (lưới các pixel).

Để xác định vị trí của một phần tử, cần hai chỉ số: một cho hàng (row) và một cho cột (column).

### B. Lưu trữ trong Bộ nhớ (Bản chất)
Đây là phần quan trọng nhất để hiểu bản chất. Bộ nhớ máy tính về cơ bản là một chiều. Không có khái niệm "lưới" ở mức độ vật lý. Vậy làm sao máy tính lưu trữ một cấu trúc 2D?

Nó "làm phẳng" (flatten) cấu trúc 2D thành 1D bằng một quy ước gọi là Thứ tự ưu tiên hàng (Row-Major Ordering).

**Cách hoạt động: Máy tính sẽ lưu trữ tất cả các phần tử của hàng 0, ngay sau đó là tất cả các phần tử của hàng 1, rồi đến hàng 2, và cứ thế tiếp tục.

Ví dụ: Một mảng 3 hàng x 4 cột sẽ được lưu trong bộ nhớ như sau:
**Góc nhìn logic (chúng ta thấy):
[ [R0C0, R0C1, R0C2, R0C3],
  [R1C0, R1C1, R1C2, R1C3],
  [R2C0, R2C1, R2C2, R2C3] ]
**Lưu trữ vật lý (máy tính thấy):
[R0C0, R0C1, R0C2, R0C3, R1C0, R1C1, R1C2, R1C3, R2C0, R2C1, R2C2, R2C3]

**Tại sao truy cập vẫn là O(1)?
Vì có một quy tắc rõ ràng, máy tính có thể dùng công thức để tính ra địa chỉ 1D từ cặp chỉ số (hàng, cột) 2D một cách tức thời:
địa_chỉ(hàng, cột) = địa_chỉ_bắt_đầu + (hàng * số_cột + cột) * kích_thước_phần_tử

### C. Trong Python
Python không có kiểu dữ liệu mảng hai chiều gốc. Thay vào đó, chúng ta mô phỏng nó bằng cách dùng "danh sách của các danh sách" (list of lists).

In [5]:
# Tạo một mảng 2D (3 hàng, 4 cột)
# Cách đúng: Dùng list comprehension
rows = 3
cols = 4
my_grid = [ [0 for _ in range(cols)] for _ in range(rows) ]
#Vòng lặp ngoài for _ in range(rows) sẽ chạy rows lần.
#Trong mỗi lần lặp, biểu thức [0 for _ in range(cols)] được thực thi lại từ đầu.
#Việc thực thi lại này sẽ tạo ra một đối tượng list con hoàn toàn mới, độc lập với các list con được tạo ở những lần lặp khác.

# my_grid sẽ là:
# [[0, 0, 0, 0],
#  [0, 0, 0, 0],
#  [0, 0, 0, 0]]

# Truy cập phần tử ở hàng 1, cột 2
element = my_grid[1][2] # Lấy giá trị 0

# Thay đổi giá trị
my_grid[1][2] = 99

⚠️ Cạm bẫy cực kỳ quan trọng khi khởi tạo:
Cần phải rất cẩn thận khi tạo một mảng 2D. Cách làm sau đây là SAI và là một lỗi phổ biến:
wrong_grid = [ [0] * cols ] * rows

Vấn đề ở đây là gì? [0] * cols tạo ra một list con. Sau đó, * rows chỉ đơn giản là sao chép tham chiếu đến list con đó rows lần. Kết quả là tất cả các hàng trong wrong_grid đều trỏ đến cùng một list con trong bộ nhớ.

Cách đúng là dùng list comprehension như ví dụ trên, vì nó đảm bảo mỗi hàng là một đối tượng list độc lập.

In [6]:
cols = 3
rows = 4

# Tạo grid bằng cách SAI
wrong_grid = [[0] * cols] * rows
print("Grid ban đầu:")
for row in wrong_grid:
    print(row)
# Kết quả trông có vẻ đúng:
# Grid ban đầu:
# [0, 0, 0]
# [0, 0, 0]
# [0, 0, 0]
# [0, 0, 0]

print("\nThay đổi phần tử ở hàng 0, cột 1...")
wrong_grid[0][1] = 99  # Chúng ta chỉ muốn thay đổi hàng đầu tiên

print("Grid sau khi thay đổi:")
for row in wrong_grid:
    print(row)
# Kết quả không mong muốn:
# Grid sau khi thay đổi:
# [0, 99, 0]
# [0, 99, 0]  <-- Hàng này cũng bị thay đổi!
# [0, 99, 0]  <-- Hàng này cũng bị thay đổi!
# [0, 99, 0]  <-- Hàng này cũng bị thay đổi!

Grid ban đầu:
[0, 0, 0]
[0, 0, 0]
[0, 0, 0]
[0, 0, 0]

Thay đổi phần tử ở hàng 0, cột 1...
Grid sau khi thay đổi:
[0, 99, 0]
[0, 99, 0]
[0, 99, 0]
[0, 99, 0]


# Python’s List and Tuple Classes

- list giống như một tấm bảng trắng: bạn có thể viết lên, xóa đi, thêm vào, sắp xếp lại. Nó rất linh hoạt.

- tuple giống như một tấm bia đá: một khi đã khắc nội dung lên, bạn không thể thay đổi được nữa. Nó rất ổn định và an toàn.

## 1. Điểm chung - Cùng là "Sequence" dựa trên Mảng tham chiếu
** Cả list và tuple đều là các chuỗi phần tử có thứ tự. Điều này có nghĩa là chúng chia sẻ nhiều hành vi chung:
- Truy cập bằng chỉ số: Bạn có thể lấy phần tử ở vị trí k bằng data[k].
- Cắt lát (Slicing): Bạn có thể lấy một chuỗi con bằng data[j:k].
- Duyệt (Iteration): Bạn có thể duyệt qua các phần tử bằng vòng lặp for.
- Các toán tử: Hỗ trợ nối chuỗi (+) và lặp lại (*).

** Bản chất lưu trữ: Cả hai đều được triển khai bằng mảng tham chiếu (referential array). Tức là, ở mức độ thấp, chúng là một vùng nhớ liền kề chứa các địa chỉ trỏ đến các đối tượng thực sự

## 2.List
### A. Đặc tính cốt lõi: Khả biến (Mutable)
Đây là đặc điểm quan trọng nhất của list
Mutable có nghĩa là có thể thay đổi nội dung của nó sau khi đã tạo ra.
- có thể thêm phần tử mới (append, insert).
- có thể xóa phần tử (pop, remove, del).
- có thể thay đổi giá trị của một phần tử tại một chỉ số cụ thể (my_list[i] = new_value).
- có thể sắp xếp lại các phần tử ngay tại chỗ (sort).

### B. Triển khai bên dưới: Mảng Động (Dynamic Array)
Vì list có thể thay đổi kích thước, nó được triển khai bằng cơ chế mảng động.
Nó sử dụng một mảng cấp thấp có sức chứa dự phòng (surplus capacity). Khi append và mảng đầy, nó sẽ tự động tạo một mảng mới lớn hơn và sao chép dữ liệu qua.

Điều này làm cho thao tác append và pop (ở cuối) có hiệu năng O(1) trừ dần (amortized) rất hiệu quả.

Tuy nhiên, việc insert hoặc pop ở các vị trí khác (đặc biệt là ở đầu) sẽ rất chậm (O(n)), vì nó đòi hỏi phải dịch chuyển tất cả các phần tử phía sau.

In [7]:
# Ví dụ về tính khả biến của list
numbers = [10, 20, 30]
numbers.append(40)      # Thay đổi list: [10, 20, 30, 40]
numbers[1] = 99         # Thay đổi list: [10, 99, 30, 40]
numbers.sort(reverse=True) # Thay đổi list: [99, 40, 30, 10]

## 3.Tuple
### A. Đặc tính cốt lõi: Bất biến (Immutable)
Đây là điểm khác biệt chính so với list. 
Immutable có nghĩa là một khi đã được tạo, bạn không thể thay đổi nội dung của nó.

Không có phương thức append, insert, pop, sort, v.v.
Không thể gán lại giá trị cho một phần tử: my_tuple[i] = new_value sẽ gây ra lỗi TypeError.

### B. Triển khai bên dưới: Mảng tham chiếu kích thước cố định
Vì tuple là bất biến, nó không cần cơ chế mảng động phức tạp.

Khi một tuple được tạo, Python sẽ cấp phát một mảng tham chiếu có kích thước chính xác vừa đủ để chứa các phần tử của nó.

### C. Lợi ích của tính Bất biến
Việc không thể thay đổi mang lại một số lợi thế quan trọng:
- Hiệu quả hơn về bộ nhớ: Vì không cần sức chứa dự phòng, tuple thường chiếm ít bộ nhớ hơn list có cùng nội dung.

- An toàn và toàn vẹn dữ liệu: Khi bạn truyền một tuple vào một hàm, bạn có thể chắc chắn rằng hàm đó không thể vô tình thay đổi dữ liệu của bạn.

- Có thể dùng làm khóa (key) trong dict: Đây là một ứng dụng rất quan trọng. Vì tuple là bất biến, giá trị băm (hash value) của nó không bao giờ thay đổi. Do đó, bạn có thể dùng tuple làm khóa trong dict hoặc phần tử trong set. Ngược lại, list không thể làm được điều này vì nó có thể thay đổi.


### Nếu list hay tuble chỉ lưu giá trị tham chiếu, vậy thì khi cần tìm kiếm giá trị của ô nhớ thì phải làm thế nào?
Quá trình đi từ tham chiếu đến giá trị thực sự được thực hiện một cách tự động bởi trình thông dịch Python. Lập trình viên không cần phải làm điều này một cách thủ công.

Quá trình này được gọi là khử tham chiếu (dereferencing)

* Analogy: Thư viện và Phiếu mượn sách
** Hãy tưởng tượng:
- Bộ nhớ máy tính (Memory Heap): Là toàn bộ kho sách khổng lồ của thư viện.
- Đối tượng (Object): Là một quyển sách thực sự (ví dụ: đối tượng số 42, đối tượng chuỗi "hello"). Mỗi quyển sách nằm ở một vị trí cụ thể trên kệ.
- list hoặc tuple: Là một tủ phiếu mượn sách (card catalog). Tủ này được sắp xếp gọn gàng, các ngăn kéo được đánh số 0, 1, 2...
- Tham chiếu (Reference/Memory Address): Là mã số trên phiếu mượn (ví dụ: "KHOA HỌC-TỰ NHIÊN-042"). Mã số này không phải là quyển sách, mà nó cho bạn biết chính xác vị trí để tìm quyển sách đó trong kho.

** Khi bạn viết my_list[2], bạn đang yêu cầu Python làm các bước sau:
- Đến tủ phiếu mượn sách (đối tượng list).
- Mở ngăn kéo số 2 (truy cập chỉ số [2]).
- Đọc mã số trên phiếu mượn (đọc giá trị tham chiếu/địa chỉ bộ nhớ được lưu trong ô đó).
- Đi vào kho sách, tìm đến đúng vị trí theo mã số và lấy quyển sách ra (đây chính là quá trình khử tham chiếu).
- Đưa cho bạn quyển sách (trả về đối tượng thực sự).
--> Toàn bộ bước 4 và 5 được Python làm tự động.