# Problem statement

![](de.jpg)

# Input

- s (Kiểu string): chứa các ký tự latinh với độ dài n < $10^5$
- q (Kiểu int): số lượng câu truy vấn ($1 ≤  q  ≤ 10^5$)
- a, b (Kiểu int): Vị trí chuỗi con thứ 1 với a là điểm bắt đầu và b là điểm kết thúc ($1 ≤ a ≤ b ≤ n$)
- c, d (Kiểu int): Vị trí chuỗi con thứ 2 với c là điểm bắt đầu và d là điểm kết thúc ($1 ≤ c ≤ d ≤ n$)

# Output

result (Kiểu string): Đưa ra kết quả YES hoặc NO tương ứng với hai chuỗi trên có cùng một lớp tương đương hay không

# Abstraction

Kiểm tra xem 2 chuỗi con trong 1 chuỗi mẹ có cùng một lớp tương đương hay không

# Pattern recognition

- String hashing

# Algorithm design

## Idea

### Ý tưởng chính

1. Chuyển đổi các ký tự trong chuỗi sang mã ASCII tương ứng
2. Tính tổng ASCII của từng chuỗi con
        Ví dụ: Cho chuỗi "Hello", để tính tổng ASCII của chuỗi con "Hell" thì ta làm như sau:
        H = 72
        e = 101
        l = 108
        Độ dài chuỗi con "Hell" = 72 + 101 + 108 + 108 = 389
3. Lưu lại tổng của từng chuỗi con. Nếu hai chuỗi con có tổng bằng nhau thì chúng tương đương nhau


***Tuy nhiên ý tưởng trên lại dính một lỗi vô cùng nghiêm trọng***
- *Ví dụ: cho chuỗi ccdABAfccd*
        Đổi sang mã ASCII:
         c = 99
         d = 100
         A = 65
         B = 66
         f = 102        
   - Tổng ACII của chuỗi từ vị trí 1 đến 3 = 298 (Tương ứng là chuỗi con "ccd")
   - Tổng ACII của chuỗi từ vị trí 4 đến 7 = 298 (Tương ứng là chuỗi con "ABAf")
- Tuy đều trả về tổng bằng nhau nhưng 2 chuỗi con đó lại không cùng một lớp tương đương ("ccd" != "ABAf")

***Giải pháp: Bình phương mã ASCII của ký tự rồi mới tính tổng***
- *Ví dụ: cho chuỗi ccdABAfccd*
        Đổi sang mã thập phân:
         c = 99 ^ 2
         d = 100 ^ 2
         A = 65 ^ 2
         B = 66 ^ 2
         f = 102 ^ 2
   - Tổng ACII của chuỗi từ vị trí 1 đến 3 = 29602 (Tương ứng là chuỗi con "ccd")
   - Tổng ACII của chuỗi từ vị trí 4 đến 7 = 23210 (Tương ứng là chuỗi con "ABAf")
- Lúc này, kết quả đã trả về NO và tránh được kết quả không mong muốn.

***Nhận xét***: 
- Nếu dùng lũy thừa càng lớn (lũy thừa 3,4,5,...) thì việc dính lỗi như trên càng thấp

### Kết hợp prefix sum để tối ưu tốc độ

Do ta có q truy vấn, mỗi truy vấn có độ phức tạp là $O(n)$ (để tính tổng), nên tổng thời gian là $O(n^2)$

Vì thế cần dùng **prefix sum** để giảm thời gian tính tổng thành $O(1)$. Lúc đó tổng thời gian là $O(n)$

*Ví dụ*

    H = 72
    e = 101
    l = 108
    o = 111
    Tổng ASCII chuỗi con "H" = 72
    Tổng ASCII chuỗi con "He" = Tổng ASCII chuỗi con "H" + mã ASCII của "e" = 72 + 101 = 173
    Tổng ASCII chuỗi con "Hel" = Tổng ASCII chuỗi con "He" + mã ASCII của "l" = 173 + 108 = 281
    Tổng ASCII chuỗi con "Hell" = Tổng ASCII chuỗi con "Hel" + mã ASCII của "l" = 281 + 108 = 389
    Tổng ASCII chuỗi con "Hello" = Tổng ASCII chuỗi con "Hell" + mã ASCII của "o" = 389 + 111 = 500
    
- Tổng ASCII của chuỗi "ell" = Tổng ASCII chuỗi "Hell" - Tổng ASCII chuỗi con "H" = 389 - 72 = 317


## Pseudocode

- Khởi tạo:
    - array_Sum = mảng chứa tổng độ dài của các chuỗi con
- Chương trình chính:
     1. Thêm 0 vào mảng array_Sum (vì nếu chuỗi rỗng thì độ dài sẽ bằng 0)
     2. Lặp i từ 0 tới len(s):
        - Thêm array_Sum[vị trí trước đó] + Mã thập phân của i lũy thừa 5 vào array_Sum
     3. Lặp q truy vấn
        - 3.1 Kiểm tra array_Sum[b] - array_Sum[a] có bằng với array_Sum[d] - array_Sum[c]
        - 3.2 In ra YES nếu bằng nhau và in ra NO nếu không bằng nhau

## Time complexity

Bước 2: $O(n)$

Bước 3: $O(n)$

Bước 3.1: $O(1)$

Tổng: $O(n)$

## Code

In [None]:
s = input().strip()
q = int(input())
array_Sum = [] # chứa tổng của số nguyên đại diện (haha sẽ lưu thành array=[104, 201, 305, 402])
array_Sum.append(0)

for _ in s:
    array_Sum.append(array_Sum[-1]+ord(_)**5)
    
def check(begin,end):
    return array_Sum[end] - array_Sum[begin-1] 
'''
begin phải trừ thêm 1 vì theo ví dụ như:
begin = 3
end = 4
thì tổng của 2 chữ ở vị trí 3 và 4 sẽ bằng 402 - 201 không phải 402-305
'''
for _ in range(q):
    a,b,c,d = map(int,input().split())
    if check(a,b) == check(c,d):
        print("YES")
    else:
        print("NO")

Code trên tuy đúng nhưng tốc độ chưa nhanh nên không pass được một số bộ test

![](fail.jpg)

Vì thế nhóm chúng em đã sửa lại cách đọc đầu vào như sau

In [None]:
from sys import stdin
s = stdin.readline().strip()
q = int(input())
array_Sum = [] # chứa tổng của số nguyên đại diện (haha sẽ lưu thành array=[104, 201, 305, 402])
array_Sum.append(0)

for _ in s:
    array_Sum.append(array_Sum[-1]+ord(_)**5)
    
def check(begin,end):
    return array_Sum[end] - array_Sum[begin-1] 
'''
begin phải trừ thêm 1 vì theo ví dụ như:
begin = 3
end = 4
thì tổng của 2 chữ ở vị trí 3 và 4 sẽ bằng 402 - 201 không phải 402-305
'''

for _ in range(q):
    a,b,c,d = map(int,stdin.readline().split())
    if check(a,b) == check(c,d):
        print("YES")
    else:
        print("NO")

Kết quả cho ra vô cùng ấn tượng

![](pass.jpg)

Cho thấy việc dùng cách đọc đầu vào khác nhau cũng sẽ đưa ra thời gian xử lý khác nhau.