# 数据结构与算法：滑动窗口（Sliding Window）

## 1. 什么是滑动窗口?

滑动窗口是一种主要用于在数组或字符串等线性数据结构上执行操作的算法思想。它之所以被称为“滑动窗口”，是因为它在数据结构上移动一个固定或可变大小的“窗口”，并在窗口移动的过程中对其中的元素执行某些计算。

这种技术的主要优势在于它能够将一些需要嵌套循环（时间复杂度为 O(n²)）的暴力解法优化为单次遍历（时间复杂度为 O(n)），从而极大地提高了算法的效率。

## 2. 核心思想

滑动窗口的核心在于维护一个窗口（通常由两个指针`left`和`right`定义），并根据特定条件移动这两个指针。

1.  **扩展窗口**：移动`right`指针，将新元素包含进窗口。
2.  **满足条件**：当窗口内的元素满足题目要求时，更新结果。
3.  **收缩窗口**：当窗口不再满足条件时（或者需要寻找更优解时），移动`left`指针，将旧元素移出窗口，直到窗口再次满足条件。

通过这种方式，每个元素最多只会被`right`指针访问一次，被`left`指针访问一次，因此总的时间复杂度是 O(n)。

## 3. 通用代码模板

虽然具体实现会因问题而异，但大多数滑动窗口问题都可以套用以下模板：
```python
def sliding_window_template(arr, ...):
    left, right = 0, 0
    window_data = ...  # 用于存储窗口内信息的结构，如总和、哈希表等
    result = ...       # 用于存储最终结果

    while right < len(arr):
        # 1. 扩展窗口：将 arr[right] 加入窗口
        window_data.add(arr[right])

        # 2. 收缩窗口：当窗口不满足条件时，循环收缩
        while condition_is_not_met(window_data):
            # 将 arr[left] 移出窗口
            window_data.remove(arr[left])
            left += 1

        # 3. 更新结果：此时窗口是满足条件的，可以更新结果
        result = update_result(result, window_data)

        # 移动 right 指针，继续探索
        right += 1

    return result
```

## 4. 实例讲解

### 实例1：最大和子数组（固定窗口大小）

**问题**：给定一个整数数组 `arr` 和一个正整数 `k`，找到长度为 `k` 的连续子数组，使其元素总和最大。

这是最简单的滑动窗口问题。窗口的大小是固定的 `k`。

In [1]:
def max_sum_subarray_fixed_size(arr, k):
    if not arr or k <= 0 or k > len(arr):
        return 0

    max_sum = 0
    window_sum = 0
    left = 0

    for right in range(len(arr)):
        # 将当前元素加入窗口总和
        window_sum += arr[right]

        # 当窗口大小达到 k 时
        if right >= k - 1:
            # 更新最大总和
            max_sum = max(max_sum, window_sum)

            # 将左边元素移出窗口
            window_sum -= arr[left]
            left += 1
            
    return max_sum

# 测试
arr1 = [2, 1, 5, 1, 3, 2]
k1 = 3
print(f"数组 {arr1} 中长度为 {k1} 的最大子数组和是: {max_sum_subarray_fixed_size(arr1, k1)}") # 预期输出: 9 (5+1+3)

arr2 = [2, 3, 4, 1, 5]
k2 = 2
print(f"数组 {arr2} 中长度为 {k2} 的最大子数组和是: {max_sum_subarray_fixed_size(arr2, k2)}") # 预期输出: 7 (4+1+5 -> 5, 1, 4, 3, 2 -> 4+1=5, 1+5=6, 3+4=7, 2+3=5)

数组 [2, 1, 5, 1, 3, 2] 中长度为 3 的最大子数组和是: 9
数组 [2, 3, 4, 1, 5] 中长度为 2 的最大子数组和是: 7


### 实例2：总和不小于S的最小子数组（动态窗口大小）

**问题**：给定一个正整数数组 `arr` 和一个正整数 `S`，找到一个连续子数组，使其元素总和不小于 `S`，并返回该子数组的最小可能长度。如果不存在这样的子数组，则返回 0。

这个问题中，窗口的大小是可变的。

In [2]:
import math

def min_size_subarray_sum(arr, S):
    min_length = math.inf
    window_sum = 0
    left = 0

    for right in range(len(arr)):
        window_sum += arr[right]

        # 当窗口总和不小于 S 时，尝试收缩窗口
        while window_sum >= S:
            # 更新最小长度
            min_length = min(min_length, right - left + 1)
            
            # 从左边移出元素并移动 left 指针
            window_sum -= arr[left]
            left += 1
            
    if min_length == math.inf:
        return 0
    return min_length

# 测试
arr3 = [2, 1, 5, 2, 3, 2]
S3 = 7
print(f"数组 {arr3} 中总和不小于 {S3} 的最小子数组长度是: {min_size_subarray_sum(arr3, S3)}") # 预期输出: 2 (5+2)

arr4 = [2, 1, 5, 2, 8]
S4 = 7
print(f"数组 {arr4} 中总和不小于 {S4} 的最小子数组长度是: {min_size_subarray_sum(arr4, S4)}") # 预期输出: 1 (8)

数组 [2, 1, 5, 2, 3, 2] 中总和不小于 7 的最小子数组长度是: 2
数组 [2, 1, 5, 2, 8] 中总和不小于 7 的最小子数组长度是: 1


### 实例3：含K个不同字符的最长子串（动态窗口 + 哈希表）

**问题**：给定一个字符串 `s` 和一个整数 `k`，找到包含不超过 `k` 个不同字符的最长子串的长度。

这个问题需要一个辅助数据结构（哈希表）来跟踪窗口内不同字符的数量。

In [3]:
def longest_substring_with_k_distinct(s, k):
    max_length = 0
    char_frequency = {}
    left = 0

    for right in range(len(s)):
        right_char = s[right]
        char_frequency[right_char] = char_frequency.get(right_char, 0) + 1

        # 当不同字符的数量超过 k 时，收缩窗口
        while len(char_frequency) > k:
            left_char = s[left]
            char_frequency[left_char] -= 1
            if char_frequency[left_char] == 0:
                del char_frequency[left_char]
            left += 1
        
        # 更新最大长度
        max_length = max(max_length, right - left + 1)
        
    return max_length

# 测试
s1 = "araaci"
k1 = 2
print(f'字符串 "{s1}" 中含不超过 {k1} 个不同字符的最长子串长度是: {longest_substring_with_k_distinct(s1, k1)}') # 预期输出: 4 ("araa")

s2 = "cbbebi"
k2 = 3
print(f'字符串 "{s2}" 中含不超过 {k2} 个不同字符的最长子串长度是: {longest_substring_with_k_distinct(s2, k2)}') # 预期输出: 5 ("bbebi")

字符串 "araaci" 中含不超过 2 个不同字符的最长子串长度是: 4
字符串 "cbbebi" 中含不超过 3 个不同字符的最长子串长度是: 5


## 5. 总结

**何时使用滑动窗口？**

当你遇到需要在**连续的子数组或子串**上寻找满足某些条件的最优解（如最大值、最小值、最长、最短）时，就应该首先考虑滑动窗口技术。

**关键优势：**

- **高效**：将时间复杂度从 O(n²) 或更高降低到 O(n)。
- **简洁**：代码结构清晰，易于理解和实现。