### 不修改数组找出重复的数字

在一个长度为 n+1 的数组里的所有数字都在 1 到 n 的范围内，所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字，但不能修改输入的数组。例如，如果输入长度为8的数组{2, 3, 5, 4, 3, 2, 6, 7}，那么对应的输出是重复的数字2或者3。

### 实现

#### 思路一

创建一个长度为 n+1 的辅助数组，然后逐一把原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是 m，则把它复制到辅助数组中下标为 m 的位置。这样就很容易就能发现哪个数字是重复的。该方案时间复杂度为 O(n)，空间复杂度为 O(n)。

In [8]:
def find_duplication(nums):
    """ 查找数组中重复的数字
    """
    # 异常处理
    if not nums:
        return []
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 1 or n > n_len-1:
                return []
    
    new_list = [0] * n_len
    for n in nums:
        if new_list[n] == 0:
            new_list[n] = 1
        else:
            print(new_list)
            return n

nums = [2, 3, 5, 4, 3, 2, 6, 7]
print(find_duplication(nums))

[0, 0, 1, 1, 1, 1, 0, 0]
3


#### 思路二

把 1~n 的数字从中间的数字 m 分为两部分，前面一半为 1~m，后面一半为 m+1~n，如果 1~m 的数字数目超过 m，那么这一半的区间里一定包含重复的数字；否则，另一半 m+1~n 的区间里一定包含重复的数字。继续把包含重复的数字区间一分为二，直到找到一个重复的数字。该算法时间复杂度为 O(nlog(n))，空间复杂度为 O(1)。

In [9]:
def find_duplication_v2(nums):
    """ 查找数组中的重复数字
    """
    # 异常处理
    if not nums:
        return None
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 1 or n > n_len-1:
                return None
            
    start = 1
    end = len(nums) - 1
    while (end >= start):
        middle = (start + end) // 2
        count = count_range(nums, start, middle)
        if end == start:
            if count > 1:
                return start
            else:
                break
        if count > (middle - start + 1):
            end = middle
        else:
            start = middle + 1
    return None
            
def count_range(nums, start, end):
    """ 计算数组 nums 在区间 start~end 里的数字个数
    """
    if not nums:
        return 0
    
    count = 0
    for n in nums:
        if n >= start and n <= end:
            count += 1
    return count

nums = [2, 3, 5, 4, 3, 2, 6, 7]
print(find_duplication_v2(nums))

3
