### 找出数组中重复的数字

在一个长度为n的数组里的所有数字都在 0 到 n-1 的范围内。 数组中某些数字是重复的，但不知道有几个数字是重复的，也不知道每个数字重复几次。 请找出数组中任意一个重复的数字。例如，如果输入长度为 7 的数组 {2,3,1,0,2,5,3}，那么对应的输出是第一个重复的数字 2 或者 3

### 实现

#### 思路一

遍历数组中的每一个元素，将 此元素作为数组的索引 对应的值转换为其负数，再减 1（主要考虑 0 的情况）。如果后面遍历到 某一数组元素作为索引对应的值 已经转换为负数了，则说明此元素是重复的。下面的代码将所有重复的元素都返回了。时间复杂度为 O(n)，空间复杂度为 O(1)。

In [1]:
def duplicate_v1(nums):
    # 异常情况检测
    if not nums:
        return []
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 0 or n > n_len - 1:
                return []
    else:
        return []
    
    s = set()
    for n in nums:
        if n < 0:
            if nums[-1 * (n+1)] < 0:
                s.add(-1 * (n+1))
            else:
                nums[-1 * (n+1)] = -1 * (nums[-1 * (n+1)]) -1
        if n >= 0:
            if nums[n] < 0:
                s.add(n)
            else:
                nums[n] = -1 * nums[n] - 1
    return list(s)

test = [2,3,1,0,2,5,3]
print(duplicate_v1(test))

[2, 3]


#### 思路二

定义一个新的数组。依次遍历原数组中的所有元素，如果某个元素不在新数组中，则添加到新数组中。如果某元素在新数组中已经存在，说明此元素为重复元素。时间复杂度为 O(n)，空间复杂度为 O(n)。

In [2]:
def duplicate_v2(nums):
    # 异常情况检测
    if not nums:
        return []
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 0 or n > n_len - 1:
                return []
    else:
        return []

    # 用来保存重复的值
    res = []
    # 用来保存不重复的值
    new = []
    for n in nums:
        if n not in new:
            new.append(n)
        else:
            res.append(n)
    return res

test = [2,3,1,0,2,5,3]
print(duplicate_v2(test))

[2, 3]


#### 思路三

用Python自带的collections库中的Counter类来判断重复的元素。

In [3]:
from collections import Counter

def duplicate_v3(nums):
    # 异常情况检测
    if not nums:
        return []
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 0 or n > n_len - 1:
                return []
    else:
        return []
    
    res = []
    for k, v in Counter(nums).items():
        if v >= 2:
            res.append(k)
    return res

def duplicate_v4(nums):
    """ 跟v3版本一样用的 Counter
    这里用的是列表生成器
    """
    # 异常情况检测
    if not nums:
        return []
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 0 or n > n_len - 1:
                return []
    else:
        return []
    
    return [k for k, v in Counter(nums).items() if v >= 2]

test = [2,3,1,0,2,5,3]
print(duplicate_v3(test))
print(duplicate_v4(test))

[2, 3]
[2, 3]


#### 思路四

先将数组排序，然后依次遍历排好序的数组中的每一个元素，判断前后两个元素是否相同。给数组排序的时间复杂度为 O(nlogn)。

#### 思路五

这个算法是剑指offer上给出的。数组中的数字都在 0~n-1 的范围内。如果这个数组中没有重复的数字，那么当数组排序之后数字 i 将出现在下标为 i 的位置。由于数组中有重复的数字，有些位置可能存在多个数字，同时有些位置可能没有数字。现在让我们重排这个数组。从头到尾依次扫描这个数组中的每个数字。当扫描到下标为 i 的数字时，首先比较这个数字（用 m 表示）是不是等于 i。如果是，则接着扫描下一个数字；如果不是，则再拿它和第 m 个数字进行比较。如果它和第 m 个数字相等，就找到了一个重复的数字（该数字在下标为 i 和 m 的位置都出现了）；如果它和第 m 个数字不相等，就把第 i 个数字和第 m 个数字交换，把 m 放到属于它的位置。接下来再重复这个比较和交换的过程，直到我们发现一个重复的数字。因为将每个数组放到相应位置最多需要交换两次，所以改算法时间复杂度为 O(n)，空间复杂度为 O(1)。

In [4]:
def duplicate_v5(nums):
    """ 这里只返回第一个被找到的重复数字
    而不是返回所有的重复数字
    """
    # 异常情况检测
    if not nums:
        return None
    if isinstance(nums, list):
        n_len = len(nums)
        for n in nums:
            if n < 0 or n > n_len - 1:
                return None
    else:
        return None
    
    for i in range(len(nums)):
        while (nums[i] != i):
            if nums[i] == nums[nums[i]]:
                return nums[i]
            else:
                temp = nums[i]
                nums[i], nums[temp] = nums[temp], nums[i]
    return None

test = [2,3,1,0,2,5,3]
print(duplicate_v5(test))

2
