# 面试题03. 数组中重复的数字

思路：
- 排序+查找
    - 先对数组进行排序
    - 在排序后的数组中查找重复数字
    - 时间复杂度$O(n \log n)$ 空间复杂度$O(1)$ 
    - 改变数组
- 哈希表
    - 从头扫描数组中的每个数字
    - 没扫描到一个数字时，判断哈希表中是否包含该数字
    - 如果哈希表没有该数字，就加入哈希表，反之则找到一个重复数字
    - 时间复杂度$O(n)$ 空间复杂度$O(n)$ 
    - 未改变数组
- 原地交换
    - 根据题意，数组的元素值的范围恰好和数组的长度是一样的，因此如果没有重复数字，按升序排列后数字和下标应该一一对应
    - 从头扫描数组，如果元素和下标对应则继续扫描
    - 如果不对应，则判断该元素值m与对应下标m上的元素值是否相同，如果相同则返回重复数字
    - 如果不同则交换这两个元素，继续重复上述步骤判断交换后的元素
    - 时间复杂度$O(n)$ 空间复杂度$O(1)$ 
    - 改变数组

注意：
- 对空数组的鲁棒性
- 对非法输入的鲁棒性

第一次思路：首先想到的是对数组排序然后进行遍历查找。

第二种方法是用散列表进行映射，找到其中重复的数字，因为数字的范围比数组长度小，因此用数组的长度来新建一个简单的散列表，也可以直接使用集合set

In [3]:
class Solution:
    def findRepeatNumber(self, nums: [int]) -> int:

        nums_len = len(nums)
        a = [None for i in range(nums_len)]
        for num in nums:
            if a[num] == None:
                a[num] = num
            else:
                return num

s = Solution()
nums = [1,2,3,0]
print(s.findRepeatNumber(nums))

None


# 答案

## 散列表

In [4]:
class Solution:
    def findRepeatNumber(self, nums: [int]) -> int:

        nums_len = len(nums)
        a = [None for i in range(nums_len)]
        for num in nums:
            if a[num] == None:
                a[num] = num
            else:
                return num

## 原地交换

In [6]:
class Solution:
    def findRepeatNumber(self, nums: [int]) -> int:
        nums_len = len(nums)
        i = 0
        while i < nums_len:
            if i == nums[i]:
                i += 1
            elif nums[i] == nums[nums[i]]:
                return nums[i]
            else:
                t = nums[nums[i]]
                nums[nums[i]] = nums[i]
                nums[i] = t

## 加入边界，特殊输入

In [1]:
class Solution:
    def findRepeatNumber(self, nums: [int]) -> int:
        nums_len = len(nums)
        #判断非法输入，无需对空数组判断
        for i in range(nums_len):
            if nums[i] < 0 or nums[i] > nums_len - 1:
                return None
        
        i = 0
        while i < nums_len:
            if i == nums[i]:
                i += 1
            elif nums[i] == nums[nums[i]]:
                return nums[i]
            else:
                t = nums[nums[i]]
                nums[nums[i]] = nums[i]
                nums[i] = t

# 变形题

## 不修改数组找出重复数字

在一个长度为n+1的数组里的所有数字都在1~n的范围内，所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字，但不能修改输入的数组

思路：
- 哈希表
    - 和上面一样使用哈希表
    - 时间复杂度O(n) 空间复杂度O(n)
- 二分查找
    - 把1~n的数字从中间分成两部分，每部分去数组中查找，如果超过了范围的个数就存在重复，继续使用二分法缩小该部分直到找到答案
    - 时间复杂度O(nlogn) 空间复杂度O(1)
    - 该算法不能保证找出所有的重复数字

###  二分查找

In [6]:
class Solution:
    def findRepeatNumber(self, nums: [int]) -> int:

        nums_len = len(nums)
        #特殊输入判断
        if nums_len < 0:
            return None
        for i in range(nums_len): 
            if nums[i] < 1 or nums[i] > nums_len - 1:
                return None

        start = 1 #范围是1~n
        end = nums_len - 1
        while end >= start:
            middle = (start + end) // 2
            count = self.countRange(nums,nums_len,start,middle)
            if end == start: #二分查找出口
                if count > 1:
                    return  start

            if count > (middle - start + 1):
                end = middle
            else:
                start = middle + 1


    def countRange(self,nums,nums_len,start,end):
        count = 0
        for i in range(nums_len):
            if nums[i] >= start and nums[i] <= end:
                count += 1
        return count


s = Solution()
nums = [0,0,2,3]
print(s.findRepeatNumber(nums))

None
