# 剑指 Offer 41	数据流中的中位数  

思路：
- 排序
    - 添加数据直接在列表尾部添加，查找中位数时对列表排序，再返回中位数
    - 时间复杂度 $O(N \log N)$ : addNum函数复杂度$O(1)$，findMedian中排序的复杂度$O(N \log N)$
    - 空间复杂度 $O(N)$ : N 为数据流中的元素数量
- 二分查找插入
    - 添加数据时通过二分查找插入排好序的数据中
    - 时间复杂度 $O(N)$ : 查找$O(\log N)$ ，插入$O(N)$
    - 空间复杂度 $O(N)$ : N 为数据流中的元素数量
- 堆
    - 使用一个小顶堆A和大顶堆B分别保存数据的一半
    - 小顶堆A保存较大一部分，大顶堆B保存较小一部分，中位数即可由堆顶元素求出
    - 要进入一个堆，要先通过另一个堆，从而进行排序，使堆顶保持为中位数
    - 设元素总数为 $N = m + n$ ，其中 m 和 n 分别为 A 和 B 中的元素个数
    - 当 $m = n$（即 N 为 偶数）：需向 A 添加一个元素。实现方法：将新元素num 插入至 B ，再将 B 堆顶元素插入至 A 
    - 当 $m \ne n$（即 N 为 奇数）：需向 B 添加一个元素。实现方法：将新元素 num插入至 A，再将 A 堆顶元素插入至 B 
    - 当  $m = n$（即 N 为 偶数）：则中位数为 ( A 的堆顶元素 + B 的堆顶元素 )/2
    - 当 $m \ne n$（即 N 为 奇数）：则中位数为 A 的堆顶元素。因为数据先加入A,如果数据先进入B，则弹出B的堆顶
    - 时间复杂度
        - 查找中位数 $O(1)$ ： 获取堆顶元素使用 $O(1)$ 时间；
        - 添加数字 $O(\log N)$ ： 堆的插入和弹出操作使用 $O(\log N)$ 时间。
    - 空间复杂度 $O(N)$ : N 为数据流中的元素数量，小顶堆 A 和大顶堆 B 最多同时保存 N 个元素

注意：
- python中heapq 只有小顶堆，要实现大顶堆需要取相反数

超时，添加数字函数考虑的是插入排序，复杂度O(N)

考虑到可能是添加数据操作较多，直接插入数据，在查找中位数时排序后再返回中位数值

In [1]:
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.datas = []

    def addNum(self, num: int) -> None:
        self.datas.append(num)
        for i in range(len(self.datas) - 1, 0, -1):
            if self.datas[i] < self.datas[i - 1]:
                self.datas[i], self.datas[i - 1] = self.datas[i - 1], self.datas[i]

    def findMedian(self) -> float:
        index = len(self.datas) // 2
        if len(self.datas) % 2 == 0:
            return (self.datas[index] + self.datas[index-1]) / 2
        else:
            return self.datas[index]


# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

In [2]:
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.datas = []

    def addNum(self, num: int) -> None:
        self.datas.append(num)
        

    def findMedian(self) -> float:
        self.datas.sort()
        index = len(self.datas) // 2
        if len(self.datas) % 2 == 0:
            return (self.datas[index] + self.datas[index-1]) / 2
        else:
            return self.datas[index]


# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

# 答案

## 排序

In [3]:
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.datas = []

    def addNum(self, num: int) -> None:
        self.datas.append(num)
        

    def findMedian(self) -> float:
        self.datas.sort()
        index = len(self.datas) // 2
        if len(self.datas) % 2 == 0:
            return (self.datas[index] + self.datas[index-1]) / 2
        else:
            return self.datas[index]


# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

## 堆

In [4]:
from heapq import *

class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.A = []
        self.B = []

    def addNum(self, num: int) -> None:
        if len(self.A) != len(self.B):
            heappush(self.A, num)
            heappush(self.B, -heappop(self.A))
        else:
            heappush(self.B, -num)
            heappush(self.A, -heappop(self.B))

    def findMedian(self) -> float:
        if len(self.A) != len(self.B):
            return self.A[0]
        else:
            # B中存的相反数，所以减去B的元素
            return (self.A[0] - self.B[0]) / 2

# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

数据如果先进入B的情况

In [5]:
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.A = []
        self.B = []

    def addNum(self, num: int) -> None:
        if len(self.A) != len(self.B):
            heappush(self.B, -num)
            heappush(self.A, -heappop(self.B))
            
        else:
            heappush(self.A, num)
            heappush(self.B, -heappop(self.A))

    def findMedian(self) -> float:
        if len(self.A) != len(self.B):
            return -self.B[0]
        else:
            return (self.A[0] - self.B[0]) / 2

# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

push和pop联合的函数比两个分开的效率更高

In [6]:
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.A = []
        self.B = []

    def addNum(self, num: int) -> None:
        if len(self.A) != len(self.B):
            heappush(self.B, -heappushpop(self.A,num))
        else:
            heappush(self.A, -heappushpop(self.B,-num))

    def findMedian(self) -> float:
        if len(self.A) != len(self.B):
            return self.A[0]
        else:
            # B中存的相反数，所以减去B的元素
            return (self.A[0] - self.B[0]) / 2

# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()