1000台机器，每台机器1000个文件，每个文件存储了10亿个整数，如何找到其中最小的1000个值？

如果每个整数使用1 bit来表示，那么10亿个整数 = 2^32 bit/8 = 2^29 Byte，大约等于512MB

每台机器上申请一个int数组长度为 int tmp[N/32+1]即可存储完这些数据，其中N代表要进行查找的总数（这里也就是2^32），tmp中的每个元素在内存在占32位可以对应表示十进制数0~31,所以可得到BitMap表。
再顺序扫描这10亿的数，在对应的bit位上标记该数是否出现过。
然后找出每台机器上1000个最小值
最后将这100w数据汇总都传输到一台机器上通过大顶堆找出最小的1000个值
时间复杂度：O(N+100W * logK)，其中N是总数据量，K = 1000

Provide feedback