Skip to content
muyannian edited this page Mar 5, 2014 · 1 revision
  1. 优化:count distinct计算直接使用double,不要string转换来转换去的。影响计算速度。
  2. 优化:如果使用了 LinkMMapDirectory就不要使用 BlockBufferInput
  3. Bugfix: 端口被占用的话,程序要退出,不要连接zk,也不要进行心跳,这里的代码顺序进行了调整
  4. 优化,count distinct使用的hashset更改为trove的实现,以节省内存。
  5. 优化:distinct的内存优化,提升精度(采用两段式查询,第二次因为记录数比较少,抽样比例可以多一些)
  6. 优化:历史索引 要能够合并成最终的一个 1.提升查询速度 2.减少hdfs中的文件数量
  7. 修正第一个列为thedate,日期没有以目录时间为基准的BUG
  8.  修正 任务 在切换索引的时候  数据出现抖动的BUG(hashbug) [see](https://github.com/alibaba/mdrill/issues/67)  <br>
    
Clone this wiki locally