0.20.9

Jump to bottom

muyannian edited this page Mar 5, 2014 · 1 revision

优化：count distinct计算直接使用double，不要string转换来转换去的。影响计算速度。
优化：如果使用了 LinkMMapDirectory就不要使用 BlockBufferInput
Bugfix: 端口被占用的话，程序要退出，不要连接zk，也不要进行心跳，这里的代码顺序进行了调整
优化，count distinct使用的hashset更改为trove的实现，以节省内存。
优化：distinct的内存优化，提升精度（采用两段式查询，第二次因为记录数比较少，抽样比例可以多一些）
优化：历史索引要能够合并成最终的一个 1.提升查询速度 2.减少hdfs中的文件数量
修正第一个列为thedate,日期没有以目录时间为基准的BUG

 修正 任务 在切换索引的时候  数据出现抖动的BUG(hashbug) [see](https://github.com/alibaba/mdrill/issues/67)  <br>

Toggle table of contents Pages 16

Clone this wiki locally