GitHub

主题：采用变粒度分块以及元数据大小，提高去重速度和精度

目录结构

数据所依赖的部分包存在lib文件夹中，其余通过Maven获得。具体内容并没有详细说明，整体代码都是根据论文的逻辑结构来编写的，理解上应该不存在较大的问题。但是由于本人的能力有限，代码肯定多多少少存在某些问题，代码风格不够规范，希望之后的同学能够理解。

代码结构

如何使用？

将项目打包，然后java -jar **.jar --parameters... 即可

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.idea		.idea
META/META-INF		META/META-INF
images		images
lib		lib
out/artifacts		out/artifacts
src		src
target		target
1805.00352.pdf		1805.00352.pdf
DevNASSourceCode.iml		DevNASSourceCode.iml
README.md		README.md
buffer_write.txt		buffer_write.txt
decode.txt		decode.txt
diff.txt		diff.txt
log4j2.xml		log4j2.xml
pom.xml		pom.xml
resource.txt		resource.txt
target.txt		target.txt
tst.txt		tst.txt

XumingYE/NAS