GitHub - Tao-Tang/ECC

ECC

A clustering-based reference selection algorithm for reference-based compression on genome dataset. This program requires C++14 with g++ >= 5.3 and works on Linux

Download and Compile

git clone https://github.com/Tao-Tang/ECC.git
cd ECC
chmod +x bootstrap.sh
./bootstrap.sh
./configure
make

Execution

./ECC p -r result_name -s src_list -t thread_number (for reference-target pair selection)
./ECC c -r result_name -s src_list -t thread_number (for reference-target pair selection and compress data via hirgc)
./ECC d src_file (for decompression)

p for cluster a set of genome sequences
c for cluster and compress a set of genome sequences
d for decompress encoded file
-r for the name of result file
-s for the list of to be cluster sequences (each line will be read as a sequence name)
-t for number of thread

Examples:

./ECC p -r my_archive -s file_list.txt -t 4
./ECC c -r my_archive -s file_list.txt -t 4
./ECC d my_archive

Example

cp ECC test
cd test
./ECC p -r a -s list.txt -t 4
nano ECC_a_pair.txt  (each line contains two files, first is the reference, second is target)
./ECC c -r a -s list.txt -t 4
ls -lh ECC_a.tar
./ECC d a
ls -lh ECC_a

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
Mash		Mash
autom4te.cache		autom4te.cache
capnproto		capnproto
libbsc		libbsc
src		src
test		test
Makefile.in		Makefile.in
README.md		README.md
bootstrap.sh		bootstrap.sh
config.log		config.log
config.status		config.status
configure.ac		configure.ac
result.zip		result.zip

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ECC

Download and Compile

Execution

Examples:

Example

About

Releases

Packages

Languages

Tao-Tang/ECC

Folders and files

Latest commit

History

Repository files navigation

ECC

Download and Compile

Execution

Examples:

Example

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages