poredb

Poredb is a way to manage very large Oxford Nanopore datasets on the basic principle:

-- track the files, rather than moving them around

Usage

poredb create myexperiment.db
find . -name "*.fast5" > filelist.txt
poredb import myexperiment.db filelist.txt

poredb fastq myexperiment.db > myexperiment.fastq

Andreas Klosterman for dask suggestion.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
files		files
Fast5File.py		Fast5File.py
README.md		README.md
basecallers.txt		basecallers.txt
create.py		create.py
dumpscript.sh		dumpscript.sh
fastq.py		fastq.py
importfiles.py		importfiles.py
poredb_main.py		poredb_main.py
requirements.txt		requirements.txt
stats.py		stats.py
updatelengths.py		updatelengths.py
version.py		version.py
worklist.py		worklist.py