Merge pull request nipy#210 from GaelVaroquaux/fast_gzip_read

MRG: fast reads on large gzip files Fixes nipy#209
grlee77 · Oct 13, 2014 · bd7f849 · bd7f849
2 parents 8dfe1e3 + 8fa5122
commit bd7f849
Showing 1 changed file with 12 additions and 1 deletion.
diff --git a/nibabel/openers.py b/nibabel/openers.py
@@ -13,6 +13,17 @@
 import gzip
 import bz2
 
+# The largest memory chunk that gzip can use for reads
+GZIP_MAX_READ_CHUNK = 100 * 1024 * 1024 # 100Mb
+
+
+def _gzip_open(fileish, *args, **kwargs):
+    # open gzip files with faster reads on large files using larger chunks
+    # See https://github.com/nipy/nibabel/pull/210 for discussion
+    gzip_file = gzip.open(fileish, *args, **kwargs)
+    gzip_file.max_read_chunk = GZIP_MAX_READ_CHUNK
+    return gzip_file
+
 
 class Opener(object):
     """ Class to accept, maybe open, and context-manage file-likes / filenames
@@ -32,7 +43,7 @@ class Opener(object):
         passed to opening method when `fileish` is str.  Change of defaults as
         for \*args
     """
-    gz_def = (gzip.open, ('mode', 'compresslevel'))
+    gz_def = (_gzip_open, ('mode', 'compresslevel'))
     bz2_def = (bz2.BZ2File, ('mode', 'buffering', 'compresslevel'))
     compress_ext_map = {
         '.gz': gz_def,