Mapreduce decompress s3 file #6

tachu · 2015-11-26T00:41:15Z

Having trouble getting a file from s3 decompressed on the fly. here is the command we are trying

/usr/bin/hadoop jar /usr/lib/hadoop/hadoop-streaming.jar -libjars /home/hadoop/hadoop-xz-1.0.jar -Dmapred.output.compress=false -Dmapred.compress.map.out=false -Dmapred.input.compression.codec=io.sensesecure.hadoop.xz.XZCodec -Dmapred.map.tasks=1 -Dmapred.reduce.tasks=0 -input s3n://XXX/2013-05-02.txt.xz -output s3n://XXX/20130501_resultt -mapper /bin/cat -reducer /bin/cat

We basically are trying to decompress a file on the fly. this example would just write it back to s3 so far it just writes back the compressed data.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Mapreduce decompress s3 file #6

Mapreduce decompress s3 file #6

tachu commented Nov 26, 2015

Mapreduce decompress s3 file #6

Mapreduce decompress s3 file #6

Comments

tachu commented Nov 26, 2015