###### NAME
    cut - remove sections from each line of files
###### SYNOPSIS
    cut OPTION... [FILE]...
###### DESCRIPTION
    Print selected parts of lines from each FILE to standard output.

Instance file：part of the content of the /etc/passwd

In [1]:
cat passwd

root:x:0:0:root:/root:/bin/bash
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin


#### OPTIONS

###### -b, --bytes=LIST
    select only these bytes

LIST  
Use one, and only one of -b, -c or -f.  
Each LIST is made up of one range, or many ranges separated by commas.  
Selected input is written in the same order that it is read, and is written exactly once.  
Each range is one of:
###### N      
    N’th byte, character or field, counted from 1
###### N-     
    from N’th byte, character or field, to end of line
###### N-M    
    from N’th to M’th (included) byte, character or field
###### -M     
    from first to M’th (included) byte, character or field

In [2]:
# Get second byte per line in the passswd file.
cut -b2 passwd

o
a
a
u
b
c
s


In [6]:
# Get bytes from 8 to the end of line per line.
cut -b8- passwd

0:0:root:/root:/bin/bash
7:0:halt:/sbin:/sbin/halt
8:2:mail:/var/spool/mail:/sbin/nologin
1:4:uucp:/var/spool/uucp:/sbin/nologin
8:1:System message bus:/:/sbin/nologin
6:9:virtual console memory owner:/dev:/sbin/nologin
7:4:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin


In [7]:
# Get bytes from 5 to 7 per line
cut -b5-11 passwd

:x:0:0:
:x:7:0:
:x:8:2:
:x:1:4:
:x:8:1:
:x:6:9:
:x:7:4:


In [8]:
# Get bytes from the start of line to 7 per line.
cut -b-7 passwd

root:x:
halt:x:
mail:x:
uucp:x:
dbus:x:
vcsa:x:
sshd:x:


In [11]:
# combination
cut -b-4,6,8-10 passwd

rootx0:0
haltx7:0
mailx8:2
uucpx1:4
dbusx8:1
vcsax6:9
sshdx7:4


###### -c, --characters=LIST
    select only these characters

###### 注意
对于单字节字符(如英文字符)，使用-b选项和-c选项无区别

In [12]:
cut -c1-4 passwd

root
halt
mail
uucp
dbus
vcsa
sshd


对于多字节字符(如中文字符),-c选项能正常工作

Instance file:

In [13]:
cat time.txt

2016年 08月 01日 星期一 08:11:32 CST
2016年 08月 02日 星期二 11:11:11 CST
2016年 08月 03日 星期三 14:55:30 CST
2016年 08月 04日 星期四 18:05:09 CST
2016年 08月 05日 星期五 23:03:35 CST


In [14]:
# with -c option can get correct result.
cut -c5 time.txt

年
年
年
年
年


而-b选项可能会得到正常的结果，但是需要手动计算字符所占字节数

In [1]:
cut -b5-7 time.txt

年
年
年
年
年


In [2]:
# N-
cut -c15- time.txt

星期一 08:11:32 CST
星期二 11:11:11 CST
星期三 14:55:30 CST
星期四 18:05:09 CST
星期五 23:03:35 CST


In [3]:
# -M
cut -c-13 time.txt

2016年 08月 01日
2016年 08月 02日
2016年 08月 03日
2016年 08月 04日
2016年 08月 05日


In [4]:
# M-N
cut -c15-17 time.txt

星期一
星期二
星期三
星期四
星期五


###### -n     
    with -b: don’t split multibyte characters

说明:文件time.txt中,'年'占第5,6,7字节  
如果不使用-n选项，则在如下cut操作中出现乱码
[liheyi@analysis data]$ cut -b6-10 time.txt  
¹  ´   08  
¹  ´   08  
¹  ´   08  
¹  ´   08  
¹  ´   08  

[liheyi@analysis data]$ cut -b7-10 time.txt  
´ 08  
´ 08  
´ 08  
´ 08  
´ 08  

当然，如果从第5字节开始，则正常工作  
[liheyi@analysis data]$ cut -b5-10 time.txt 
年 08  
年 08  
年 08  
年 08  
年 08  

但是，如果-b选项结合-n使用，则会避免分割多字节字符  
且无论从多字节字符的哪个字节开始，都会正常显示

In [1]:
# 从第5字节开始
cut -nb5-10 time.txt

年 08
年 08
年 08
年 08
年 08


In [2]:
# 从第6字节开始
cut -nb6-10 time.txt

年 08
年 08
年 08
年 08
年 08


In [3]:
# 从第7字节开始
cut -nb7-10 time.txt

年 08
年 08
年 08
年 08
年 08


###### -d, --delimiter=DELIM
    with -f: use DELIM instead of TAB for field delimiter

###### -f, --fields=LIST
    select only these fields;  
    also print any line that contains no delimiter character, unless the -s option is specified

In [4]:
# N
cut -d' ' -f4 time.txt

星期一
星期二
星期三
星期四
星期五


In [5]:
cut -d: -f7 passwd

/bin/bash
/sbin/halt
/sbin/nologin
/sbin/nologin
/sbin/nologin
/sbin/nologin
/sbin/nologin


In [6]:
# N-
cut -d' ' -f4- time.txt

星期一 08:11:32 CST
星期二 11:11:11 CST
星期三 14:55:30 CST
星期四 18:05:09 CST
星期五 23:03:35 CST


In [7]:
cut -d: -f6- passwd

/root:/bin/bash
/sbin:/sbin/halt
/var/spool/mail:/sbin/nologin
/var/spool/uucp:/sbin/nologin
/:/sbin/nologin
/dev:/sbin/nologin
/var/empty/sshd:/sbin/nologin


In [8]:
# -M
cut -d' ' -f-3 time.txt

2016年 08月 01日
2016年 08月 02日
2016年 08月 03日
2016年 08月 04日
2016年 08月 05日


In [9]:
cut -d: -f-5 passwd

root:x:0:0:root
halt:x:7:0:halt
mail:x:8:2:mail
uucp:x:1:4:uucp
dbus:x:8:1:System message bus
vcsa:x:6:9:virtual console memory owner
sshd:x:7:4:Privilege-separated SSH


In [10]:
# M-N
cut -d' ' -f2-5 time.txt

08月 01日 星期一 08:11:32
08月 02日 星期二 11:11:11
08月 03日 星期三 14:55:30
08月 04日 星期四 18:05:09
08月 05日 星期五 23:03:35


In [11]:
cut -d: -f2-6 passwd

x:0:0:root:/root
x:7:0:halt:/sbin
x:8:2:mail:/var/spool/mail
x:1:4:uucp:/var/spool/uucp
x:8:1:System message bus:/
x:6:9:virtual console memory owner:/dev
x:7:4:Privilege-separated SSH:/var/empty/sshd


###### --complement
    complement the set of selected bytes, characters or fields

In [14]:
cat passwd

root:x:0:0:root:/root:/bin/bash
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:2:mail:/var/spool/mail:/sbin/nologin
uucp:x:1:4:uucp:/var/spool/uucp:/sbin/nologin
dbus:x:8:1:System message bus:/:/sbin/nologin
vcsa:x:6:9:virtual console memory owner:/dev:/sbin/nologin
sshd:x:7:4:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin


In [12]:
# -b
cut -b8- passwd

0:0:root:/root:/bin/bash
7:0:halt:/sbin:/sbin/halt
8:2:mail:/var/spool/mail:/sbin/nologin
1:4:uucp:/var/spool/uucp:/sbin/nologin
8:1:System message bus:/:/sbin/nologin
6:9:virtual console memory owner:/dev:/sbin/nologin
7:4:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin


In [13]:
cut --complement -b8- passwd

root:x:
halt:x:
mail:x:
uucp:x:
dbus:x:
vcsa:x:
sshd:x:


In [15]:
# -c
cut -c19- time.txt

08:11:32 CST
11:11:11 CST
14:55:30 CST
18:05:09 CST
23:03:35 CST


In [16]:
cut --complement -c19- time.txt

2016年 08月 01日 星期一 
2016年 08月 02日 星期二 
2016年 08月 03日 星期三 
2016年 08月 04日 星期四 
2016年 08月 05日 星期五 


In [17]:
# -f
cut -d' ' -f4,6 time.txt

星期一 CST
星期二 CST
星期三 CST
星期四 CST
星期五 CST


In [18]:
cut --complement -d' ' -f4,6 time.txt

2016年 08月 01日 08:11:32
2016年 08月 02日 11:11:11
2016年 08月 03日 14:55:30
2016年 08月 04日 18:05:09
2016年 08月 05日 23:03:35


In [21]:
cut -d: -f2-6 passwd

x:0:0:root:/root
x:7:0:halt:/sbin
x:8:2:mail:/var/spool/mail
x:1:4:uucp:/var/spool/uucp
x:8:1:System message bus:/
x:6:9:virtual console memory owner:/dev
x:7:4:Privilege-separated SSH:/var/empty/sshd


In [23]:
cut --complement -d: -f2-6 passwd

root:/bin/bash
halt:/sbin/halt
mail:/sbin/nologin
uucp:/sbin/nologin
dbus:/sbin/nologin
vcsa:/sbin/nologin
sshd:/sbin/nologin


###### -s, --only-delimited
    do not print lines not containing delimiters

###### --output-delimiter=STRING
    use STRING as the output delimiter the default is to use the input delimiter

In [24]:
cut -d: -f-5 --output-delimiter=',' passwd

root,x,0,0,root
halt,x,7,0,halt
mail,x,8,2,mail
uucp,x,1,4,uucp
dbus,x,8,1,System message bus
vcsa,x,6,9,virtual console memory owner
sshd,x,7,4,Privilege-separated SSH


In [25]:
grep 'bash' passwd | cut -d: -f1,6,7 --output-delimiter=$'\n'

root
/root
/bin/bash


In [26]:
# if '$' is omit.
grep 'bash' passwd | cut -d: -f1,6,7 --output-delimiter='\n'

root\n/root\n/bin/bash
