# 看完后可以学到什么

- 学会使用re.split来拆分具有多种分隔符的字符串
- 学会根据str.startswith/endswith来判断文件是否以什么为开头或结尾，同时还可以tuple为参数来实现或判断
- 学会使用re.sub来调整字符串中具有特定规则的字符串的格式
- 学会使用`"".join`拼接字符串
- 学会使用str.ljust/rjust/center以及format来实现字符串的格式化输出
- 学会使用str.strip来去除字符串两端不需要字符，用str.replace或re.sub来替换字符，用str.translate来实现字符映射以及字符删除

# 拆分具有多种分隔符的字符串

## 方法一：str.split() 每次处理一种分隔符

In [2]:
def mySplit(s, ds):
    res = [s]
    for d in ds:
        t = []
        map(lambda x:t.extend(x.split(d)), res)
        res = t
    return [x for x in res if x] # 不是直接返回res 是因为可能会有空格

s = 'dah,asdlajsd:asda|sadasdas;'
print mySplit(s, ',:|;')

['dah', 'asdlajsd', 'asda', 'sadasdas']


## 方法二：re.split() 正则表达式（推荐）

In [8]:
import re

res = re.split(r'[,:|;]+', s)
print res #没有过滤空格的
print [x for x in res if x] #有过滤空格的

['dah', 'asdlajsd', 'asda', 'sadasdas', '']
['dah', 'asdlajsd', 'asda', 'sadasdas']


注：若是处理单个分隔符应该使用 s.split() 因为速度更快

# 如何判断字符串a是否以字符串b开头或结尾

In [12]:
a = "a.py"
b = "b.sh"
# 可通过元组来实现或判断
print a.endswith(('.py', '.sh')), b.endswith(('.py', '.sh'))
print a.startswith(('a', 'b')), b.startswith(('a', 'b'))

True True
True True


# 如何调整字符串中文本的格式

In [13]:
s = "2019-01-15 2099-12-25"
re.sub('(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', s) # 后面的\1表示 re 匹配到的组

'01/15/2019 12/25/2099'

# 如何将多个小字符串拼接成一个大的字符串

In [14]:
s = ['adasda', 'asda', 'ewrer']
"-".join(s)

'adasda-asda-ewrer'

#  如何对字符串进行左, 右, 居中对齐

## 使用 str.ljust() str.rjust() str.center() 进行左右对齐

In [16]:
s = 'abc'

In [20]:
s.ljust(10) 

'abc       '

In [18]:
s.ljust(10, '=') 



## format()

In [23]:
format(s, '<10')

'abc       '

In [22]:
format(s, '>10') 

'       abc'

In [24]:
format(s, '^10') 

'   abc    '

## 例子

In [36]:
d = {
    'a':123,
    'abcdefghigk':345,
    'cfghf':67
}
w = max(map(len, d.keys()))
for k in d:
    print(k.ljust(w, "_")+': '+str(d[k]))

a__________: 123
cfghf______: 67
abcdefghigk: 345


注：notebook中显示字符的宽度有点不一致，这里例子的运行结果是正确的

# 如何去掉字符串中不需要的字符

## strip() 去掉两端空白 lstrip() 去掉左端 rstrip() 去掉右端

In [37]:
s = '     asd   123    '
s.strip()

'asd   123'

In [40]:
s = '+++--asd--123--+++'
s.strip('+') 

'--asd--123--'

In [42]:
s = '+++--asd--123--+++'
s.strip('+ ') #这里也可以同时strip多个字符串

'--asd--123--'

## str.replace() 或者 re.sub()

In [43]:
s = '\t123\tasd\tuio'
s.replace('\t', '')

'123asduio'

## str.translate():字符映射

In [45]:
s = 'abc123xyz'
import string
s.translate(string.maketrans('abcxyz', 'xyzabc'))

'xyz123abc'

In [46]:
s = 'abc\rfef\t\n'
s.translate(None, "\r\t\n") #第一个参数设置为·None后，第二个参数即是要删除的字符，比如这里\r\t\n这三个参数都会被删除

'abcfef'