# 字符串操作

## 1. 处理字符串

### 1.1 字符串字面量

python 默认字符串是单引号`'...'`包围的字符，可是如果字符串中包含单引号该怎么办？

例如，`'I follow Jack's choice.'` 其中，`s choice` 将会被解析成无效代码部分。

In [2]:
sample_str = 'I follow Jack's choice.'

SyntaxError: invalid syntax (<ipython-input-2-08d85dbd5eaf>, line 1)

我们有几种方法来处理这种情况。

#### 双引号

In [4]:
sample_str = "I follow Jack's choice."
sample_str

"I follow Jack's choice."

#### 转义字符

In [6]:
sample_str = 'I follow Jack\'s choice.'
sample_str

"I follow Jack's choice."

#### 原始字符串 (raw string)

原始字符串忽略所有的转义字符，即打印所有的反斜杠`\`. 原始字符串在正则表达式中很有用。

In [8]:
sample_str = r'I follow Jack\'s choice.'
print(sample_str)

I follow Jack\'s choice.


#### 多行字符串

三重引号`'''...'''` 之间的所有引号，制表符，换行都被认为是字符串的一部分。Python 代码块缩进不适用于多行字符串。

In [11]:
sample_str = '''good morning.

I follow Jack's choice.

            thank you'''

print(sample_str)

good morning.

I follow Jack's choice.

            thank you


### 1.2 多行注释

使用三个双引号 `"""..."""`

In [12]:
"""
This is comments.
whatever you type here,
does not matter...
"""
print('Hi.')

Hi.


### 1.3 String as a list

#### 字符串切片

`sample_string[0:5]` 包含从第0个字符到第4个字符的子字符串。

In [15]:
sample_str

"good morning.\n\nI follow Jack's choice.\n\n            thank you"

In [17]:
sample_str[0]

'g'

In [18]:
sample_str[:5]

'good '

In [19]:
sample_str[-1]

'u'

In [21]:
sample_str[-20:]

'           thank you'

注意，字符串是不可修改数据类型，切片后对原来的string 没有影响。

#### 判断是否包含子字符串: 使用 `in` 和 `not in`

In [22]:
'hello' in sample_str

False

In [23]:
'good' in sample_str

True

In [24]:
'' in sample_str # 空字符串返回True

True

In [25]:
'' in ''

True

In [27]:
'hello' not in sample_str

True

## 2 字符串方法

### 2.1 `upper()`, `lower()`, `isupper()`, `islower()`

In [28]:
sample_str = 'Good morning Jack.'

In [33]:
sample_str_upper = sample_str.upper() # 注意，这个方法并不改变字符串本身，而是返回了一个新的字符串
sample_str_upper

'GOOD MORNING JACK.'

In [32]:
sample_str_lower = sample_str.lower()
sample_str_lower

'good morning jack.'

In [34]:
sample_str_upper.isupper() # 全为大写返回True

True

In [35]:
sample_str_upper.islower() # 全为小写返回True

False

In [36]:
sample_str_lower.isupper()

False

In [37]:
sample_str_lower.islower()

True

上面这些方法，因为都返回一个字符串，所以可以串联调用。

In [40]:
'Good morning Jack.'.lower().islower()

True

### 2.2 `isX` 方法

除了`islower()` 和`isupper()` 方法，我们还常用以下几种`isX()` 方法：
- `isalpha()`: 只包含字母，并且非空，返回True;
- `isalnum()`: 只包含字母和数字，并且非空，返回True;
- `isdecimal()`: 只包含数字，并且非空，返回True;
- `isspace()`: 只包含空格，制表符，换行符，并且非空，返回True;
- `istitle()`: 只包含以大写字母开头，后面都是小写字母的单词，并且非空，返回True;

In [62]:
test_str_list = ['helloworld', 'helloworld2', '123', '123.1', '127.0.0.1', ' \t', 'Hello World']

In [63]:
for string in test_str_list:
    print('\n========={}=========\n'.format(string))
    print('isalpha()', string.isalpha())
    print('isalnum()', string.isalnum())
    print('isdecimal()', string.isdecimal())
    print('isspace()', string.isspace())
    print('istitle()', string.istitle())




isalpha() True
isalnum() True
isdecimal() False
isspace() False
istitle() False


isalpha() False
isalnum() True
isdecimal() False
isspace() False
istitle() False


isalpha() False
isalnum() True
isdecimal() True
isspace() False
istitle() False


isalpha() False
isalnum() False
isdecimal() False
isspace() False
istitle() False


isalpha() False
isalnum() False
isdecimal() False
isspace() False
istitle() False


isalpha() False
isalnum() False
isdecimal() False
isspace() True
istitle() False


isalpha() False
isalnum() False
isdecimal() False
isspace() False
istitle() True
