# 字符串

## 生成字符串

**Python**中可以使用一對單引號`''`或者雙引號`""`生成字符串。

In [1]:
s = "hello, world"
s

'hello, world'

In [2]:
s = 'hello world'
s

'hello world'

## 基本操作

加法：

In [3]:
s = 'hello ' + 'world'
s

'hello world'

字符串與數字相乘：

In [4]:
"echo" * 3

'echoechoecho'

檢查長度：

In [5]:
len(s)

11

## 字符串方法

**Python**是一種面向對象的語言，面向對象的語言中一個必不可少的元素就是方法，而字符串是對象的一種，所以有很多可用的方法。

跟很多語言一樣，**Python**使用以下形式來調用方法：

    對象.方法(參數)

### 分割

`s.split()`將s按照空格（包括多個空格，TAB, `\t`，換行, `\n`等）分割，預設為空格分割，並返回所有分割得到的字符串。

In [6]:
line = "1 2 3 4  5"
numbers = line.split()
numbers

['1', '2', '3', '4', '5']

`s.split(sep)`以给定的sep为分隔符对s进行分割。

In [7]:
line = "1,2,3,4,5"
numbers = line.split(',')
numbers

['1', '2', '3', '4', '5']

### 連接

和分割相反，`s.join(str_sequence)`的作用是以s為連接符將字符串序列str_sequence中的元素連接起來，並返回連接後得到的新字符串：

In [8]:
s = ' '
s.join(numbers)

'1 2 3 4 5'

In [9]:
s = ','
s.join(numbers)

'1,2,3,4,5'

### 取代

`s.replace(part1, part2)`將字符串s中指定的部分part1全部替換成想要的部分part2，並返回新的字符串。

In [10]:
s = "hello world"
s.replace('world', 'python')

'hello python'

此時，s的值並沒有變化，替換方法只是生成了一個新的字符串。

In [11]:
s

'hello world'

### 大小寫轉換

`s.upper()`方法返回一個將s中的字母全部大寫的新字符串。

`s.lower()`方法返回一個將s中的字母全部小寫的新字符串。

In [12]:
"hello world".upper()

'HELLO WORLD'

这两种方法也不会改变原来s的值：

In [13]:
s = "HELLO WORLD"
print(s.lower())
print(s)

hello world
HELLO WORLD


### 去除多餘空格

s.strip()返回一個將s兩端的多餘空格除去的新字符串。

s.lstrip()返回一個將s開頭的多餘空格除去的新字符串。

s.rstrip()返回一個將s結尾的多餘空格除去的新字符串。

In [14]:
s = "  hello world   "
s.strip()

'hello world'

s的值依然不會變化：

In [15]:
s

'  hello world   '

In [16]:
s.lstrip()

'hello world   '

In [17]:
s.rstrip()

'  hello world'

## 更多方法

可以使用dir函数查看所有可以使用的方法：

In [18]:
dir(s)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',
 'zfill']

## 多行字符串

Python 用一對 `"""` 或者 `'''` 來生成多行字符串：

In [19]:
a = """hello world.
it is a nice day."""
print(a)

hello world.
it is a nice day.


在儲存時，我們在兩行字符間加上一個換行符 `'\n'`

In [3]:
a

'hello hello hello \n'

In [4]:
a = 'hello ' * 3 + '\n'
b = 'world ' * 5
print(a + b)

hello hello hello 
world world world world world 


## 使用 `()` 或者 `\` 來換行

當代碼太長或者為了美觀起見時，我們可以使用兩種方法來將一行代碼轉為多行代碼：

* ()
* \

In [21]:
a = ("hello, world. "
    "it's a nice day. "
    "my name is xxx")
a

"hello, world. it's a nice day. my name is xxx"

In [22]:
a = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a

"hello, world. it's a nice day. my name is xxx"

In [None]:
S = '開始' * 3 + '\n'
M = '中間' * 4 + '\n'
E = '結尾'
print(S + M + E)

## 強制轉換為字符串

* `str(ob)`強制將`ob`轉化成字符串。
* `repr(ob)`也是強制將`ob`轉化成字符串。(少用)

不同點如下：

In [23]:
str(1.1 + 2.2)

'3.3000000000000003'

In [24]:
repr(1.1 + 2.2)

'3.3000000000000003'

还可以指定按照多少进制来进行转换，最后返回十进制表达的整数：

In [25]:
int('FF', 16)

255

In [26]:
int('377', 8)

255

In [27]:
int('11111111', 2)

255

`float` 可以将字符串转换为浮点数：

In [28]:
float('3.5')

3.5

## 格式化字符串

**Python**用字符串的`format()`方法來格式化字符串。

具體用法如下，字符串中花括號 `{}` 的部分會被format傳入的參數替代，傳入的值可以是字符串，也可以是數字或者別的對象。

In [29]:
'{} {} {}'.format('a', 'b', 'c')

'a b c'

可以用數字指定傳入參數的相對位置：

In [30]:
'{2} {1} {0}'.format('a', 'b', 'c')

'c b a'

還可以使用名稱指定傳參：

In [31]:
'{color} {n} {x}'.format(n=10, x=1.5, color='blue')

'blue 10 1.5'

更可以混用：

In [32]:
'{color} {0} {x} {1}'.format(10, 'foo', x = 1.5, color='blue')

'blue 10 1.5 foo'

可以用`{<field name>:<format>}`指定格式：

In [33]:
from math import pi

'{0:10} {1:10d} {2:10.2f}'.format('foo', 5, 2 * pi)

'foo                 5       6.28'

還可以替換空格，塞入你想塞的符號，並且靠左、靠右、置中對齊

In [34]:
# 靠左對齊、靠右對齊、置中
print('{:_>8.4f}, {:_^8.2f}, {:_^8.4f}'.format(6, 302, 78))

__6.0000, _302.00_, 78.0000_


備註：

字串格式化參數{<總格數>:<欲填入符號><對齊方式><格式>}

|格式|
|---|
|%%|	在字串中顯示%|
|%d|	10 進制 整數|
|%f|	10 進制 浮點數|
|%e, %E|	10 進制 浮點數，並使用科學記號|
|%b|     2 進制|
|%o|	 8 進制|
|%x, %X|	16 進制|
|%s|	字串|


具体规则与C中相同。

當然也可以使用舊式的 `%` 方法進行格式化：

In [35]:
s = "some numbers:"
x = 1.34
y = 2
# 用百分号隔开，括号括起来
t = "%s, %f, %d" %(s, x, y)

In [36]:
t

'some numbers:, 1.340000, 2'