# String 字符串

在Python表达文字的方式

用 `"` 双引号 或者 `'` 单引号 把问字括起来, Python 就会看待成普通的文字, 不会对其运算
- `'MGT201'`, `"MGT201"`
---

## 常用的operation

- `s1 + s2` .... 返回一个「新」string, 是s1, s2 合并在一起的结果
- `s1 * n` ...... 返回一个「新」string, 是s1 重复 n 次的结果 (n 一定要是 `int`)
- `s1 in s2` .. 返回 `True` 如果 s1 一整個string 在 s2 裡, 反則 `False`


In [1]:
print("Vincent" + "Tse")
print("MGT201 " * 3)

print("cen" in "Vincent")
print("cne" in "Vincent")

VincentTse
MGT201 MGT201 MGT201 
True
False


***Important:*** *如何判斷一個字母是否是 vowel?*

In [6]:
ch = 'v'
print(ch in 'aeiouAEIOU')

False


在比较String的时候 python 是比较每个字母对应的ASCII number, 非字母本身
- `A` 对应 `65`, `B` 对应 `66`, ...依此类推
- `a` 对应 `97`, `b` 对应 `98`, ...依此类推

完整的ASCII TABLE 可以參考: (https://www.asciitable.com)

In [7]:
print("a" > "b")
print("a" > "A")   # 'a' -> 97  'A' -> 65
print("apple" > "appears")  # 前面 'app' 一樣, 從第四個字母開始 'l' > 'e'

False
True
True


## Indexing

String(字符串) 是由很多个字母组成的, 并且是有顺序的, 

那就能通过 index 去找到某个 position (位置) 对应的 character (字母).

- index 一定是从 0 开始, (第一个字母的 index 是 0)
- `s[i]` 会返回 `s` 这个string 在 index `i` 的字母
- `'MGT201'[1]` 会返回 `'G'`

注意: 空格也算字母

In [2]:
#    0   1   2   3   4   5   6   7   8   9   10       12
#    S   p   e   e   d   U   p       2   0   1
#  -11 -10  -9  -8  -7  -6  -5  -4  -3  -2  -1
s = "SpeedUp 201"
print(len(s))   # 11
print(s[0])     # S
print(s[2])     # e

# get the last char (找到最後一個字母)
print(s[10])
print(s[len(s) - 1])
print(s[-1])

# 找到 倒數第三個字母
print(s[-3])  # 2

# print(s[12])  # IndexError: string index out of range

11
S
e
1
1
1
2


IndexError: string index out of range

String is *Immutable* (不可被改变的)!!!

In [12]:
"Vincent"[0] = "B"   # TypeError:  String 是 Immutable

TypeError: 'str' object does not support item assignment

## Slicing 切片

- `s[start: end: step]` index 从 `start` 开始, 到 `end` (不包括) 结束, 每次增加 `step`

- `s[start: end]` 默认每一次 `+1`

- `s[: end]` 默认从`０`开始

- `s[:]`  从头到尾, `s[0: len(s): 1]`

- `s[::-1]` 从尾到头, 反过来

注意: 
- 永远不会有Error
- `step` 如果是 positive, `start` 要在 `end` 的**左**边, 并且往**右**走
- `step` 如果是 negative, `start` 要在 `end` 的**右**边, 并且往**左**走

In [None]:
#    0   1   2   3   4   5   6   7   8   9   10 
#    a   b   c   d   e   f   g   h   i   j   k
#  -11 -10  -9  -8  -7  -6  -5  -4  -3  -2  -1

s = "abcdefghijk"
print(s[1:9:3]) # -> 1 4 7 -> 'beh'
print(s[1:9:1]) # bcdefghi
print(s[1:9])   # bcdefghi        默認+1
print(s[:9])    # abcdefghi       從0開始
print(s[:])     # abcdefghijk     從頭到尾

print(s[1:-4])  # bcdefg
print(s[-9:4])  # cd

print(s[1:99])  # bcdefghijk

#                                                            ->
print(s[99:1])   # 空                   -1------------------99-

#                                               <-
print(s[9:1:-1]) # jihgfedc             -1--------9-------------

#                                       <-
print(s[1:9:-1]) # 空                   -1--------9-------------


print(s[::-1])  # kjihgfedcba (reversed)
print("done")

*`Example:`* Create a copy of `s` but with the characters before index `i` swapped with the characters after index `j`

In [11]:
s = "I am learning programing"     # -> "ng programingm learniI a"
i = 3
j = 10

# TODO:
print(s[j+1:] + s[i:j+1] + s[:i])

ng programingm learniI a


## 常用的 string methods 

判断并返回 `True` / `False` 的 method
```python
s.isalpha()       # 全是英文字母, 无论大小写
s.isdigit()       # 全是 0 - 9
s.islower()       # 至少一个英文字母, 并且全部字母部分是小写
s.isupper()       # 至少一个英文字母, 并且全部字母部分是大写
s.isalnum()       # 只有数字和字母 isalpha() + isdigit()
s.startswith(s2)  # s 是否 s2 开头
s.endswith(s2)    # s 是否 s2 结尾

```

返回「新」的string 的 method
```python
s.lower()         # 返回一个「新」的string, 全部小写
s.upper()         # 返回一个「新」的string, 全部大写
s.replace(x, y)   # 返回一个「新」的string, 全部的 x 都被替换成 y

```

其他比较常用的 method
```python
s.find(sub)       # 返回从「左」边数来第一个sub 出现的index, 找不到则返回 -1
s.count(x)        # 返回 x 出现几次
s.split(x)        # 利用 x 把 s 分开成一个 list (列表)
```



如果想了解更多string的method, 可以直接打 `help(str)`

In [None]:
help(str)

In [None]:
print('Ayna'.isalpha())     # True
print('MGT201'.isalpha())   # False

print('anya 123'.islower()) # True
print('123'.islower())      # False

s = 'Anya is so cute :3'
print(s.startswith('Anya'))       # True
print(s[:len('Anya')] == 'Anya')  # True (也可以這麼寫～)

In [None]:
name = 'Anya'
print(name.upper()) # ANYA
print(name)         # Anya (沒有變)

print('Anya is so cute, Waku~ Waku~'.replace('a', '@@')) # Any@@ is so cute, W@@ku~ W@@ku~

In [None]:
msg = 'The course MGT201 so stupidly designed.'
print(msg.find('MGT201'))   # 11

print('Vincent'.split('n')) # ['Vi', 'ce', 't']

## `'\'` Escape Character 的用法

没有规定一定要用单引号 或者 双引号, 但除了一些特殊情况: 比如文字本身中有 单/双引号

In [None]:
print("I'm learning programming")

I'm learning programming


以下, python 会把 `I'm` 中间的 `'` 当成是string 的结尾, 所以后面 `m learning programin` 会有 SyntaxError

所以:
- 文字中 若有`"` 双引号, 那整个string 就用 `'` 单引号括起来
- 文字中 若有`'` 单引号, 那整个string 就用 `"` 双引号括起来

In [None]:
print('I'm learning programing')

SyntaxError: unterminated string literal (detected at line 1) (2022210581.py, line 1)

*`*但是*`*

python 有一个特殊符号 `'\'` (escape character), 他会更近一步的告诉python 不要把它之后的那一个character 当成有任何含义

In [None]:
print('I\'m learning programming')

I'm learning programming


In [None]:
print('https:\\utoronto\\utm.ca') # 注意, 我們需要 一個 '\' 去 escape 掉 第二個 '\'

https:\utoronto\utm.ca


## 其他特殊符号
- `'\n'` Enter 回车键
- `'\t'` Tab 键

In [1]:
print('Hello\nAnya says:\tWaku! Waku!')

Hello
Anya says:	Waku! Waku!


## Formating A String

In [26]:
name = 'Anya'
age = 3

用 `+` 号 去 合并

In [27]:
print('Waku~ Waku~, ' + name + ' is ' + str(age) + ' years old.')

Waku~ Waku~, Anya is 3 years old.


用 `s.format(v1, v2, ....)`, 后面的 参数 会按照顺序 被 代入到前面 string 里的 `{}`

In [25]:
print('Waku~ Waku~ {} is {} years old.'.format(name, age))

Waku~ Waku~ Anya is 3 years old.


从 Python 3.8 開始, 可以用 formatted String, 在string前面加个 `f` 就可以在里面 插入代码

In [28]:
print(f'Waku~ Waku~ {name} is {age} years old.')

Waku~ Waku~ Anya is 3 years old.


很多其他的语言 `Java, C++, C#, ...` 都是 strongly type language, print 的时候 需要用 `'%(type)'`

现在, python 也提供了此功能 *(很少人会这么用...)*

- `%s` 表示: 被代入的value是個 `str`
- `%d` 表示: 被代入的value是個 `int`
- `%f` 表示: 被代入的value是個 `float`

其他语言还有 `%lu %u %p %c ...` 但 python 并没有这么多种type

In [29]:
print('Waku~ Waku~ %s is %d years old.' % (name, age))

Waku~ Waku~ Anya is 3 years old.


### Multi-Line String

`"`, `'` 的 `str` 是不能直接換行的, 如果需要 換行 可以用 `"""`, `'''`

In [None]:
msg = 'Hello~
My name is Vincent'

In [3]:
msg = '''Hello~
My name is Vincent
'''

msg = """Hello~
My name is Vincent
"""

print(msg)

Hello~
My name is Vincent



In [3]:
print('a\nb\tc')

a
b	c
