# 字符串文字

## 四种引号

引号的作用就是将文字包裹起来，告诉 Python "这是个字符串！"

单引号 `'` 和双引号 `"` 是最常见的两种字符字符串引号

In [17]:
print('single-quotes')
print("double-quotes")

single-quotes
double-quotes


三个引号的情况不太常见，但是它在一些场合有特定的作用（如函数文档 doc-strings）

In [18]:
print('''triple single-quotes''')
print("""triple double-quotes""")

triple single-quotes
triple double-quotes


**我们为什么需要两种不同的引号？**

In [19]:
# 为了写出这样的句子
print('The professor said "No laptops in class!" I miss my laptop.')

The professor said "No laptops in class!" I miss my laptop.


如果我们偏要只用一种引号呢？

In [20]:
# 这会导致语法错误，Python 无法正确判断一个字符串的终止位置
print("The professor said "No laptops in class!" I miss my laptop.")

SyntaxError: invalid syntax (3410012630.py, line 2)

## 字符串中的换行符号

前面有反斜杠 `\` 的字符，叫做**转义序列**

比如 `\n` 代表**换行**，尽管它看起来像两个字符，但是 Python 依然把它视为一个特殊的字符

In [None]:
# 这两个 print() 在做同样的事情
print("abc\ndef")  # \n 是一个单独的换行符号

abc
def


In [None]:
print("""abc
def""")

abc
def


In [None]:
print("""你可以在字符串后面使用 反斜杠 `\`  来排除后面的换行。\
比如这里是第二行文字，但是你会看到它会紧跟在上一行句号后面。\
这种做法在 CIL 里面经常使用（多个 Flag 并排保持美观），\
但是在编程中的应用比较少。\
""")

你可以在字符串后面使用 反斜杠 `\`  来排除后面的换行。比如这里是第二行文字，但是你会看到它会紧跟在上一行句号后面。这种做法在 CIL 里面经常使用（多个 Flag 并排保持美观），但是在编程中的应用比较少。


In [None]:
print("""你可以在字符串后面使用 反斜杠 `\`  来排除后面的换行。
比如这里是第二行文字，但是你会看到它会紧跟在上一行句号后面。
这种做法在 CIL 里面经常使用（多个 Flag 并排保持美观），
但是在编程中的应用比较少。
""")

你可以在字符串后面使用 反斜杠 `\`  来排除后面的换行。
比如这里是第二行文字，但是你会看到它会紧跟在上一行句号后面。
这种做法在 CIL 里面经常使用（多个 Flag 并排保持美观），
但是在编程中的应用比较少。



## 其他的转义序列

In [None]:
print("双引号：\"")

双引号："


In [None]:
print("反斜线：\\")

反斜线：\


In [None]:
print("换\n行")

换
行


In [None]:
print("这个是\t制\t表\t符\n也叫\t跳\t格\t键")

这个是	制	表	符
也叫	跳	格	键


转义序列只作为一个字符存在

In [None]:
s = "a\\b\"c\td"
print("s =", s)
print("\ns 的长度为：", len(s))

s = a\b"c	d

s 的长度为： 7


## repr() vs. print()

我们现在有两个字符串

In [None]:
s1 = "Data\tWhale"
s2 = "Data        Whale"

它俩看起来似乎是一样的

In [None]:
print("s1:", s1)
print("s2:", s2)

s1: Data	Whale
s2: Data        Whale


 > ### 如来佛合掌道：“观音尊者，你看那两个行者，谁是真假？” 

但是它们真的一样吗？

In [None]:
s1 == s2

False

> ### “谛听，汝之神通，能分辨出谁是真身，可为我说之。”

In [None]:
print(repr(s1))
print(repr(s2))

'Data\tWhale'
'Data        Whale'


In [None]:
hack_text = "密码应当大于 8 个字符，小于 16 个字符，包含大写字母、小写字母、数字和特殊符号\t\t\t\t\t\t\t\t\t\t\t\t\t"

In [None]:
print(hack_text)

密码应当大于 8 个字符，小于 16 个字符，包含大写字母、小写字母、数字和特殊符号													


In [None]:
print(repr(hack_text))

'密码应当大于 8 个字符，小于 16 个字符，包含大写字母、小写字母、数字和特殊符号\t\t\t\t\t\t\t\t\t\t\t\t\t'


String Literals as Multi-line Comments


In [None]:
"""
Python 本身是没有多行注释的，
但是你可以用多行字符串实现同样的操作，
还记得我们之前学过的“表达式“吗？
它的原理就是 Python 会运行它，
但是马上扔掉！（垃圾回收机制）
"""
print("Amazing!")

Amazing!


# 一些字符串常量

In [None]:
import string
print(string.ascii_letters)

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ


In [None]:
print(string.ascii_lowercase)

abcdefghijklmnopqrstuvwxyz


In [None]:
print(string.ascii_uppercase) 

ABCDEFGHIJKLMNOPQRSTUVWXYZ


In [None]:
print(string.digits)

0123456789


In [None]:
print(string.punctuation) # < = >

!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~


In [None]:
print(string.printable)

0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ 	



In [None]:
print(string.whitespace)

 	



In [None]:
print(repr(string.whitespace))

' \t\n\r\x0b\x0c'


# 一些字符串的运算


字符串的加减

In [None]:
print("abc" + "def")
print("abc" * 3)

abcdef
abcabcabc


In [None]:
print("abc" + 3)

TypeError: can only concatenate str (not "int") to str

`in` 运算（超级好用！）

In [None]:
print("ring" in "strings")
print("wow" in "amazing!")
print("Yes" in "yes!")
print("" in "No way!")

True
False
False
True


### 字符串索引和切片

单个字符索引

索引可以让我们在特定位置找到一个字符

In [21]:
s = "Datawhale"
print(s)
print(s[0])
print(s[1])
print(s[2])
print(s[3])

Datawhale
D
a
t
a


In [None]:
len(s)

9

In [None]:
print(s[len(s)-1])

e


In [22]:
print(s[len(s)])

IndexError: string index out of range

负数索引

In [None]:
print(s)
print(s[-5])
print(s[-4])
print(s[-3])
print(s[-2])
print(s[-1])

Datawhale
w
h
a
l
e


用切片来获取字符串的一部分

In [None]:
print(s[0:4])
print(s[4:9])

Data
whale


In [None]:
print(s[0:2])
print(s[2:4])
print(s[5:7])
print(s[7:9])

Da
ta
ha
le


切片的默认参数

In [None]:
print(s[:4])
print(s[4:])
print(s[:])

Data
whale
Datawhale


切片的第三个参数 `step`

In [None]:
print(s[:9:3])
print(s[1:4:2])

Daa
aa


翻转字符串

In [None]:
# 可以，但是不优雅
print(s[::-1])

elahwataD


In [None]:
# 也可以，但是还是不够优雅
print("".join(reversed(s)))

elahwataD


In [24]:
# 实在是太优雅辣
def reverseString(s):
    return s[::-1]

print(reverseString(s))


elahwataD


# 字符串的循环

用索引的 for 循环

In [None]:
for i in range(len(s)):
    print(i, s[i])

0 D
1 a
2 t
3 a
4 w
5 h
6 a
7 l
8 e


其实也可以不用索引（超级好用的 `in`）

In [None]:
for c in s:
    print(c)

D
a
t
a
w
h
a
l
e


用 `split()` 来循环

In [None]:
# class_name.split() 本身会产生一个新的叫做“列表”的东西，但是它不存储任何内容

class_name = "learn python the smart way 2nd edition"
for word in class_name.split():
    print(word)

learn
python
the
smart
way
2nd
edition


用 `splitlines()` 来循环

In [None]:
# 跟上面一样，class_info.splitlines() 也会产生一个列表，但不存储任何内容

class_info = """\
聪明办法学 Python 第二版是 Datawhale 基于第一版教程的一次大幅更新。我们尝试在教程中融入更多计算机科学与人工智能相关的内容，制作“面向人工智能的 Python 专项教程”。

我们的课程简称为 P2S，有两个含义：

Learn Python The Smart Way V2，“聪明办法学 Python 第二版”的缩写。
Prepare To Be Smart， 我们希望同学们学习这个教程后能学习到聪明的办法，从容的迈入人工智能的后续学习。
"""
for line in class_info.splitlines():
    if (line.startswith("Prepare To Be Smart")):
        print(line)

Prepare To Be Smart， 我们希望同学们学习这个教程后能学习到聪明的办法，从容的迈入人工智能的后续学习。


# 例子：回文判断

如果一个句子正着读、反着读都是一样的，那它就叫做“回文”

In [25]:
def isPalindrome1(s):
    return (s == reverseString(s))

In [27]:
def isPalindrome2(s):
    for i in range(len(s)):
        if (s[i] != s[len(s)-1-i]):
            return False
    return True

In [28]:
def isPalindrome3(s):
    for i in range(len(s)):
        if (s[i] != s[-1-i]):
            return False
    return True

In [29]:
def isPalindrome4(s):
    while (len(s) > 1):
        if (s[0] != s[-1]):
            return False
        s = s[1:-1]
    return True

In [30]:
print(isPalindrome1("abcba"), isPalindrome1("abca"))
print(isPalindrome2("abcba"), isPalindrome2("abca"))
print(isPalindrome3("abcba"), isPalindrome3("abca"))
print(isPalindrome4("abcba"), isPalindrome4("abca"))

True False
True False
True False
True False


# 一些跟字符串相关的内置函数

`str()` 和 `len()`


In [32]:
name = input("Enter your name: ")
print("Hi, " + name + ". Your name has " + str(len(name)) + " letters!")

Hi, epsilon. Your name has 7 letters!


`chr()` 和 `ord()`


In [35]:
print(ord("A"))

65


In [37]:
print(chr(65))

A


In [40]:
print(
    chr(
        ord("A") + 1
    )
)

B


In [41]:
print(chr(ord("A") + ord(" ")))

a


`eval()`


In [None]:
# 它可以正常运行，但是我们不推荐你使用这个方法
s = "(3**2 + 4**2)**0.5"
print(eval(s))

In [42]:
s = "Encrypt_My_HardDrive()"
print(eval(s)) # 如果这是一串恶意代码，那会发生什么

NameError: name 'Encrypt_My_HardDrive' is not defined

# 一些字符串方法

In [43]:
def p(test):
    print("True     " if test else "False    ", end="")
def printRow(s):
    print(" " + s + "  ", end="")
    p(s.isalnum())
    p(s.isalpha())
    p(s.isdigit())
    p(s.islower())
    p(s.isspace())
    p(s.isupper())
    print()
def printTable():
    print("  s   isalnum  isalpha  isdigit  islower  isspace  isupper")
    for s in "ABCD,ABcd,abcd,ab12,1234,    ,AB?!".split(","):
        printRow(s)
printTable()

  s   isalnum  isalpha  isdigit  islower  isspace  isupper
 ABCD  True     True     False    False    False    True     
 ABcd  True     True     False    False    False    False    
 abcd  True     True     False    True     False    False    
 ab12  True     False    False    True     False    False    
 1234  True     False    True     False    False    False    
       False    False    False    False    True     False    
 AB?!  False    False    False    False    False    True     


In [46]:
print("This is nice. Yes!".lower())
print("So is this? Sure!!".upper())

this is nice. yes!
SO IS THIS? SURE!!


In [None]:
print("   Strip removes leading and trailing whitespace only    ".strip())

In [None]:
print("This is nice.  Really nice.".replace("nice", "sweet"))
print("This is nice.  Really nice.".replace("nice", "sweet", 1)) # count = 1

In [50]:
s = "This is so so fun!"
t = s.replace("so ", "")
print(t)

This is fun!


In [None]:
print("This is a history test".count("is"))
print("This IS a history test".count("is"))

In [None]:
print("Dogs and cats!".startswith("Do"))
print("Dogs and cats!".startswith("Don't"))

In [None]:
print("Dogs and cats!".endswith("!"))
print("Dogs and cats!".endswith("rats!"))

In [None]:
print("Dogs and cats!".find("and"))
print("Dogs and cats!".find("or"))

In [None]:
print("Dogs and cats!".index("and"))
print("Dogs and cats!".index("or"))

# 用 `f-string` 格式化字符串

In [51]:
x = 42
y = 99

print(f'Did you know that {x} + {y} is {x+y}?')

Did you know that 42 + 99 is 141?


# 其他格式化字符串的方法

f-strings are a great way to format strings. You may also see python code written with other string formating techniques that were common before Python 3.6. See these optional notes on formatting strings using the % operator and using the format() method.


# 字符串是不可变的

In [57]:
s = "Datawhale"
s[3] = "e"  # Datewhale

TypeError: 'str' object does not support item assignment

你必须创建一个新的字符串

In [58]:
s = s[:3] + "e" + s[4:]
print(s)

Datewhale


# 字符串和别名

字符串是不可变的，所以它的别名也是不可变的

In [62]:
s = 'Data'  # s 引用了字符串 “Data”
t = s      # t 只是 “Data” 的一个只读别名
s += 'whale'
print(s)
print(t)

Datawhale
Data


In [64]:
t[3] = "e"

TypeError: 'str' object does not support item assignment

# 基础文件操作

In [67]:
def readFile(path):
    with open(path, "rt") as f:
        return f.read()

def writeFile(path, contents):
    with open(path, "wt") as f:
        f.write(contents)

contentsToWrite = "This is a test!\nIt is only a test!"
writeFile("foo.txt", contentsToWrite)

contentsRead = readFile("foo.txt")
assert(contentsRead == contentsToWrite)

print("Open the file foo.txt and verify its contents.")

Open the file foo.txt and verify its contents.


这有个更复杂的例子

In [68]:
import ast

def readFile(path):
    with open(path, "rt") as f:
        return f.read()

def writeFile(path, contents):
    with open(path, "wt") as f:
        f.write(contents)

# Place all your data in a dictionary, like so:
myData = {
    'names': ['fred', 'wilma', 'betty'],
    'highScores': [32, 41, 18, 17, 64],
    'stateCapitals': { 'pa':'harrisburg', 'oh':'columbus' },
    'setOfPrimes': { 2, 3, 5, 7, 11 },
}

# Then, you can save your data to a file like so:
writeFile('myData.txt', repr(myData))

# Later on, you can restore your data from the file like so:
myData1 = ast.literal_eval(readFile('myData.txt'))

# Finally, let's confirm that these two dictionaries are equal:
print(myData1 == myData) # True!

True
