# 字符串索引

在Pyhton的应用中可以将单一字符串当作一个序列，这个序列由字符（character）组成，可以想成字符序列。不过字符串与列表不同的是，字符串内的单一元素内容是不可更改的。  

字符串的索引，可用下标直接操作。  

字符串切片操作方式与列表切片相同。  

## Test01

In [1]:
str = 'Python'

# 正值索引
print(f'{str[0] = }, {str[1] = }, {str[2] = }')

# 负值索引
print(f'{str[-1] = }, {str[-2] = }, {str[-3] = }')

# 多重定义的观念
s1, s2, s3, s4, s5, s6 = str  # str有6个字符
print(s1, s2, s3, s4, s5, s6)

str[0] = 'P', str[1] = 'y', str[2] = 't'
str[-1] = 'n', str[-2] = 'o', str[-3] = 'h'
P y t h o n


## Test02

In [2]:
# 字符序列的切片
str = "Python"

print(f'{str[0:3]}')
print(f'{str[3:]}')
print(f'{str[::2]}')
print(f'{str[::-2]}')

Pyt
hon
Pto
nhy


# 函数或方法

|函数|说明|
|--|--|
|len()|计算字符串长度|
|max()|最大值|
|min()|最小值|

## Test03

In [3]:
# 字符序列的最大值, 最小值, 长度
str = 'Python'

len_ = len(str)
print(f'{len_ = }')

max_ = max(str)
min_ = min(str)
# 默认内置编码是Unicode编码，前128个字符同时也支持ASCII编码
print(f'{max_ = }, ord(max_) = {ord(max_)}')  # ord()：Return the Unicode code point for a one-character string
print(f'{min_ = }, ord(min_) = {ord(min_)}')

len_ = 6
max_ = 'y', ord(max_) = 121
min_ = 'P', ord(min_) = 80


# 把字符串转为列表

字符串本身无法用切片方式更改内容，但是将字符串改为列表后，就可以使用切片更改列表内容了。

## Test04

In [4]:
str = 'Python'

# 字符串中的元素无法更改
# str[0]='p'  # TypeError: 'str' object does not support item assignment

# 将字符串转换为列表
str_list = list(str)
print(f'{str_list = }')

# 拼接
str_list.append('AI')  # 2个字符当做一个元素
print(f'{str_list = }')

# 切片赋值
str_list[6:] = 'AI' # 2个元素
print(f'{str_list = }')

str_list = ['P', 'y', 't', 'h', 'o', 'n']
str_list = ['P', 'y', 't', 'h', 'o', 'n', 'AI']
str_list = ['P', 'y', 't', 'h', 'o', 'n', 'A', 'I']


# 使用split()分割字符串

```python
str1.split(）    # 以空格当作分隔符将字符串拆开成列表
str2.split(ch)  # 以ch字符当作分隔符将字符串拆开成列表
```

## Test05

In [5]:
names1 = '张三 李四 王五 赵六'

# 切割字符串
name_list1 = names1.split()    # 如果多于一个空格Python也可以当做一个空格处理，非常智能
print(name_list1)

names2 = '张三#李四#王五#赵六'

# 切割字符串
name_list2 = names2.split("#")
print(name_list2)

['张三', '李四', '王五', '赵六']
['张三', '李四', '王五', '赵六']


# 列表元素的组合join()

在网络爬虫设计的程序应用中，我们可能会常常使用join()方法将所获得的路径与文件名组合。

```python
连接字符串.join(列表)
```

## Test06

In [6]:
str_list = ['P', 'y', 't', 'h', 'o', 'n', 'A', 'I']

# join() 连接 / 结合
str = "".join(str_list)
print(str)

path = ['C:', 'Users', 'xxx', 'Desktop', 'xxx.jpg']
absolute_path = "\\".join(path)  # 反斜杠本身是作为转义字符
print(absolute_path)

PythonAI
C:\Users\xxx\Desktop\xxx.jpg


# 字符串的搜索与索引

```python
str.find()      # 从头找寻子字符串，如果找到，回传第一次出现索引：如果没找到，回传-1。  
str.rfind(）    # 从尾找寻子字符串，如果找到，回传最后出现索引；如果没找到，回传-1。  r：right  
str.index(）    # 从头找寻子字符串，如果找到，回传第一次出现索引：如果没找到，产生例外错误。  
str.rindex(）   # 从尾找寻子字符串，如果找到，回传最后出现索引：如果没找到，产生例外错误。  
str.count(）    #  列出子字符串出现次数。  
str.isalnum(）  # 判断字符串是否只有字母或数字。 
```

## Test07

In [7]:
str = 'abcdefghijklmnabcopqrstabcxyz'

# find() 查找子串的方法
index = str.find('abc')
print(f'{index = }')

rindex = str.rfind('abc')
print(f'{rindex = }')

# 如果子串不存在, 则返回 -1
idx = str.find('666')
print(f'{idx = }')

index = 0
rindex = 23
idx = -1


## Test08

In [8]:
str = 'abcdefghijklmnabcopqrstabcxyz'

# index() 查找子串的方法
index = str.index('abc')
print(f'{index = }')

rindex = str.rindex('abc')
print(f'{rindex = }')

# 如果子串不存在, 则程序报错.
# ValueError: substring not found
idx = str.index('666')
print(f'{idx = }')

index = 0
rindex = 23


ValueError: substring not found

## Test09

In [9]:
str = 'abcdefghijklmnabcopqrstabcxyz#666'

# 子串出现的次数
count = str.count('abc')  # count不是内置函数，而是对象的方法，因此可以作为变量名而不会发生冲突，sum下行
print(f'{count = }')

# 判断原字符串是否仅有字母与数字
result = str.isalnum()
print(f'{result = }')

count = 3
result = False


# 字符串的其他方法

startswith(）：可以列出字符串开始文字是否是特定子字符串。  
endswith(）：可以列出字符串结束文字是否是特定子字符串。  
replace(ch1, ch2)：将ch2字符串由另一字符串取代。  

## Test10

In [10]:
path = 'https://www.baidu.com/s?wd=Python'

# 是否以指定字符开头
protocol = path.startswith('https://')

# 是否以指定字符结尾
page = path.endswith('.html')

print(f'{protocol=}, {page=}')

# 字符内容替换 (字符串本身是常量)
# 如果字符串内容被修改了, 说明一定有新的字符串返回
replace_str = path.replace('Python', '.html')

# 修改后的字符串结果作为新字符串返回
print(f'{path = }')  # 原来的字符串并未修改，字符串本身是常量，无法修改；如果修改了，一定会有新的字符串返回
print(f'{replace_str = }')

protocol=True, page=False
path = 'https://www.baidu.com/s?wd=Python'
replace_str = 'https://www.baidu.com/s?wd=.html'


# in和not in表达式

主要用于判断一个对象是否属于另一个对象，对象可以是字符串（string），列表(list)，元组(tuple)，字典(dict)。

```python
bool_va1ue = obj1 in Obj2        # 对象obj1在对象obj2内会回传True
bool_value = obj1 not in obj2    # 对象obj1不在对象obj2内会回传True
```

## Test11

In [11]:
accounts = ['张三', '李四', '王五', '赵六']

user = input('请输入你的名称: ')

# 判断
if user in accounts:
    print(f'{user}已存在于列表中.')
else:
    print(f'{user}不存在.')
    # 添加
    accounts.append(user)
    print(f'{user}添加成功!')

print(accounts)

请输入你的名称:  张三


张三已存在于列表中.
['张三', '李四', '王五', '赵六']


# is或is not表达式

```python
bool_value = obj1 is obj2         # 对象objl等于对象obj2会回传True
bool_value = obj1 is not obj2     # 对象obj1不等于对象obj2会回传True
```

可以用于比较两个对象是否相同，在此所谓相同并不只是内容相同，而是指对象变量指向相同的内存，对象可以是变量，字符串，列表，元组，字典。  

整型变量在内存地址的观察，整型数值相同，则内存也相同。  

不同地址的列表会被视为不同的列表。  

将is应用在None，None是一个尚未定义的值，这是NoneType数据类型，在布尔值中会被视为False，但其并不是空值。（空类型也是一个对象，并非什么都没有）

## Test12

In [12]:
a = 10
b = 10

r1 = a is b
print(f'id(a) = {id(a)}, id(b) = {id(b)}, {r1 = }')

s1 = 'abc'
s2 = 'abc'

rs = s1 is s2
print(f'id(s1) = {id(s1)}, id(s2) = {id(s2)}, {rs = }')  # 相同的数据（整型与字符串）只占用一块内存空间

list1 = [1, 2, 3, 4, 5]
list2 = [1, 2, 3, 4, 5]

# is 判断的是内存地址
r2 = list1 is list2
print(f'id(list1) = {id(list1)}, id(list2) = {id(list2)}, {r2 = }')

id(a) = 94622610107592, id(b) = 94622610107592, r1 = True
id(s1) = 94622609681856, id(s2) = 94622609681856, rs = True
id(list1) = 140118275609536, id(list2) = 140118275609152, r2 = False


## Test13

In [13]:
a = 10
b = 20

print(f'id(a) = {id(a)}, id(b) = {id(b)}')

c = 30
print(f'id(c) = {id(c)}')

c = 10
print(f'id(c) = {id(c)}')

id(a) = 94622610107592, id(b) = 94622610107912
id(c) = 94622610108232
id(c) = 94622610107592


## Test14

In [14]:
# 列表为空, 在内存中有空间, 但没有元素
# 空列表不是 None, None在Python中也是一个对象, 有其对应的类型, 类型为 Nonetype
x = []

# x 在内存中有地址 (空间)
print(id(x))

# del x
# print(id(x))

if x is None:
    print('x为None')  # None是未定义，不存在
else:
    print('x不为None')

140118280894656
x不为None


# enumerate对象

enumerate()方法可以将iterable（迭代）类数值的元素用索引值与元素配对方式回传，返回的数据称enumerate对象，用这个方式可以为可迭代对象的每个元素增加索引值，这对未来的数据应用是有帮助的，其中iterable类数值可以是列表，元组，集合等。

```python
obj enumerate(iterable[，start = 0]) # 若省略start = 设定，默认索引值是0
```

## Test15

In [15]:
names = ['张三', '李四', '王五', '赵六']
print(f'{names = }')

# 将列表转换为 enumerate 对象, 可以使用 enumerate 对象的开始索引值, 如果不设置, 默认为 0
enumerate_names = enumerate(names, start=10)    # 默认开始索引值是0
print(f'{enumerate_names = }')

# print(enumerate_names) # 无法直接展示内容
# 将 enumerate 对象转换为 list 类型
print(list(enumerate_names))

names = ['张三', '李四', '王五', '赵六']
enumerate_names = <enumerate object at 0x7f6fd40c9d50>
[(10, '张三'), (11, '李四'), (12, '王五'), (13, '赵六')]


# 制作大型列表

例如：列表的元素是列表。

## Test16

In [16]:
class1 = ['张三', '李四', '王五', '赵六']
class2 = ['刘德华', '张学友', '黎明', '郭富城']
class3 = ['西施', '貂蝉', '杨玉环', '王昭君']

school = [class1, class2, class3]
print(school)

[['张三', '李四', '王五', '赵六'], ['刘德华', '张学友', '黎明', '郭富城'], ['西施', '貂蝉', '杨玉环', '王昭君']]


# 用户账号管理系统

一个公司或学校的计算机系统，一定有一个账号管理，要进入系统需要登入账号，如果你是这个单位设计账号管理系统的人，可以将账号存储在列表内，然后未来可以使用in功能判断用户输入账号是否正确。

## Test17

In [19]:
accounts = ['张三', '李四', '王五', '赵六']

choice = input('请选择注册(1)或登录(2): ')

# 判断
if choice == '1':
    user = input('请输入您的注册名称: ')
    accounts.append(user)
    print(accounts)
elif choice == '2':
    user = input('请输入您的登录账号: ')
    # 判断是否存在该账号
    if user in accounts:
        print(f'欢迎进入系统: {user}')
    else:
        print('该账号为登记,请先注册.')
else:
    # 默认处理
    print('操作有误!')

请选择注册(1)或登录(2):  2
请输入您的登录账号:  李四


欢迎进入系统: 李四


# 凯撒密码

公元前约50年凯撒被公认发明了凯撒密码，主要是防止部队传送的信息遭到敌方读取。   
凯撒密码的加密概念是将每个英文字母往后移，对应至不同字母，只要记住所对应的字母，未来就可以解密。  
例如：将每个英文字母往后移3位，将A对应D，B对应E，C对应F...X对应A，Y对应B，Z对应C。  

![](img/kaisa.jpg)

## Test18

In [20]:
# fight
str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
print(str)

front3 = str[:3]
end23 = str[3:]
str2 = end23 + front3
# 加密文
print(str2)

# RSA

ABCDEFGHIJKLMNOPQRSTUVWXYZ
DEFGHIJKLMNOPQRSTUVWXYZABC
