## 字符串

In [None]:
def main():
    str1 = 'hello, world!'
    # 通过len函数计算字符串的长度
    print(len(str1))  # 13
    
    # 获得字符串首字母大写的拷贝
    print(str1.capitalize())  # Hello, world!
    
    # 获得字符串变大写后的拷贝
    print(str1.upper())  # HELLO, WORLD!
    
    # 从字符串中查找子串所在位置
    print(str1.find('or'))  # 8
    print(str1.find('shit'))  # -1
    
    # 与find类似但找不到子串时会引发异常
#     print(str1.index('or'))
#     print(str1.index('shit'))
    
    # 检查字符串是否以指定的字符串开头
    print(str1.startswith('He'))  # False
    print(str1.startswith('hel'))  # True
    
    # 检查字符串是否以指定的字符串结尾
    print(str1.endswith('!'))  # True
    
    # 将字符串以指定的宽度居中并在两侧填充指定的字符
    print(str1.center(50, '*'))
    
    # 将字符串以指定的宽度靠右放置左侧填充指定的字符
    print(str1.rjust(50, ' '))
    str2 = 'abc123456'
    
    # 从字符串中取出指定位置的字符(下标运算)
    print(str2[2])  # c
    
    # 字符串切片(从指定的开始索引到指定的结束索引)
    print(str2[2:5])  # c12
    print(str2[2:])  # c123456
    print(str2[2::2])  # c246
    print(str2[::2])  # ac246
    print(str2[::-1])  # 654321cba
    print(str2[-3:-1])  # 45
    
    # 检查字符串是否由数字构成
    print(str2.isdigit())  # False
    
    # 检查字符串是否以字母构成
    print(str2.isalpha())  # False
    
    # 检查字符串是否以数字和字母构成
    print(str2.isalnum())  # True
    str3 = '  jackfrued@126.com '
    print(str3)
    
    # 获得字符串修剪左右两侧空格的拷贝
    print(str3.strip())


if __name__ == '__main__':
    main()

除了字符串，Python还内置了多种类型的数据结构，如果要在程序中保存和操作数据，绝大多数时候可以利用现有的数据结构来实现，最常用的包括列表、元组、集合和字典。

## 列表


In [None]:
def main():
    list1 = [1, 3, 5, 7, 100]
    print(list1)
    list2 = ['hello'] * 5
    print(list2)
    
    # 计算列表长度(元素个数)    
    print(len(list1))
    
    # 下标(索引)运算
    print(list1[0])
    print(list1[4])

    # print(list1[5])  # IndexError: list index out of range
    print(list1[-1])
    print(list1[-3])
    list1[2] = 300
    print(list1)
    
    # 添加元素
    list1.append(200)
    list1.insert(1, 400)
    list1 += [1000, 2000]
    print(list1)
    print(len(list1))

    # 删除元素
    list1.remove(3)
    if 1234 in list1:
        list1.remove(1234)
    del list1[0]
    print(list1)

    # 清空列表元素
    list1.clear()
    print(list1)


if __name__ == '__main__':
    main()

和字符串一样，列表也可以做切片操作，通过切片操作我们可以实现对列表的复制或者将列表中的一部分取出来创建出新的列表，代码如下所示。

In [None]:
def main():
    fruits = ['grape', 'apple', 'strawberry', 'waxberry']
    fruits += ['pitaya', 'pear', 'mango']
    
    # 循环遍历列表元素
    for fruit in fruits:
        print(fruit.title(), end=' ')
    print()

    # 列表切片
    fruits2 = fruits[1:4]
    print(fruits2)
    
    # fruit3 = fruits  # 没有复制列表只创建了新的引用
    # 可以通过完整切片操作来复制列表
    fruits3 = fruits[:]
    print(fruits3)
    fruits4 = fruits[-3:-1]
    print(fruits4)
    
    # 可以通过反向切片操作来获得倒转后的列表的拷贝
    fruits5 = fruits[::-1]
    print(fruits5)


if __name__ == '__main__':
    main()

我们还可以使用列表的生成式语法来创建列表，代码如下所示。

In [None]:
import sys


def main():
    f = [x for x in range(1, 10)]
    print(f)
    f = [x + y for x in 'ABCDE' for y in '1234567']
    print(f)
    # 用列表的生成表达式语法创建列表容器
    # 用这种语法创建列表之后元素已经准备就绪所以需要耗费较多的内存空间   
    f = [x ** 2 for x in range(1, 1000)]
    print(sys.getsizeof(f))  # 查看对象占用内存的字节数
    print(f)
    
    # 请注意下面的代码创建的不是一个列表而是一个生成器对象
    # 通过生成器可以获取到数据但它不占用额外的空间存储数据
    # 每次需要数据的时候就通过内部的运算得到数据(需要花费额外的时间)
    f = (x ** 2 for x in range(1, 1000))
    print(sys.getsizeof(f))  # 相比生成式生成器不占用存储数据的空间
    print(f)
    for val in f:
        print(val)


if __name__ == '__main__':
    main()

除了上面提到的生成器语法，Python中还有另外一种定义生成器的方式，就是通过yield关键字将一个普通函数改造成生成器函数。  
下面的代码演示了如何实现一个生成斐波拉切数列的生成器。所谓斐波拉切数列可以通过下面递归的方法来进行定义：
$${\displaystyle F_{0}=0}$$

$${\displaystyle F_{1}=1}$$

$${\displaystyle F_{n}=F_{n-1}+F_{n-2}}({n}\geq{2})$$

In [15]:
def fib(n):
    a, b = 0, 1
    for _ in range(n):
        a, b = b, a + b
        yield a


def main():
    for val in fib(20):
        print(val)


if __name__ == '__main__':
    main()

1
1
2
3
5
8
13
21
34
55
89
144
233
377
610
987
1597
2584
4181
6765


## 元组
Python 的元组与列表类似，不同之处在于元组的元素不能修改，在前面的代码中我们已经不止一次使用过元组了。  
顾名思义，我们把多个元素组合到一起就形成了一个元组，所以它和列表一样可以保存多条数据。  
下面的代码演示了如何定义和使用元组。

In [16]:
def main():
    # 定义元组
    t = ('骆昊', 38, True, '四川成都')
    print(t)

    # 获取元组中的元素
    print(t[0])
    print(t[3])

    # 遍历元组中的值
    for member in t:
        print(member)
    
    # 重新给元组赋值
    # t[0] = '王大锤'  # TypeError
    
    # 变量t重新引用了新的元组原来的元组将被垃圾回收
    t = ('王大锤', 20, True, '云南昆明')
    print(t)
    
    # 将元组转换成列表
    person = list(t)
    print(person)
    
    # 列表是可以修改它的元素的
    person[0] = '李小龙'
    person[1] = 25
    print(person)
    
    # 将列表转换成元组
    fruits_list = ['apple', 'banana', 'orange']
    fruits_tuple = tuple(fruits_list)
    print(fruits_tuple)


if __name__ == '__main__':
    main()

('骆昊', 38, True, '四川成都')
骆昊
四川成都
骆昊
38
True
四川成都
('王大锤', 20, True, '云南昆明')
['王大锤', 20, True, '云南昆明']
['李小龙', 25, True, '云南昆明']
('apple', 'banana', 'orange')


这里有一个非常值得探讨的问题，我们已经有了列表这种数据结构，为什么还需要元组这样的类型呢？

1. 元组中的元素是无法修改的，事实上我们在项目中尤其是多线程环境（后面会讲到）中可能更喜欢使用的是那些不变对象（一方面因为对象状态不能修改，所以可以避免由此引起的不必要的程序错误，简单的说就是一个不变的对象要比可变的对象更加容易维护；另一方面因为没有任何一个线程能够修改不变对象的内部状态，一个不变对象自动就是线程安全的，这样就可以省掉处理同步化的开销。一个不变对象可以方便的被共享访问）。所以结论就是：如果不需要对元素进行添加、删除、修改的时候，可以考虑使用元组，当然如果一个方法要返回多个值，使用元组也是不错的选择。
2. 元组在创建时间和占用的空间上面都优于列表。我们可以使用sys模块的getsizeof函数来检查存储同样的元素的元组和列表各自占用了多少内存空间，这个很容易做到。我们也可以在ipython中使用魔法指令%timeit来分析创建同样内容的元组和列表所花费的时间

In [18]:
%timeit[1,2,3,4,5],
%timeit(1,2,3,4,5)

116 ns ± 0.906 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
18.7 ns ± 0.0483 ns per loop (mean ± std. dev. of 7 runs, 100000000 loops each)


## 集合
Python中的集合跟数学上的集合是一致的，不允许有重复元素，而且可以进行交集、并集、差集等运算。

> 说明：Python中允许通过一些特殊的方法来为某种类型或数据结构自定义运算符（后面的章节中会讲到），  
上面的代码中我们对集合进行运算的时候可以调用集合对象的方法，也可以直接使用对应的运算符，例如&运算符跟intersection方法的作用就是一样的，  
但是使用运算符让代码更加直观。

## 字典
字典是另一种可变容器模型，类似于我们生活中使用的字典，它可以存储任意类型对象，  
与列表、集合不同的是，字典的每个元素都是由一个键和一个值组成的“键值对”，键和值通过冒号分开。  
下面的代码演示了如何定义和使用字典。

In [None]:
def main():
    scores = {'骆昊': 95, '白元芳': 78, '狄仁杰': 82}
    
    # 通过键可以获取字典中对应的值
    print(scores['骆昊'])
    print(scores['狄仁杰'])
    
    # 对字典进行遍历(遍历的其实是键再通过键取对应的值)
    for elem in scores:
        print('%s\t--->\t%d' % (elem, scores[elem]))
    
    # 更新字典中的元素
    scores['白元芳'] = 65
    scores['诸葛王朗'] = 71
    scores.update(冷面=67, 方启鹤=85)
    print(scores)
    if '武则天' in scores:
        print(scores['武则天'])
    print(scores.get('武则天'))
    
    # get方法也是通过键获取对应的值但是可以设置默认值
    print(scores.get('武则天', 60))
    
    # 删除字典中的元素
    print(scores.popitem())
    print(scores)
    print(scores.popitem())
    print(scores)
    print(scores.pop('骆昊'))
    print(scores)
    
    # 清空字典
    scores.clear()
    print(scores)


if __name__ == '__main__':
    main()

## 练习
### 练习1：在屏幕上显示跑马灯文字

In [None]:
import os
import time


def main():
    content = '北京欢迎你为你开天辟地…………'
    while True:
        # 清理屏幕上的输出
        os.system('cls')  
        print(content)
        # 休眠200毫秒
        time.sleep(0.2)
        content = content[1:] + content[0]


if __name__ == '__main__':
    main()

### 练习2：设计一个函数产生指定长度的验证码，验证码由大小写字母和数字构成。

In [37]:
import random
def generate_code(code_len=4):
    eng = 'qazwsxedcrfvtgbyhnujmikolp'
    text = '1234567890'+eng.upper()+eng
    code = random.sample(text, code_len)
    return "".join(code)

generate_code(8)

'MSUC24H8'

### 练习3：设计一个函数返回给定文件名的后缀名。

In [40]:
def get_file_extension(file):
    dot = file.find('.')
    return file[dot:]

get_file_extension(r'C:\Users\Desktop\ne.py') # r原始字符串，忽略转义字符 

'.py'

### 练习4：设计一个函数返回传入的列表中最大和第二大的元素的值。

In [87]:
 def max_2element(x):
    max2=[0,0]
        
    for i in range(0,len(x)):       
        if x[i]>max2[0]:
            max2=[x[i],max2[0]]
            i +=1
        elif x[i]>max2[1]:
            max2=[max2[0],x[i]]
            i +=1
        else:
            continue
    return max2
                
        
print(max_2element([4,45,8,-2,9,98]))

[98, 45]


### 练习5：打印杨辉三角


In [92]:
def main():
    num = int(input('Number of rows: '))
    yh = [[]] * num
    for 


if __name__ == '__main__':
    main()

Number of rows: 5
1	
1	1	
1	2	1	
1	3	3	1	
1	4	6	4	1	
