## 6.字符串处理

### 字符串的表示
字符串是 Python 中最常用的数据类型。可以通过几种不同的方式表示字符串。如单引号（'...'）或双引号（"..."）。
如果你想要分几行输入字符串，并且希望行尾的换行符自动包含到字符串当中，可以使用三对引号："""...""" 或 '''...''' 。
```python
# 字符串
s1 = '我是字符串'
s2 = "我也是字符串"
s3 = """\
... 我是换行字符串
...      1行
...      2行
... """
```

### 字符串内建方法

每一个字符串对象都有几个可用的内建方法，我们已经使用过一些了，比如 s.split()。

```python
# 方法 title() 返回字符串的标题版本，即单词首字母大写其余字母小写。
s = "shi yan lou"
s.title() # 'Shi Yan Lou'

# 方法 upper() 返回字符串全部大写的版本，反之 lower() 返回字符串的全部小写版本。
z = s.upper() # 'SHI YAN LOU'
z.lower() # 'shi yan lou'

# 方法 swapcase() 返回字符串大小写交换后的版本 :）
s = "I am A pRoGraMMer"
s.swapcase() # 'i AM a PrOgRAmmER'

# 方法 isalnum() 检查所有字符是否为字母数字，下面的代码中第一行的字符串 s 中包含空格字符，所以返回 False。
s = "jdwb 2323bjb"
s.isalnum() # False
s = "jdwb2323bjb"
s.isalnum() # True

# 方法 isalpha() 检查字符串之中是否只有字母。
s = "SankarshanSir"
s.isalpha() # True
s = "Sankarshan Sir"
s.isalpha() # False

# 方法 isdigit() 检查字符串之中是否只有数字
s = "1234"
s.isdigit() # True

```

我们可以使用 split() 分割任意字符串，split() 允许有一个参数，用来指定字符串以什么字符分隔（默认为 " "），它返回一个包含所有分割后的字符串的列表。
```python
s = "We all love Python"
s.split() # ['We', 'all', 'love', 'Python']
x = "shiyanlou:is:waiting"
x.split(':') # ['shiyanlou', 'is', 'waiting']
```

相反的，方法 join() 使用指定字符连接多个字符串，它需要一个包含字符串元素的列表作为输入然后连接列表内的字符串元素。
```python
"-".join("GNU/Linux is great".split())  # 'GNU/Linux-is-great'
```

### 字符串的剥离
字符串有几个进行剥离操作的方法。最简单的一个是 **strip(chars)** ，用来剥离字符串首尾中指定的字符，它允许有一个字符串参数，这个参数为剥离哪些字符提供依据。不指定参数则默认剥离掉首尾的空格和换行符，代码如下：
```python
s = "  a bc\n "
s.strip() # 'a bc'
```
你可以使用 lstrip(chars) 或 rstrip(chars) 只对字符串左或右剥离，剥离停止位置为第一个非参数字符内的字符。
```python
s = "www.foss.in" 
s.lstrip("cwsd.") #删除在字符串左边出现的'c','w','s','d','.'字符
# 'foss.in'
s.rstrip("cnwdi.") #删除在字符串右边出现的'c','n','w','d','i','.'字符
# 'www.foss'
```

### 字符搜索
字符串有一些方法能够帮助你搜索字符串里的文本或子字符串。
```python
# find() 能帮助你找到第一个匹配的子字符串，没有找到则返回 -1。
s = "faulty for a reason"
s.find("for") # 7
s.find("fora") # -1

# 检查字符串是否以 fa 开头 
s.startswith("fa") # True

# 检查字符串是否以 reason 结尾
s.endswith("reason") # True
```

### 回文检索 
回文是一种无论从左还是从右读都一样的字符序列。比如 “madam”。在这个例子中，我们检查用户输入的字符串是否是回文，并输出结果。
```python
s = input("请输入一个字符串: ")
z = s[::-1]
if s == z:
    print("这个字符串是回文")
else:
    print("这个字符串不是回文")
```

## 7.函数

我们经常需要在同一个程序里多次复用代码。函数可以很好的帮助我们完成这一点。我们在函数里写我们要重复做的事，然后我们在任何需要的时候调用它。我们已经看到一些内建的函数，比如 len()，divmod()。

### 函数的定义
在python中，我们使用关键字 def 来定义一个函数，形式如下。
```python
def fun(params):
    statement
    return result
```
现在让我们编写一个函数，它将接受两个整数作为输入，然后返回总和。
```python
def sum(a, b):
    return a + b
```
第二行有个 return 关键字，我们把 a + b 的值返回给调用者。我们可以像下面这样调用这个函数。
```python
res = sum(234234, 34453546464)
print(res)
```

### 作用域和全局变量
我们通过下边的代码来介绍作用域河全局变量。

In [2]:
def change():
    a = 90
    print(a)
a = 9
print("Before the function call ", a)
print("inside change function", end=' ')
change()
print("After the function call ", a)

Before the function call  9
inside change function 90
After the function call  9


首先我们对 a 赋值 9，然后调用change()函数，这个函数里我们对 a 赋值 90，然后打印 a 的值。调用函数后我们再次打印 a 的值。当我们在函数里写 a = 90 时，它实际上创建了一个新的名为 a 的变量，这个变量只在函数里可用，也就是它**作用域只在函数内部** ，会在函数完成时销毁。
所以即使这两个变量的名字都相同，但事实上他们并不是同一个变量。
将上边的代码修改一下：

In [3]:
def change():
    global a
    a = 90
    print(a)
a = 9
print("Before the function call ", a)
print("inside change function", end=' ')
change()
print("After the function call ", a)

Before the function call  9
inside change function 90
After the function call  90


这里通过关键字 global 来告诉 a 的定义是全局的，因此在函数内部更改了 a 的值，函数外 a 的值也实际上更改了。

### 默认参数

函数的参数变量可以有默认值，也就是说如果我们对指定的参数变量没有给出任何值则会赋其默认值。
```python
def test(a , b=-99):
    if a > b:
        return True
    else:
        return False
```
在上面的例子里，我们在函数的参数列表写出 b = -99。这表示如果调用者未给出 b 的值，那么 b 的值默认为 -99。这是一个关于默认参数的非常简单的例子。
下面两种调用都是正确的：
```python
test(12, 23) #False
test(12) #True
```

> 有两个非常重要的地方:
> 第一个是具有默认值的参数后面不能再有普通参数，比如 f(a,b=90,c) 就是错误的。
> 第二个是默认值只被赋值一次，因此如果默认值是任何可变对象时会有所不同，比如列表、字典或大多数类的实例。

例如，下面的函数在后续调用过程中会累积（前面）传给它的参数:

In [4]:
def f(a, data=[]):
    data.append(a)
    return data
print(f(1))
print(f(2))
print(f(3))

[1]
[1, 2]
[1, 2, 3]


要避免这个问题，你可以像下面这样：

In [5]:
def f(a, data=None):
    if data is None:
        data = []
    data.append(a)
    return data
print(f(1))
print(f(2))

[1]
[2]


### 关键字参数
函数调用时可以通过关键字参数的形式来调用，形如 **keyword = value** 如下：
```python
def func(a, b=5, c=10):
    print('a is', a, 'and b is', b, 'and c is', c)

func(12, 24)
# a is 12 and b is 24 and c is 10
func(12, c = 24)
# a is 12 and b is 5 and c is 24
func(b=12, c = 24, a = -1)
# a is -1 and b is 12 and c is 24
```
在上面的例子中你能看见调用函数时使用了变量名，比如 func(12,c = 24)，这样我们将 24 赋给 c 且 b 具有默认值。

### 强制关键字参数
我们也能将函数的参数标记为只允许使用关键字参数。用户调用函数时将只能对每一个参数使用相应的关键字参数。
```python
def hello(*, name='User'):
    print("Hello", name)

hello('shiyanlou')
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# TypeError: hello() takes 0 positional arguments but 1 was given

hello(name='shiyanlou')
# Hello shiyanlou
```
了解更多，请阅读PEP-3102。

### 文档字符串
在 Python 里我们使用文档字符串（docstrings）来说明如何使用代码，这在交互模式非常有用，也能用于自动创建文档。下面我们来看看使用文档字符串的例子。

In [6]:
import math

def longest_side(a, b):
    """
    Function to find the length of the longest side of a right triangle.

    :arg a: Side a of the triangle
    :arg b: Side b of the triangle

    :return: Length of the longest side c as float
    """
    return math.sqrt(a*a + b*b)

if __name__ == '__main__':
    print(longest_side.__doc__)
    print(longest_side(4,5))


    Function to find the length of the longest side of a right triangle.

    :arg a: Side a of the triangle
    :arg b: Side b of the triangle

    :return: Length of the longest side c as float
    
6.4031242374328485


### 高阶函数

高阶函数（Higher-order function）或仿函数（functor）是内部至少含有一个以下步骤的函数：

* 使用一个或多个函数作为参数
* 返回另一个函数作为输出

Python 里的任何函数都可以作为高阶函数。

```python
def high(func, value):
    return func(value)

lst = high(dir, int)
print(lst[-3:])
# ['imag', 'numerator', 'real']
```

#### map 函数

map 是一个在 Python 里非常有用的高阶函数。它接受一个函数和一个序列（迭代器）作为输入，然后对序列（迭代器）的每一个值应用这个函数，返回一个序列（迭代器），其包含应用函数后的结果。
在 Python 中还有其它的高阶函数，如 sorted()、filter() 以及 functools 模块中的函数，大家可以了解一下。

In [10]:
lst = [1, 2, 3, 4, 5]
def square(num):
    "返回所给数字的平方."
    return num * num

print(list(map(square, lst)))

[1, 4, 9, 16, 25]
