# 在字符串的开头或结尾处做文本匹配
- 问题：我们需要在字符串的开头或结尾处按照指定的文本模式做检查，例如检查文件的扩展名、URL协议类型等
- 解决：<span class="mark">1.str.endswith()和str.startswith()（最简单优雅）</span> 2.切片 3.正则表达式

## str.endswith() str.startswith()

In [1]:
filename = 'spam.txt'
filename.endswith('.txt')

True

In [2]:
url = 'http://www.python.org'
url.startswith('http')

True

如果需要同时针对多个选项做检查，只需要给startswith()、endswith()提供包含可能选项的元组

In [3]:
filenames = ['a.cpp', 'b.py', 'c.jar', 'd.h']

In [4]:
[name for name in filenames if name.endswith(('.cpp', '.h', '.py'))]

['a.cpp', 'b.py', 'd.h']

In [5]:
from urllib.request import urlopen
def read_data(name):
    if name.startswith(('http:', 'https:', 'ftp:')):
        return urlopen(name).read()
    else:
        with open(name) as f:
            return f.read()

<span class="mark">这里必须使用元组输入</span>，如果选项在列表或者集合中，必须首先使用tuple()将它们转换成元组()

In [6]:
choices = ['http:', 'ftp:']
url = "http://www.python.org"

In [7]:
url.startswith(choices)

TypeError: startswith first arg must be str or a tuple of str, not list

In [8]:
url.startswith(tuple(choices))

True

## 使用切片

In [9]:
filename = 'a.txt'

In [10]:
filename[-4:] == '.txt'

True

In [11]:
url = 'http://www.python.org'
url[:4] == 'http' or url[:5] == 'https' or url[:3] == 'ftp'

True

## 正则表达式

对于通常的匹配来说过于重量级

In [12]:
import re
url = "http://www.python.org"

In [13]:
re.match(r'http:|https:|ftp:', url)

<_sre.SRE_Match object; span=(0, 5), match='http:'>

<span class="mark">当startswith(),endswith()和其他操作结合起来时效果也很好</span>

检查目录中有无出现特定的文件

In [None]:
if any(name.endswith(('.c', '.h')) for name in listdir(dirname)):