# 第9课：字符串处理

## 学习目标
- 掌握字符串的基本操作
- 掌握字符串的常用方法
- 学会字符串格式化
- 了解正则表达式基础

## 1. 字符串基础

In [None]:
# 创建字符串
s1 = 'Hello'
s2 = "World"
s3 = '''多行
字符串'''

print(s1, s2)
print(s3)

# 字符串是不可变的
# s1[0] = 'h'  # 错误！

In [None]:
# 转义字符
print("换行符:\n第二行")
print("制表符:\t缩进")
print("反斜杠: \\")
print("引号: \"Hello\"")

# 原始字符串（不处理转义）
path = r"C:\Users\name\Documents"
print(f"路径: {path}")

## 2. 字符串索引和切片

In [None]:
s = "Hello, World!"

# 索引
print(f"第一个字符: {s[0]}")
print(f"最后一个字符: {s[-1]}")

# 切片
print(f"前5个: {s[:5]}")
print(f"从索引7开始: {s[7:]}")
print(f"逆序: {s[::-1]}")

## 3. 字符串运算

In [None]:
# 拼接
s1 = "Hello"
s2 = "World"
print(f"拼接: {s1 + ' ' + s2}")

# 重复
print(f"重复: {'-' * 20}")

# 成员检查
print(f"'World' in s: {'World' in 'Hello, World!'}")

# 长度
print(f"长度: {len('Hello')}")

## 4. 字符串常用方法

In [None]:
# 大小写转换
s = "Hello World"

print(f"upper: {s.upper()}")
print(f"lower: {s.lower()}")
print(f"capitalize: {s.capitalize()}")
print(f"title: {s.title()}")
print(f"swapcase: {s.swapcase()}")

In [None]:
# 去除空白
s = "  Hello World  "

print(f"原字符串: '{s}'")
print(f"strip: '{s.strip()}'")
print(f"lstrip: '{s.lstrip()}'")
print(f"rstrip: '{s.rstrip()}'")

In [None]:
# 查找和替换
s = "Hello World, Hello Python"

print(f"find('Hello'): {s.find('Hello')}")
print(f"rfind('Hello'): {s.rfind('Hello')}")
print(f"count('Hello'): {s.count('Hello')}")
print(f"replace: {s.replace('Hello', 'Hi')}")
print(f"replace(限次数): {s.replace('Hello', 'Hi', 1)}")

In [None]:
# 分割和连接
s = "apple,banana,orange"

# split 分割
fruits = s.split(",")
print(f"split: {fruits}")

# join 连接
joined = " | ".join(fruits)
print(f"join: {joined}")

# splitlines 按行分割
text = "Line1\nLine2\nLine3"
lines = text.splitlines()
print(f"splitlines: {lines}")

In [None]:
# 判断方法
print(f"'hello'.isalpha(): {'hello'.isalpha()}")
print(f"'123'.isdigit(): {'123'.isdigit()}")
print(f"'hello123'.isalnum(): {'hello123'.isalnum()}")
print(f"'   '.isspace(): {'   '.isspace()}")
print(f"'Hello'.startswith('He'): {'Hello'.startswith('He')}")
print(f"'Hello'.endswith('lo'): {'Hello'.endswith('lo')}")

In [None]:
# 对齐
s = "Python"

print(f"center: '{s.center(20, '-')}'")
print(f"ljust: '{s.ljust(20, '-')}'")
print(f"rjust: '{s.rjust(20, '-')}'")
print(f"zfill: '{'42'.zfill(5)}'")

## 5. 字符串格式化

In [None]:
name = "小明"
age = 18
score = 95.678

# f-string（推荐）
print(f"姓名: {name}, 年龄: {age}")
print(f"分数: {score:.2f}")
print(f"表达式: {age + 2}")

# format 方法
print("姓名: {}, 年龄: {}".format(name, age))
print("姓名: {n}, 年龄: {a}".format(n=name, a=age))

# % 格式化（旧式）
print("姓名: %s, 年龄: %d" % (name, age))

In [None]:
# 格式化数字
num = 1234567.89

print(f"默认: {num}")
print(f"保留2位小数: {num:.2f}")
print(f"千位分隔: {num:,.2f}")
print(f"百分比: {0.75:.1%}")
print(f"科学计数: {num:.2e}")

# 整数格式化
n = 42
print(f"二进制: {n:b}")
print(f"八进制: {n:o}")
print(f"十六进制: {n:x}")

## 6. 正则表达式基础

正则表达式用于字符串模式匹配。

In [None]:
import re

text = "我的邮箱是 test@example.com，电话是 13812345678"

# 查找邮箱
email_pattern = r'\w+@\w+\.\w+'
email = re.search(email_pattern, text)
print(f"邮箱: {email.group() if email else '未找到'}")

# 查找电话
phone_pattern = r'1[3-9]\d{9}'
phone = re.search(phone_pattern, text)
print(f"电话: {phone.group() if phone else '未找到'}")

In [None]:
# 常用正则方法
text = "apple123banana456cherry789"

# findall - 查找所有匹配
numbers = re.findall(r'\d+', text)
print(f"所有数字: {numbers}")

# sub - 替换
result = re.sub(r'\d+', '#', text)
print(f"替换后: {result}")

# split - 分割
parts = re.split(r'\d+', text)
print(f"分割后: {parts}")

In [None]:
# 常用正则模式
# \d - 数字
# \w - 字母数字下划线
# \s - 空白字符
# . - 任意字符
# * - 0次或多次
# + - 1次或多次
# ? - 0次或1次
# {n} - n次
# {n,m} - n到m次
# ^ - 开头
# $ - 结尾

# 验证邮箱格式
def is_valid_email(email):
    pattern = r'^[\w.-]+@[\w.-]+\.\w+$'
    return bool(re.match(pattern, email))

print(is_valid_email("test@example.com"))  # True
print(is_valid_email("invalid-email"))     # False

## 7. 练习题

### 练习 1：回文检测
判断一个字符串是否是回文（正读反读都一样）

In [None]:
def is_palindrome(s):
    # 在这里编写代码
    pass

# 测试
print(is_palindrome("level"))  # True
print(is_palindrome("hello"))  # False

### 练习 2：统计单词
统计一段文本中每个单词出现的次数

In [None]:
text = "Hello world hello Python world Python Python"
# 在这里编写代码


### 练习 3：密码验证
验证密码强度（至少8位，包含大小写字母和数字）

In [None]:
def is_strong_password(password):
    # 在这里编写代码
    pass

# 测试
print(is_strong_password("Abc12345"))  # True
print(is_strong_password("abc123"))    # False

## 8. 本课小结

1. **字符串基础**：不可变序列，支持索引和切片
2. **常用方法**：upper/lower、strip、split/join、find/replace
3. **判断方法**：isalpha、isdigit、startswith、endswith
4. **格式化**：f-string、format()、% 格式化
5. **正则表达式**：re 模块，用于模式匹配

下一课我们将学习文件操作！