本教程以《斗破苍穹》为例，实现从网络上爬取小说内容，合成语音进行朗读，并支持自动朗读下一章节的内容。基于requests、beautifulsoup4、pyttsx3、tkinter进行实现。

![start](start.gif)

## 一、爬取小说内容

从网站（http://doupocangqiong1.com/） 爬取《斗破苍穹》小说并解析出章节标题和内容，并解析出下一章URL。

### 使用requests获取网页内容

In [1]:
import requests
from bs4 import BeautifulSoup

def parse_page(url):
    """
        解析网页
        
        @param 
            url: 网页URL
        @return 
            title: 章节标题
            content: 章节内容
            next_url: 下一章URL
    """
    page = requests.get(url)
    soup = BeautifulSoup(page.content, "html.parser")
    title = soup.find('h1').get_text()
    p_list = soup.select('div#neirong p')
    content = [p.get_text().strip() for p in p_list]
    urls = soup.select("a#BookNext")
    if urls:
        next_url = urls[0]['href']
    else:
        next_url = None
    return title, content, next_url

In [2]:
# 第一章URL
url = "https://www.51shucheng.net/wangluo/doupocangqiong/23716.html"

In [3]:
# 解析网页
title, content, next_url = parse_page(url)

In [4]:
title

'第一章 陨落的天才'

In [5]:
content[:3]

['“斗之力，三段！”',
 '望着测验魔石碑上面闪亮得甚至有些刺眼的五个大字，少年面无表情，唇角有着一抹自嘲，紧握的手掌，因为大力，而导致略微尖锐的指甲深深的刺进了掌心之中，带来一阵阵钻心的疼痛…',
 '“萧炎，斗之力，三段！级别：低级！”测验魔石碑之旁，一位中年男子，看了一眼碑上所显示出来的信息，语气漠然的将之公布了出来…']

In [6]:
# 打印下一章URL
next_url

'https://www.51shucheng.net/wangluo/doupocangqiong/23718.html '

# 二、朗读文章内容

In [7]:
# 初始化
import pyttsx3
engine = pyttsx3.init()

### 实现朗读标题功能

In [8]:
def read_title(title):
    """
        朗读章节标题
    """
    engine.say(title)
    engine.runAndWait()

In [71]:
read_title(title)

### 实现朗读章节内容

In [10]:
def read_text(content):
    """
        朗读章节内容
    """
    for c in content:
        engine.say(c)
        engine.runAndWait()

In [73]:
read_text(content)

注：开源库pyttsx3实现的语音效果一般，如要改进朗读效果可尝试其他TTS，比如百度、腾讯、讯飞等平台的TTS功能

# 三、界面实现

### 设置界面背景

In [None]:
import tkinter as tk
from PIL import ImageTk, Image  
import time

class Player(object):
    def __init__(self, root, filename, **kwargs):
        self.root = root
        self.filename = filename
        self.canvas = tk.Canvas(root, width=200, height=200)
        self.canvas.pack()

        self.btn_text = tk.StringVar()
        self.btn_text.set("暂停")
        self.btn_play = tk.Button(root)
        self.btn_play = tk.Button(root, height=2, width=6,
                                    padx=3, pady=3,
                                    textvariable=self.btn_text, 
                                    command=self.btn_handler)
        self.btn_play.pack()

    def btn_handler(self):
        text = self.btn_text.get()
        if text == "继续":
            self.btn_text.set("暂停")
        else:
            self.btn_text.set("继续")

root = tk.Tk()
root.title("斗破苍穹")
app = Player(root, 'player_bg.png')
root.mainloop()

效果如下：
<img src="player.png" alt="player" width="250"/>

### 实现播放动态效果

In [None]:
def run_animation():
    while True:
        try:
            global photo
            global frame
            global label
            photo = PhotoImage(file = photo_path)
            label.configure(image = nextframe)
        except Exception:
            frame = 1
            break

效果如下：
<img src="player.gif" alt="player" width="250"/>

最后可以用线程的方式在后台朗读小说，完整代码可以通过关注公众号“Python的乐趣”，发送“生成有声书”获取。