In [38]:
import json
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from collections import Counter
import matplotlib.animation as animation
from IPython.display import HTML
%matplotlib notebook
# 创建一个函数来生成词云
def generate_wordcloud(word_freq, font_path='simhei.ttf'):
    """
    生成词云对象。

    参数:
    - word_freq (dict): 词频字典，例如 {'蒸': 22, '馍馍': 22}
    - font_path (str): 支持中文的字体文件路径

    返回:
    - WordCloud对象
    """
    wordcloud = WordCloud(
        width=800,
        height=400,
        background_color='white',
        font_path=font_path,  # 替换为支持中文的字体路径
        colormap='viridis',
        max_words=200
    ).generate_from_frequencies(word_freq)
    return wordcloud

# 解析 JSON 字符串并生成词频字典
def parse_json_string(json_str):
    """
    解析 JSON 字符串并返回词频字典。

    参数:
    - json_str (str): JSON 格式的字符串，例如 '{"蒸": 22, "馍馍": 22}'

    返回:
    - dict: 词频字典
    """
    try:
        word_freq = json.loads(json_str)
        # 确保所有值都是整数
        word_freq = {str(k): int(v) for k, v in word_freq.items()}
        return word_freq
    except json.JSONDecodeError as e:
        print(f"JSON 解码错误: {e}")
        return {}
    except ValueError as e:
        print(f"值转换错误: {e}")
        return {}

# 更新词云的函数（用于动画）
def update_wordcloud(frame, ax, json_strings, cache, font_path):
    """
    更新词云的动画函数。

    参数:
    - frame (int): 当前帧数
    - ax (matplotlib.axes.Axes): 绘图轴对象
    - json_strings (list): JSON 字符串列表
    - cache (dict): 缓存上一次的词频字典
    - font_path (str): 字体文件路径
    """
    if frame >= len(json_strings):
        return cache
    
    with open('data.json', 'r', encoding='utf-8') as file:
        data = json.load(file)  # data现在是一个字典，例如 {"蒸": 22, "馍馍": 22}
    
    # 将字典转换回 JSON 字符串
    json_str = json.dumps(data, ensure_ascii=False)

# 由于你的动画函数需要一个 JSON 字符串列表，我们创建一个列表

    word_freq = parse_json_string(json_str)

    # 检查数据是否发生变化
    if word_freq != cache['last_word_freq']:
        # 生成新的词云
        wordcloud = generate_wordcloud(word_freq, font_path=font_path)
        ax.clear()
        ax.imshow(wordcloud, interpolation='bilinear')
        ax.axis('off')  # 关闭坐标轴
        ax.set_title("实时词云", fontsize=16)

        # 更新缓存
        cache['last_word_freq'] = word_freq

    return cache

# 初始化动画
def start_animation(json_strings, interval=3000, font_path='simhei.ttf'):
    """
    启动词云动画。

    参数:
    - json_strings (list): JSON 字符串列表
    - interval (int): 刷新间隔（毫秒）
    - font_path (str): 字体文件路径

    返回:
    - HTML: 在 Jupyter Notebook 中显示动画
    """
    fig, ax = plt.subplots(figsize=(10, 5))

    # 初始化缓存：保存上次的词频数据
    cache = {'last_word_freq': {}}

    # 创建 FuncAnimation 对象
    ani = animation.FuncAnimation(
        fig,
        update_wordcloud,
        fargs=(ax, json_strings, cache, font_path),
        frames=len(json_strings),
        interval=interval,
        repeat=True
    )

    # 在 Jupyter Notebook 中显示动画
    return HTML(ani.to_jshtml())

# 示例 JSON 字符串列表
# 打开并读取 JSON 文件
# 假设你的 JSON 文件只有一条记录，内容是一个对象
with open('data.json', 'r', encoding='utf-8') as file:
    data = json.load(file)  # data现在是一个字典，例如 {"蒸": 22, "馍馍": 22}

# 将字典转换回 JSON 字符串
json_str = json.dumps(data, ensure_ascii=False)

# 由于你的动画函数需要一个 JSON 字符串列表，我们创建一个列表
json_strings = [json_str]

print(json_strings)
# 设置字体路径
font_path = 'simhei.ttf'  # 确保该字体文件存在于你的工作目录中，或者提供完整路径

# 启动画面
html_animation = start_animation(json_strings, interval=3000, font_path=font_path)
# 在 Jupyter Notebook 中显示动画
html_animation

['{"满意": 680, "但": 12, "为什么": 4, "比": 20, "国产": 12, "主流": 2, "安卓": 10, "手机": 26, "贵": 6, "两千": 2, "蒆": 2, "已": 2, "入手": 4, "谷歌": 20, "拿": 12, "我": 30, "给": 8, "自己": 22, "长脸": 2, "真": 10, "不要脸": 4, "额": 2, "再": 4, "怎么样": 2, "是": 86, "我们": 6, "中国": 2, "人": 8, "的": 172, "东西": 8, "赢": 6, "学家": 2, "觉得": 2, "已经": 16, "把": 4, "高通": 8, "压着": 2, "打": 10, "了": 200, "幽默": 72, "爵士": 4, "哥": 18, "达到": 2, "做": 6, "才": 8, "点": 8, "时间": 4, "发育": 2, "啊": 54, "挺": 10, "好": 20, "追上": 2, "曾经": 2, "不断进步": 2, "就行": 4, "全自研": 4, "含金量": 2, "就是": 16, "太贵": 2, "不": 52, "知道": 8, "还": 42, "以为": 4, "菜": 2, "拒绝": 2, "垃圾": 12, "华为": 46, "好怕": 2, "碰掉": 2, "三星": 8, "产": 4, "很": 6, "合理": 4, "真不容易": 2, "吃瓜": 2, "吃": 4, "瓜": 2, "非常": 4, "继续": 6, "加油": 18, "諴": 2, "不亏": 2, "神笔": 2, "马良": 6, "完全": 2, "接受": 6, "不了": 2, "哈哈哈": 14, "纳米": 8, "跟": 8, "中": 2, "画质": 2, "哈哈": 8, "高画质": 2, "带不动": 2, "小时": 4, "你": 20, "应该": 2, "对比": 4, "游戏": 16, "祝": 2, "越来越": 4, "性能": 24, "差": 14, "卖": 8, "一倍": 2, "用": 24, "价格": 14, "买": 22, "笑": 2

<IPython.core.display.Javascript object>

  return HTML(ani.to_jshtml())
  return HTML(ani.to_jshtml())
  return HTML(ani.to_jshtml())
  return HTML(ani.to_jshtml())
