In [1]:
import requests
import time
import json
import os
from datetime import datetime

# 设置请求的headers
headers = {
    'User-Agent': '"Microsoft Edge";v="131", "Chromium";v="131", "Not_A Brand";v="24"'
}

# 直播间ID
room_id = 32805602
nickname = "zzz1.4开服测试"

# 抓取弹幕设置
interval = 1
stop_after = 600

# 请求URL
url = f'https://api.live.bilibili.com/xlive/web-room/v1/dM/gethistory?roomid={room_id}&room_type=0'

# 创建存储文件夹
output_dir = "live_raw_response"
os.makedirs(output_dir, exist_ok=True)

# 动态生成文件名，包含开始抓取时间
start_time_str = datetime.now().strftime('%Y%m%d_%H%M%S')
if nickname is None:
    filename = os.path.join(output_dir, f'response_{room_id}_{start_time_str}.txt')
else:
    filename = os.path.join(output_dir, f'response_{nickname}_{start_time_str}.txt')

# 存储已记录弹幕的集合
unique_danmu_ids = set()

def fetch_and_save_danmu():
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()  # 检查请求是否成功
        
        # 将响应内容解析为JSON
        data = response.json()
        
        # 提取弹幕列表
        room_data = data.get('data', {}).get('room', [])
        if not isinstance(room_data, list):
            return 0
        
        new_danmu_count = 0
        with open(filename, 'a', encoding='utf-8') as file:
            for danmu in room_data:
                danmu_id = danmu.get('id_str')
                if danmu_id and danmu_id not in unique_danmu_ids:
                    # 记录新弹幕
                    unique_danmu_ids.add(danmu_id)
                    file.write(json.dumps(danmu, ensure_ascii=False) + '\n')
                    new_danmu_count += 1
        return new_danmu_count

    except requests.RequestException as e:
        print(f"请求出错: {e}")
        return 0

# 定时任务: 每隔数秒获取一次数据，直到达到指定的停止时间
def periodic_task(interval, stop_after):
    start_time_str_short = datetime.now().strftime(f'%H:%M')
    print(f"{start_time_str_short}开始抓取弹幕数据，每隔 {interval} 秒抓取一次，程序将在 {stop_after} 秒后停止...")
    start_time = time.time()
    total_danmu = 0
    while True:
        current_time = time.time()
        elapsed_time = current_time - start_time
        if elapsed_time > stop_after:
            end_time_str = datetime.now().strftime(f'%H:%M')
            print(f"抓取任务在{end_time_str}结束。")
            break
        
        # 获取并保存弹幕，并统计数量
        new_danmu_count = fetch_and_save_danmu()
        total_danmu += new_danmu_count
        remaining_time = max(0, stop_after - elapsed_time)

        # 打印统计信息
        print(f"已运行 {int(elapsed_time)} 秒，新增 {new_danmu_count} 条弹幕，已累计抓取 {total_danmu} 条弹幕。剩余 {int(remaining_time)} 秒。")

        time.sleep(interval)

    # 打印总弹幕统计
    print(f"共抓取了 {total_danmu} 条弹幕。")

if __name__ == "__main__":
    periodic_task(interval, stop_after)


16:38开始抓取弹幕数据，每隔 1 秒抓取一次，程序将在 600 秒后停止...
已运行 0 秒，新增 10 条弹幕，已累计抓取 10 条弹幕。剩余 600 秒。
已运行 1 秒，新增 0 条弹幕，已累计抓取 10 条弹幕。剩余 598 秒。
已运行 2 秒，新增 0 条弹幕，已累计抓取 10 条弹幕。剩余 597 秒。
已运行 3 秒，新增 6 条弹幕，已累计抓取 16 条弹幕。剩余 596 秒。
已运行 4 秒，新增 0 条弹幕，已累计抓取 16 条弹幕。剩余 595 秒。
已运行 5 秒，新增 0 条弹幕，已累计抓取 16 条弹幕。剩余 594 秒。
已运行 6 秒，新增 4 条弹幕，已累计抓取 20 条弹幕。剩余 593 秒。
已运行 7 秒，新增 0 条弹幕，已累计抓取 20 条弹幕。剩余 592 秒。
已运行 8 秒，新增 0 条弹幕，已累计抓取 20 条弹幕。剩余 591 秒。
已运行 9 秒，新增 5 条弹幕，已累计抓取 25 条弹幕。剩余 590 秒。
已运行 10 秒，新增 0 条弹幕，已累计抓取 25 条弹幕。剩余 589 秒。
已运行 11 秒，新增 1 条弹幕，已累计抓取 26 条弹幕。剩余 588 秒。
已运行 12 秒，新增 0 条弹幕，已累计抓取 26 条弹幕。剩余 587 秒。
已运行 13 秒，新增 0 条弹幕，已累计抓取 26 条弹幕。剩余 586 秒。
已运行 14 秒，新增 5 条弹幕，已累计抓取 31 条弹幕。剩余 585 秒。
已运行 16 秒，新增 0 条弹幕，已累计抓取 31 条弹幕。剩余 583 秒。
已运行 17 秒，新增 0 条弹幕，已累计抓取 31 条弹幕。剩余 582 秒。
已运行 18 秒，新增 8 条弹幕，已累计抓取 39 条弹幕。剩余 581 秒。
已运行 19 秒，新增 0 条弹幕，已累计抓取 39 条弹幕。剩余 580 秒。
已运行 20 秒，新增 0 条弹幕，已累计抓取 39 条弹幕。剩余 579 秒。
已运行 21 秒，新增 9 条弹幕，已累计抓取 48 条弹幕。剩余 578 秒。
已运行 22 秒，新增 0 条弹幕，已累计抓取 48 条弹幕。剩余 577 秒。
已运行 23 秒，新增 0 条弹幕，已累计抓取 48 条弹幕。剩余 576 秒。
已运行 24 秒，新增 3 条弹幕，已累计抓取 