In [4]:
import base64
from openai import OpenAI

# 初始化 OpenAI 客户端
client = OpenAI()

# 从文件中加载 system 消息（operator 提示）
def load_operator_prompt(filepath):
    try:
        with open(filepath, "r", encoding="utf-8") as file:
            return file.read()
    except Exception as e:
        print(f"加载系统消息失败：{e}")
        return "默认系统提示信息"

operator_prompt = load_operator_prompt("./prompts/operator_prompt.txt")

# 定义图片编码函数，将图片转为 Base64 字符串
def encode_image(image_path):
    try:
        with open(image_path, "rb") as image_file:
            return base64.b64encode(image_file.read()).decode("utf-8")
    except Exception as e:
        print(f"图片读取失败：{e}")
        return None

print("欢迎使用 operator agent！输入 'exit' 可退出。")

# 初始化对话历史，将 system 消息作为第一条消息
conversation_history = [
    {"role": "system", "content": operator_prompt}
]

while True:
    # 获取用户输入的文本
    user_text = input("请输入文本内容：")
    if user_text.lower() == "exit":
        break

    # 构造用户消息内容
    send_image = input("是否需要发送图片？(y/n): ").strip().lower()
    if send_image == "y":
        image_path = input("请输入图片路径：").strip()
        base64_image = encode_image(image_path)
        if not base64_image:
            print("图片处理失败，发送纯文本消息。")
            message_content = [
                {"type": "text", "text": user_text}
            ]
        else:
            message_content = [
                {"type": "text", "text": user_text},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}",
                        "detail": "high",
                    },
                },
            ]
    else:
        message_content = [
            {"type": "text", "text": user_text}
        ]

    # 将用户消息添加到对话历史
    conversation_history.append({"role": "user", "content": message_content})

    try:
        # 调用 API 时传入完整对话历史
        response = client.chat.completions.create(
            model="chatgpt-4o-latest",
            messages=conversation_history,
        )
        # 获取并打印回答内容
        reply_content = response.choices[0].message.content
        print("回复：", reply_content)
        # 将回答添加到对话历史
        conversation_history.append({"role": "assistant", "content": reply_content})
    except Exception as e:
        print(f"调用接口失败：{e}")


欢迎使用 operator agent！输入 'exit' 可退出。


请输入文本内容： 我想知道关于金价的舆论
是否需要发送图片？(y/n):  n


回复： 请提供以下信息，以便更准确地分析舆论：  
1. 具体的事件关键词（例如“金价上涨”或“黄金市场波动”）。  
2. 事件的起止时间范围（例如“2024年5月1日 - 2024年6月1日”）。  
3. 事件的发布平台（目前仅支持微博）。  

请提供这些信息后，我可以为您提取相关舆论数据。


请输入文本内容： 金价上涨，2024年5月1日 - 2024年6月1日
是否需要发送图片？(y/n):  n


回复： 目前我们的服务仅支持微博平台，请确认是否仅分析微博平台的数据？


请输入文本内容： 是
是否需要发送图片？(y/n):  n


回复： ```json
{
    "event_keywords": ["金价上涨"],
    "event_start_end_time": "2024年5月1日 - 2024年6月1日",
    "event_release_platform": "微博"
}
```


请输入文本内容： eixt
是否需要发送图片？(y/n):  n


回复： 如果您有其他问题，欢迎随时咨询！


请输入文本内容： exit


In [None]:
from openai import OpenAI

# 初始化 OpenAI 客户端
client = OpenAI()

# 从文件中加载 system 消息（Sentiment_analysist 提示）
def load_system_prompt(filepath):
    try:
        with open(filepath, "r", encoding="utf-8") as file:
            return file.read()
    except Exception as e:
        print(f"加载系统消息失败：{e}")
        return "默认系统提示信息"

sentiment_prompt = load_system_prompt("./prompts/Sentiment_analysist_prompt.txt")

print("欢迎使用 Sentiment_analysist agent！输入 'exit' 可退出。")

# 初始化对话历史，将 system 消息作为第一条消息
conversation_history = [
    {"role": "system", "content": sentiment_prompt}
]

while True:
    # 获取用户输入的文本
    user_text = input("请输入文本内容：")
    if user_text.lower() == "exit":
        break

    # 将用户文本消息添加到对话历史
    conversation_history.append({"role": "user", "content": user_text})

    try:
        # 调用 API 时传入完整对话历史
        response = client.chat.completions.create(
            model="chatgpt-4o-latest",
            messages=conversation_history,
        )
        # 获取并打印回答内容
        reply_content = response.choices[0].message.content
        print("回复：", reply_content)
        # 将回答添加到对话历史
        conversation_history.append({"role": "assistant", "content": reply_content})
    except Exception as e:
        print(f"调用接口失败：{e}")


欢迎使用 Sentiment_analysist agent！输入 'exit' 可退出。


请输入文本内容： 1: #深圳疫情# 该死的疫情 无语了 ​ 2: 12点深圳按下暂停键​一周，不长不短​深圳，加油#深圳疫情##深圳要求停止一切非必要流动活动# 2深圳 L快乐的小咸鱼2020的微博视频 ​ 3: #深圳疫情#不管再晚，电脑都跟外卖一样按时到达疫情无情，人间有爱——深圳打工人 LAxBoomer的微博视频 ​ 4: #深圳疫情# 抓住了昨天最后一天的快乐，老老实实在家居家 L糯叽叽的啾咪的微博视频 ​ 5: #深圳疫情# 深圳20220314 2深圳 ​ 6: #深圳疫情#电脑带了，文件拷了手jio的美甲都安排了一周多水果买齐了，直奔宿舍居家就算居家也要精致到底！ ​ 7: #深圳疫情# 半夜接到坂田流调电话让我最近每日要做核酸 ​ 8: 进入疫情管控区的第一天，她这样说......O进入疫情管控区的第一天，她这样说......今天第一天进入福田区沙头街道新洲社区参加疫情防控辅助志愿工作，这也是自己有生以来第一次进入新冠疫情管控区做志愿者，疫情肆虐，身为深圳公益救援队的一名队员，我们理当为社会尽一份自己的绵薄之力。上午，新洲社区疫情防控现场总指挥杨书记为大家做动员工作，杨书记是一位有着29年军龄的退伍女兵，虽已年近花甲，依然精神抖擞地奋战在抗疫指挥一线，令人心生敬佩。她说“身为志愿者参与抗疫终将成为你人生中最闪光的一刻”，让人充满信心和力量。经过医护人员对我们进行防疫工作自我保护措施、注意事项和防护服的穿脱流程培训和操作后，各小组分别领取防疫指挥部的任务，奔赴新州社区疫情管控区开展工作。我们10名队员接到的任务是进入管控区协助居民测核酸，我和队友们穿上了隔离衣“大白”，感觉神圣又有点紧张，虽然经常在电视里和核酸点看到医护人员穿着白色的隔离衣，也经过了训练，但当轮到自己穿着这身“大白”去为大家服务时，内心既激动又忐忑，为自己身为一名普通的志愿者可以近距离参与到这场重大而有意义的抗疫活动中来感到激动，又为自己能否合格地做好安全防护心生忐忑。紧迫的工作由不得细想，我们互相检查防护后立刻开始协助医护人员为附近居民们核酸采样。下午三点左右开始工作，等着检测的人群源源不断，不知不觉就天色已晚，面罩因为长时间的呼吸蒙上一层雾气，由于不停歇的扫码，眼睛疲劳不堪，加上光线又很暗，视线变得越来越模糊，一直没有喝水的喉咙也因为不停的讲话有些沙哑，身体长时间保持一个姿势，

回复： ```json
{
    "analyses": [
        {
            "entry": "该死的疫情 无语了",
            "sentiment": "negative"
        },
        {
            "entry": "12点深圳按下暂停键​一周，不长不短​深圳，加油",
            "sentiment": "neutral"
        },
        {
            "entry": "不管再晚，电脑都跟外卖一样按时到达疫情无情，人间有爱——深圳打工人",
            "sentiment": "positive"
        },
        {
            "entry": "抓住了昨天最后一天的快乐，老老实实在家居家",
            "sentiment": "neutral"
        },
        {
            "entry": "深圳20220314",
            "sentiment": "neutral"
        },
        {
            "entry": "电脑带了，文件拷了手jio的美甲都安排了一周多水果买齐了，直奔宿舍居家就算居家也要精致到底！",
            "sentiment": "positive"
        },
        {
            "entry": "半夜接到坂田流调电话让我最近每日要做核酸",
            "sentiment": "negative"
        },
        {
            "entry": "进入疫情管控区的第一天，她这样说……（描述志愿者经历，积极向上）",
            "sentiment": "positive"
        },
        {
            "entry": "🐶同学也没能想到自己有这一天",
            "sentiment": "neutral"
        },
        {
            "en

请输入文本内容： 1: #深圳疫情# 我对深圳很有信心，可是香港一天不好转，深圳的压力就很大，香港人民赶紧疫苗打起来居家隔离起来吧 ​ 2: 这文案#深圳疫情# ​ 3: #深圳疫情# 我是来深圳打工的，不是来深圳做核酸的深圳加油啊～ 2深圳·翰林幼儿园 ​ 4: 深圳最新的疫情管控措施一公布，直接就刷屏，力度太震撼了！这轮疫情超出了所有人的预料，连一线城市这样科学防疫的典范都需要这么大力度来进行管控。停工停运停学，整个社会付出的成本太大了。确实是无奈的选择，虽然所有人都打了疫苗，不少人还打了加强针，但是病毒进化得太快了。为了大局着想，不能将免疫力差的群体推到最危险的前线，导致医疗系统瘫痪。代价再大也得做。#财经##股票##深圳疫情# 收起d 5: 计划泡汤#深圳疫情# ​ 6: #深圳疫情# 厉害了


回复： ```json
{
    "analyses": [
        {
            "entry": "我对深圳很有信心，可是香港一天不好转，深圳的压力就很大，香港人民赶紧疫苗打起来居家隔离起来吧",
            "sentiment": "neutral"
        },
        {
            "entry": "这文案#深圳疫情#",
            "sentiment": "neutral"
        },
        {
            "entry": "我是来深圳打工的，不是来深圳做核酸的深圳加油啊～",
            "sentiment": "neutral"
        },
        {
            "entry": "深圳最新的疫情管控措施一公布，直接就刷屏，力度太震撼了！这轮疫情超出了所有人的预料，连一线城市这样科学防疫的典范都需要这么大力度来进行管控。停工停运停学，整个社会付出的成本太大了。确实是无奈的选择，虽然所有人都打了疫苗，不少人还打了加强针，但是病毒进化得太快了。为了大局着想，不能将免疫力差的群体推到最危险的前线，导致医疗系统瘫痪。代价再大也得做。",
            "sentiment": "neutral"
        },
        {
            "entry": "计划泡汤#深圳疫情#",
            "sentiment": "negative"
        },
        {
            "entry": "厉害了",
            "sentiment": "neutral"
        }
    ],
    "summary": {
        "positive": 0,
        "neutral": 5,
        "negative": 1
    }
}
```


In [18]:
import re
import pandas as pd
import json
from openai import OpenAI
from tqdm import tqdm

class SentimentAnalysistAgent:
    def __init__(self, prompt_filepath: str):
        # 初始化 OpenAI 客户端
        self.client = OpenAI()
        # 加载系统提示信息并初始化对话历史
        sentiment_prompt = self.load_system_prompt(prompt_filepath)
        self.conversation_history = [{"role": "system", "content": sentiment_prompt}]

    @staticmethod
    def load_system_prompt(filepath: str) -> str:
        """从指定文件中加载系统提示信息。"""
        try:
            with open(filepath, "r", encoding="utf-8") as file:
                return file.read()
        except Exception as e:
            print(f"加载系统消息失败：{e}")
            return "默认系统提示信息"

    def run(self, query: str) -> str:
        """
        处理用户输入的 query，更新对话历史，并返回模型回复。
        当 query 为 'exit' 时，直接返回退出消息。
        """
        if query.lower() == "exit":
            return "退出 Sentiment_analysist agent."
        
        self.conversation_history.append({"role": "user", "content": query})

        try:
            response = self.client.chat.completions.create(
                model="chatgpt-4o-latest",
                messages=self.conversation_history,
            )
            reply_content = response.choices[0].message.content
            self.conversation_history.append({"role": "assistant", "content": reply_content})
            return reply_content
        except Exception as e:
            return f"调用接口失败：{e}"

def clean_json_output(response_str: str) -> str:
    """
    清洗 agent 返回的字符串，去除 markdown 代码块标记（例如 ```json 和 ```），确保字符串以 { 开头，以 } 结尾。
    """
    # 使用正则表达式提取代码块内的内容
    pattern = r'```json\s*(\{.*\})\s*```'
    match = re.search(pattern, response_str, re.DOTALL)
    if match:
        return match.group(1).strip()
    # 如果没有匹配到 markdown 格式，则直接返回原字符串
    return response_str.strip()

In [23]:
import base64
from openai import OpenAI

class Coordinator:
    def __init__(self, prompt_filepath: str):
        # 初始化 OpenAI 客户端
        self.client = OpenAI()
        # 加载 operator 提示信息
        self.operator_prompt = self.load_operator_prompt(prompt_filepath)
        # 初始化对话历史，将系统提示信息作为第一条消息
        self.conversation_history = [{"role": "system", "content": self.operator_prompt}]

    @staticmethod
    def load_operator_prompt(filepath: str) -> str:
        """从指定文件中加载 operator 提示信息。"""
        try:
            with open(filepath, "r", encoding="utf-8") as file:
                return file.read()
        except Exception as e:
            print(f"加载系统消息失败：{e}")
            return "默认系统提示信息"

    @staticmethod
    def encode_image(image_path: str) -> str:
        """将图片转为 Base64 编码字符串。"""
        try:
            with open(image_path, "rb") as image_file:
                return base64.b64encode(image_file.read()).decode("utf-8")
        except Exception as e:
            print(f"图片读取失败：{e}")
            return None

    def run(self, user_text: str, send_image: bool = False, image_path: str = None) -> str:
        """
        处理用户输入的文本和可选图片，并返回 LLM 回复内容。
        
        参数:
            user_text: 用户输入的文本消息。
            send_image: 是否需要发送图片（默认为 False）。
            image_path: 如果 send_image 为 True，此处指定图片路径。
        """
        # 构造消息内容
        if send_image and image_path:
            base64_image = self.encode_image(image_path)
            if base64_image:
                message_content = [
                    {"type": "text", "text": user_text},
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": f"data:image/jpeg;base64,{base64_image}",
                            "detail": "high",
                        },
                    },
                ]
            else:
                print("图片处理失败，发送纯文本消息。")
                message_content = [{"type": "text", "text": user_text}]
        else:
            message_content = [{"type": "text", "text": user_text}]
        
        # 将用户消息添加到对话历史中
        self.conversation_history.append({"role": "user", "content": message_content})
        
        try:
            # 调用 LLM 接口，传入完整的对话历史
            response = self.client.chat.completions.create(
                model="chatgpt-4o-latest",
                messages=self.conversation_history,
            )
            reply_content = response.choices[0].message.content
            # 将回复添加到对话历史
            self.conversation_history.append({"role": "assistant", "content": reply_content})
            return reply_content
        except Exception as e:
            return f"调用接口失败：{e}"


In [24]:
# 实例化 Coordinator，传入 operator 提示文件路径
coordinator = Coordinator("./prompts/operator_prompt.txt")

# 调用 .run() 方法传入文本（无需图片）
response = coordinator.run("金价上涨")
response = clean_json_output(response)
print("回复：", response)


回复： 您的查询涉及“金价上涨”事件。请您提供以下缺失的信息，以便进一步处理您的请求：  
1. 事件的开始和结束时间  
2. 事件的发布平台（目前仅支持微博，如果同意查询微博数据，请确认）  

请您补充这些信息后，我们将继续为您分析。


In [25]:
response = coordinator.run("微博，2024-6-12到2024-6-25")
response = clean_json_output(response)
print("回复：", response)


回复： ```json
{
    "event_keywords": ["金价上涨"],
    "event_start_end_time": "2024-6-12 - 2024-6-25",
    "event_release_platform": "微博"
}
```


In [13]:
agent = SentimentAnalysistAgent("./prompts/Sentiment_analysist_prompt.txt")
result = agent.run("""1: #深圳疫情# 该死的疫情 无语了 ​
2: 12点深圳按下暂停键​一周，不长不短​深圳，加油#深圳疫情##深圳要求停止一切非必要流动活动# 2深圳 L快乐的小咸鱼2020的微博视频 ​
3: #深圳疫情#不管再晚，电脑都跟外卖一样按时到达疫情无情，人间有爱——深圳打工人 LAxBoomer的微博视频 ​
4: #深圳疫情# 抓住了昨天最后一天的快乐，老老实实在家居家 L糯叽叽的啾咪的微博视频 ​
5: #深圳疫情# 深圳20220314 2深圳 ​
6: #深圳疫情#电脑带了，文件拷了手jio的美甲都安排了一周多水果买齐了，直奔宿舍居家就算居家也要精致到底！ ​
7: #深圳疫情# 半夜接到坂田流调电话让我最近每日要做核酸 ​
8: 进入疫情管控区的第一天，她这样说......O进入疫情管控区的第一天，她这样说......今天第一天进入福田区沙头街道新洲社区参加疫情防控辅助志愿工作，这也是自己有生以来第一次进入新冠疫情管控区做志愿者，疫情肆虐，身为深圳公益救援队的一名队员，我们理当为社会尽一份自己的绵薄之力。上午，新洲社区疫情防控现场总指挥杨书记为大家做动员工作，杨书记是一位有着29年军龄的退伍女兵，虽已年近花甲，依然精神抖擞地奋战在抗疫指挥一线，令人心生敬佩。她说“身为志愿者参与抗疫终将成为你人生中最闪光的一刻”，让人充满信心和力量。经过医护人员对我们进行防疫工作自我保护措施、注意事项和防护服的穿脱流程培训和操作后，各小组分别领取防疫指挥部的任务，奔赴新州社区疫情管控区开展工作。我们10名队员接到的任务是进入管控区协助居民测核酸，我和队友们穿上了隔离衣“大白”，感觉神圣又有点紧张，虽然经常在电视里和核酸点看到医护人员穿着白色的隔离衣，也经过了训练，但当轮到自己穿着这身“大白”去为大家服务时，内心既激动又忐忑，为自己身为一名普通的志愿者可以近距离参与到这场重大而有意义的抗疫活动中来感到激动，又为自己能否合格地做好安全防护心生忐忑。紧迫的工作由不得细想，我们互相检查防护后立刻开始协助医护人员为附近居民们核酸采样。下午三点左右开始工作，等着检测的人群源源不断，不知不觉就天色已晚，面罩因为长时间的呼吸蒙上一层雾气，由于不停歇的扫码，眼睛疲劳不堪，加上光线又很暗，视线变得越来越模糊，一直没有喝水的喉咙也因为不停的讲话有些沙哑，身体长时间保持一个姿势，六七个小时没有食物和水份的补给，感觉有些疲惫。居民中有孕妇或者老人，我们的队友会悉心地帮助他们排到队伍前面，给居民作出解释，遇到老人不熟悉手机操作，或者不会打开核酸码，我的队友们都非常耐心地帮助他们。不知不觉过去了七个多小时，直到晚上十点多，附近来做核酸检测的居民没有了，我们这才按流程小心翼翼地脱下这身“大白”，感受到如卸重负一般的轻松，也感觉到了饥肠辘辘和一身疲惫，但内心却是充实和喜悦的。七个多小时，我们没吃饭没喝水，也无法上厕所，所有的付出换来的战果是我们四名志愿者协助医生采集核酸样本1485人次！对别人来说也许不算最高记录，但对我们来说，我们创造了自己一生中的最高记录！返回宿舍的路上，我看着被昏黄的路灯灯光拉长了的身影，每个人都很疲惫但很开心，自己能成为抗疫大潮中的一朵小小浪花而自豪，这朵浪花虽微小但却真实，虽柔弱却坚强而又执着。作为一名普通的深圳公益救援队队员，我此刻深深明白，除了拯救被困、受伤的人，疫情防控也是生命救援，更是一场没有硝烟的战争，进入疫区之前是无法了解疫情防控战场的复杂，更无法想象需要多少人的付出。疫情肆虐抵不过众志成城！只要我们每个人都齐心协力支持抗疫决策，无怨无悔的奉献自己的智慧和力量，我相信就没有我们中国人战胜不了的困难！“若有战，召必回，战必胜”依然响彻祖国大地，我们每个人都能尽自己的力用不同的方式参与这场战争，愿我们一起努力，早日迎来疫情消散的一天。#深圳疫情##希望疫情早日结束# 2深圳 收起d
9: #疫情##深圳疫情# 🐶同学也没能想到自己有这一天 ​
10: 凌晨了还有这么多人来公司拿电脑真是一道风景线#深圳疫情# ​""")
print("回复：", result)

回复： ```json
{
    "analyses": [
        {
            "entry": "#深圳疫情# 该死的疫情 无语了 ​",
            "sentiment": "negative"
        },
        {
            "entry": "12点深圳按下暂停键​一周，不长不短​深圳，加油#深圳疫情##深圳要求停止一切非必要流动活动# 2深圳 L快乐的小咸鱼2020的微博视频 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情#不管再晚，电脑都跟外卖一样按时到达疫情无情，人间有爱——深圳打工人 LAxBoomer的微博视频 ​",
            "sentiment": "positive"
        },
        {
            "entry": "#深圳疫情# 抓住了昨天最后一天的快乐，老老实实在家居家 L糯叽叽的啾咪的微博视频 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情# 深圳20220314 2深圳 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情#电脑带了，文件拷了手jio的美甲都安排了一周多水果买齐了，直奔宿舍居家就算居家也要精致到底！ ​",
            "sentiment": "positive"
        },
        {
            "entry": "#深圳疫情# 半夜接到坂田流调电话让我最近每日要做核酸 ​",
            "sentiment": "negative"
        },
        {
            "entry": "进入疫情管控区的第一天，她这样说......O进入疫情管控区的第一天，她这样说......今天第一天进入福田区沙头街道新洲社区参加疫情防控辅助志

In [None]:
import pandas as pd

# 读取 CSV 文件（请根据实际文件路径和编码进行调整）
df = pd.read_csv('20220314.csv', encoding='utf-8')

# 每次处理 100 行数据
chunk_size = 10
num_rows = len(df)

# 按块处理数据
for start in range(0, num_rows, chunk_size):
    # 读取当前块数据
    chunk = df.iloc[start:start + chunk_size].copy()
    
    # 重置索引并生成 1-100 的编号
    chunk.reset_index(drop=True, inplace=True)
    chunk['编号'] = chunk.index + 1
    
    # 提取编号和“微博正文”列，拼接成 query 字符串
    query_lines = chunk.apply(lambda row: f"{row['编号']}: {row['微博正文']}", axis=1)
    query = "\n".join(query_lines)
    
    # 这里你可以将 query 传递给你的 LLM 接口
    print("当前 Query:\n", query)
    # llm_response = your_llm_api(query)  # 示例：调用 LLM API


In [19]:
import pandas as pd
import json
from openai import OpenAI
from tqdm import tqdm

# 读取 CSV 文件（请根据实际文件路径和编码进行调整）
df = pd.read_csv('20220314.csv', encoding='utf-8')

chunk_size = 10
num_rows = len(df)
sentiment_counts = {"positive": 0, "neutral": 0, "negative": 0}

for start in tqdm(range(0, num_rows, chunk_size), desc="Processing chunks"):
    # 每个批次重新实例化 agent
    agent = SentimentAnalysistAgent("./prompts/Sentiment_analysist_prompt.txt")
    
    chunk = df.iloc[start:start + chunk_size].copy()
    chunk.reset_index(drop=True, inplace=True)
    chunk['编号'] = chunk.index + 1
    
    query_lines = chunk.apply(lambda row: f"{row['编号']}: {row['微博正文']}", axis=1)
    query = "\n".join(query_lines)
    
    response_str = agent.run(query)
    # 清洗返回结果，去除 markdown 标记
    cleaned_response = clean_json_output(response_str)
    
    try:
        response_data = json.loads(cleaned_response)
        summary = response_data.get("summary", {})
        sentiment_counts["positive"] += summary.get("positive", 0)
        sentiment_counts["neutral"] += summary.get("neutral", 0)
        sentiment_counts["negative"] += summary.get("negative", 0)
    except json.JSONDecodeError as e:
        print("JSON解析失败:", e)

print("累计情感统计:")
print("Positive:", sentiment_counts["positive"])
print("Neutral:", sentiment_counts["neutral"])
print("Negative:", sentiment_counts["negative"])

Processing chunks: 100%|██████████████████████| 180/180 [24:16<00:00,  8.09s/it]

累计情感统计:
Positive: 509
Neutral: 722
Negative: 565





In [22]:
import re
import csv
import pandas as pd
import json
from openai import OpenAI
from tqdm import tqdm

# 输出结果 CSV 文件路径
output_file = "results.csv"

# 生成 CSV 文件，写入表头（原始数据和 sentiment）
with open(output_file, "w", newline='', encoding="utf-8") as f:
    writer = csv.writer(f)
    writer.writerow(["原始数据", "sentiment"])

# 读取原始数据 CSV 文件（请根据实际文件路径和编码进行调整）
df = pd.read_csv('50sample.csv', encoding='utf-8')
chunk_size = 10
num_rows = len(df)

# 初始化情感统计累积变量
sentiment_counts = {"positive": 0, "neutral": 0, "negative": 0}

# 使用 tqdm 显示进度，每个批次重新实例化 agent 以避免对话历史过长
for start in tqdm(range(0, num_rows, chunk_size), desc="Processing chunks"):
    agent = SentimentAnalysistAgent("./prompts/Sentiment_analysist_prompt.txt")
    
    # 取出当前块数据，并生成编号
    chunk = df.iloc[start:start+chunk_size].copy()
    chunk.reset_index(drop=True, inplace=True)
    chunk['编号'] = chunk.index + 1
    
    # 拼接 query，每行格式为 "编号: 微博正文"
    query_lines = chunk.apply(lambda row: f"{row['编号']}: {row['微博正文']}", axis=1)
    query = "\n".join(query_lines)
    
    # 调用 agent 得到返回的 JSON 格式字符串
    response_str = agent.run(query)
    print(response_str)
    cleaned_response = clean_json_output(response_str)
    
    try:
        response_data = json.loads(cleaned_response)
        analyses = response_data.get("analyses", [])
        summary = response_data.get("summary", {})
        
        # 更新情感统计信息
        sentiment_counts["positive"] += summary.get("positive", 0)
        sentiment_counts["neutral"] += summary.get("neutral", 0)
        sentiment_counts["negative"] += summary.get("negative", 0)
        
        # 假设 analyses 列表顺序与原始数据一致，写入 CSV 文件：
        if len(analyses) == len(chunk):
            with open(output_file, "a", newline='', encoding="utf-8") as f:
                writer = csv.writer(f)
                for i, row in chunk.iterrows():
                    # 原始数据使用 CSV 中的 “微博正文” 列
                    original_text = row['微博正文']
                    sentiment = analyses[i].get("sentiment", "")
                    writer.writerow([original_text, sentiment])
        else:
            print("分析结果数量与原始数据数量不一致")
    except json.JSONDecodeError as e:
        print("JSON解析失败:", e)

# 最终输出累计的情感统计结果
print("累计情感统计:")
print("Positive:", sentiment_counts["positive"])
print("Neutral:", sentiment_counts["neutral"])
print("Negative:", sentiment_counts["negative"])


Processing chunks:  20%|█████▏                    | 1/5 [00:05<00:22,  5.75s/it]

```json
{
    "analyses": [
        {
            "entry": "#深圳疫情# 该死的疫情 无语了 ​",
            "sentiment": "negative"
        },
        {
            "entry": "12点深圳按下暂停键​一周，不长不短​深圳，加油#深圳疫情##深圳要求停止一切非必要流动活动# 2深圳 L快乐的小咸鱼2020的微博视频 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情#不管再晚，电脑都跟外卖一样按时到达疫情无情，人间有爱——深圳打工人 LAxBoomer的微博视频 ​",
            "sentiment": "positive"
        },
        {
            "entry": "#深圳疫情# 抓住了昨天最后一天的快乐，老老实实在家居家 L糯叽叽的啾咪的微博视频 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情# 深圳20220314 2深圳 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情#电脑带了，文件拷了手jio的美甲都安排了一周多水果买齐了，直奔宿舍居家就算居家也要精致到底！ ​",
            "sentiment": "positive"
        },
        {
            "entry": "#深圳疫情# 半夜接到坂田流调电话让我最近每日要做核酸 ​",
            "sentiment": "negative"
        },
        {
            "entry": "进入疫情管控区的第一天，她这样说......O进入疫情管控区的第一天，她这样说......今天第一天进入福田区沙头街道新洲社区参加疫情防控辅助志愿工作，

Processing chunks:  40%|██████████▍               | 2/5 [00:14<00:22,  7.63s/it]

```json
{
    "analyses": [
        {
            "entry": "#深圳疫情# 我对深圳很有信心，可是香港一天不好转，深圳的压力就很大，香港人民赶紧疫苗打起来居家隔离起来吧 ​",
            "sentiment": "positive"
        },
        {
            "entry": "这文案#深圳疫情# ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情# 我是来深圳打工的，不是来深圳做核酸的深圳加油啊～ 2深圳·翰林幼儿园 ​",
            "sentiment": "negative"
        },
        {
            "entry": "深圳最新的疫情管控措施一公布，直接就刷屏，力度太震撼了！这轮疫情超出了所有人的预料，连一线城市这样科学防疫的典范都需要这么大力度来进行管控。停工停运停学，整个社会付出的成本太大了。确实是无奈的选择，虽然所有人都打了疫苗，不少人还打了加强针，但是病毒进化得太快了。为了大局着想，不能将免疫力差的群体推到最危险的前线，导致医疗系统瘫痪。代价再大也得做。#财经##股票##深圳疫情# 收起d",
            "sentiment": "neutral"
        },
        {
            "entry": "计划泡汤#深圳疫情# ​",
            "sentiment": "negative"
        },
        {
            "entry": "#深圳疫情# 厉害了",
            "sentiment": "neutral"
        },
        {
            "entry": "体验了把防疫人员的辛苦跟不容易，防护服看着轻薄，实际穿上又闷又热还难喘气；大多数人都非常能理解并谅解；碰到一些不配合的耍脾气的暴躁人士，真的委屈巴巴有苦说不出但还得继续耐心讲解步骤一天下来总结：致敬所有防疫人员！！你们辛苦了！！希望疫情快快结束吧俺想回家睡

Processing chunks:  60%|███████████████▌          | 3/5 [00:23<00:16,  8.34s/it]

```json
{
    "analyses": [
        {
            "entry": "#深圳疫情# 深圳 加油！ ​",
            "sentiment": "positive"
        },
        {
            "entry": "#北京疫情# #深圳疫情# #青岛疫情# #内蒙古疫情# #上海疫情# #吉林疫情#  //国服疫情遍地开花也中了，关注国际服战争去了//:遍地开花中//:准备好迎接新一轮遍地开花的yq了吗不提城市是因为已经进入遍地开花的阶段了",
            "sentiment": "negative"
        },
        {
            "entry": "#深圳疫情#这两天频繁收到妈咪的叮嘱，让我越来越想家，希望疫情快点结束吧，也保佑我们都好好的🙏千万别出事！病魔远离！ ​",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情# 我能说我跑得快吗？3.5跑回佛山，再晚走两天，估计回不来了 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "（关于宠物和居家办公的长篇自述）",
            "sentiment": "negative"
        },
        {
            "entry": "行动力杠杠的#深圳疫情##深圳封城##深圳要求停止一切非必要流动活动##深圳身边事# 2深圳 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "周末碎片，深圳封闭管理前的小公园。希望疫情早日结束。#深圳疫情# 2深圳 L慕士塔格没有雪的微博视频 ​",
            "sentiment": "neutral"
        },
        {
            "entry": "自己当了志愿者才切身体会到防疫工作人员的不容易，也十分

Processing chunks:  80%|████████████████████▊     | 4/5 [00:29<00:07,  7.19s/it]

```json
{
    "analyses": [
        {
            "entry": "一个超级城市按下暂停键⏸️，很不容易！...相信深圳力量！祈祷疫去不回，天下平安！🙏",
            "sentiment": "positive"
        },
        {
            "entry": "今晚第一次看到楼下面包店货架被买空，附近超市的菜也被买完；and做蛋糕初体验。",
            "sentiment": "neutral"
        },
        {
            "entry": "抗击疫情、同心协力！深圳七天“慢生活”3月14日零点生效，全市公交、地铁停运...",
            "sentiment": "positive"
        },
        {
            "entry": "困在公司的三天两夜经历很多感触很深人间冷暖只有自知...有大白 能让我安心响应号召...",
            "sentiment": "neutral"
        },
        {
            "entry": "今晚还不知道发生了什么朋友圈已经开始传石岩超市被搬空了紧接着公司发通知停工一个星期...",
            "sentiment": "negative"
        },
        {
            "entry": "10➕1管控，工业园区暂停 菜市场比白天还要热闹，全一扫而光，深圳真的是一个拼速度的城市...",
            "sentiment": "neutral"
        },
        {
            "entry": "我发布了：深圳加油 #深圳疫情 #深圳 ##快手# @快手",
            "sentiment": "positive"
        },
        {
            "entry": "我的城市怎么了？",
            "sentiment": "negative"
        },
        {
            "en

Processing chunks: 100%|██████████████████████████| 5/5 [00:35<00:00,  7.06s/it]

```json
{
    "analyses": [
        {
            "entry": "#深圳疫情# 每天新增和超市卖空货架都不怕，怕的是今晚突然接到流调员电话问我做核酸了吗...",
            "sentiment": "neutral"
        },
        {
            "entry": "酸奶紫薯蛋糕 被隔离在家的我只能靠嚯嚯烤箱和面粉来消耗时间了#深圳疫情# #酸奶紫薯蛋糕#...",
            "sentiment": "neutral"
        },
        {
            "entry": "#深圳疫情##深圳超市# 8点钟朋友提示囤物资，去楼下超市人山人海，挤过去提了两兜鸡蛋...",
            "sentiment": "positive"
        },
        {
            "entry": "搬电脑居然是我自己连夜搬 这算工伤了吧！！！#深圳疫情# ​",
            "sentiment": "negative"
        },
        {
            "entry": "深圳加油💪待花开时，我们还是最靓的打工仔小画一下，pray for sz#深圳疫情##深圳#...",
            "sentiment": "positive"
        },
        {
            "entry": "今天深圳率先按下了暂停键，东莞还会远吗？明天进行第二轮大规模核酸检测，深圳一天一检...",
            "sentiment": "neutral"
        },
        {
            "entry": "木棉花开了，我们仨站在路口拍照，引来了过路行人的匆匆一瞥，听说木棉花是英雄花...",
            "sentiment": "positive"
        },
        {
            "entry": "#深圳疫情#疫情快滚滚出地球  深圳加油！！ ​",
            "sentiment": "negative"
  


