In [1]:
from selenium import webdriver
from selenium.webdriver.edge.service import Service as EdgeService
from webdriver_manager.microsoft import EdgeChromiumDriverManager
from selenium.webdriver.edge.options import Options as EdgeOptions

import datetime
import pandas as pd

from src.spider_eastmoney import daily_news_spider
from src.spider_dongmi import daily_dongmi
from utils.data_processing import eastmoney_df_generator
from utils.docx_processing import eastmoney_docx_generator, dongmi_docx_generator

In [2]:
# 设置 EdgeOptions
options = EdgeOptions()
options.add_argument("--headless")  # 无头模式
# 初始化 WebDriver
driver = webdriver.Edge(service=EdgeService(EdgeChromiumDriverManager().install()), options=options)

today = datetime.datetime.now().strftime("%m-%d")
yesterday = (datetime.datetime.now() - datetime.timedelta(days=1)).strftime("%m-%d")
companies = pd.read_csv("data/sichuan.csv")

In [3]:
urls = companies["website"]
names =  companies["name"]
codes = companies["code"]

In [4]:
name_list, code_list, title_list, web_list, info_list, abstract_list = daily_news_spider(driver=driver, urls=urls, date=yesterday, names=names, codes=codes)

http://finance.eastmoney.com/a/202408203159687778.html
http://finance.eastmoney.com/a/202408203160346731.html
http://finance.eastmoney.com/a/202408203160473210.html
http://finance.eastmoney.com/a/202408203160473210.html
http://finance.eastmoney.com/a/202408203160502940.html
http://finance.eastmoney.com/a/202408203159687695.html
http://finance.eastmoney.com/a/202408203160679660.html
http://stock.eastmoney.com/a/202408203160504928.html
http://finance.eastmoney.com/a/202408203159687695.html
http://finance.eastmoney.com/a/202408203159687778.html
http://finance.eastmoney.com/a/202408203160031514.html
http://finance.eastmoney.com/a/202408203160569536.html
http://finance.eastmoney.com/a/202408203160468261.html
http://finance.eastmoney.com/a/202408203160346236.html
http://finance.eastmoney.com/a/202408203160680475.html
http://finance.eastmoney.com/a/202408203160560718.html
http://finance.eastmoney.com/a/202408203160552767.html
http://finance.eastmoney.com/a/202408203160257318.html
http://finan

In [5]:
df = eastmoney_df_generator(name_list, code_list, title_list, web_list, info_list, abstract_list)
df.head()

Unnamed: 0,name,code,title,web,item_list,abstract
0,康华生物,300841,69家医药生物公司披露半年报 创新药和“出海”是亮点 4家川企全部盈利 科伦药业净利增逾两成,http://finance.eastmoney.com/a/202408203159687...,"[2024年08月20日 00:02, 来源：\n金融投资报, 3人评论]",时间已进入8月下旬，A股2024年半年报也进入密集披露期。数据显示，截至8月19日，A股已有...
1,新 希 望,876,近九成上市生猪企业7月收入增长 行业持续“回血”,http://finance.eastmoney.com/a/202408203160346...,"[2024年08月20日 12:46, 作者：\n王思炀, 来源：\n新京报, 25人评论]",7月生猪销售数据揭晓，猪价回暖带动行业“回血”成为事实。据新京报记者统计，17家A股上市生猪...
2,泸州老窖,568,18只白酒股下跌 贵州茅台1422.72元/股收盘,http://finance.eastmoney.com/a/202408203160473...,"[2024年08月20日 15:45, 作者：\n冯若男, 来源：\n北京商报, 2人评论]",北京商报讯（记者刘一博冯若男）8月20日尾盘，沪指2866.66点下跌0.93%。白酒股以1...
3,五 粮 液,858,18只白酒股下跌 贵州茅台1422.72元/股收盘,http://finance.eastmoney.com/a/202408203160473...,"[2024年08月20日 15:45, 作者：\n冯若男, 来源：\n北京商报, 2人评论]",北京商报讯（记者刘一博冯若男）8月20日尾盘，沪指2866.66点下跌0.93%。白酒股以1...
4,中建环能,300425,中建环能：可以利用物联网技术、可视化技术搭建接驳线上管理平台系统，针对城市雨水截蓄治理场景进行管理,http://finance.eastmoney.com/a/202408203160502...,"[2024年08月20日 16:19, 来源：\n每日经济新闻, 3人评论]",每经AI快讯，有投资者在投资者互动平台提问：董秘好，贵司可以提供工程咨询，设计，施工，运营维...


In [6]:
eastmoney_docx_generator(today, df)

Finished Creating report/eastmoney/08-21 Report.docx...


In [7]:
n_list, q_list, a_list = daily_dongmi(driver, companies, yesterday)

In [8]:
file_path = "data/dongmi.csv"
new_data = {
    "name": n_list,
    "question": q_list,
    "answer": a_list
}

dm = pd.DataFrame(new_data)
dm.head()

Unnamed: 0,name,question,answer
0,新 希 望,公司的闲置猪场太多了。拖累盈利，今年能解决一部分吗？,新希望：您好，公司正在积极推进闲置猪场的盘活工作，有相应进展时，公司会按照相关规则要求及时履...
1,海创药业...,HC-1119离上市还有哪些流程呢,海创药业-U：尊敬的投资者，您好。氘恩扎鲁胺（项目号：HC-1119）是基于公司核心氘代研发...
2,中建环能,贵公司内在价值是什么？贵公司未来发展方向是什么？,您好，感谢您对公司的关注。 中建环能自创立以来始终以提供优质的水环境服务，改善水环境质量为己...
3,中建环能,董秘好，贵司可以提供工程咨询，设计，施工，运营维护到环境服务。通常此类项目会采用人工智能，物...,中建环能：您好，感谢您对公司的关注。中建环能是以先进技术和产品为核心驱动的环保装备公司，时空...
4,川网传媒,最近智能眼镜兴起，公司有没有VR产品的技术和应用，或者对于公司有什么新机遇，谢谢。,川网传媒：投资者，您好！公司若有重大产业布局，将根据相关规定及时履行信息披露义务，请留意公司...


In [10]:
dongmi_docx_generator(today, dm)

Finished Creating report/dongmi/08-21 董秘问答.docx...
