In [1]:
from selenium import webdriver
from selenium.webdriver.edge.service import Service as EdgeService
from webdriver_manager.microsoft import EdgeChromiumDriverManager
from selenium.webdriver.edge.options import Options as EdgeOptions

import datetime
import pandas as pd

from src.spider_eastmoney import daily_news_spider
from src.spider_dongmi import daily_dongmi
from utils.data_processing import eastmoney_df_generator
from utils.docx_processing import eastmoney_docx_generator, dongmi_docx_generator

In [2]:
# 设置 EdgeOptions
options = EdgeOptions()
options.add_argument("--headless")  # 无头模式
# 初始化 WebDriver
driver = webdriver.Edge(service=EdgeService(EdgeChromiumDriverManager().install()), options=options)

today = datetime.datetime.now().strftime("%m-%d")
yesterday = (datetime.datetime.now() - datetime.timedelta(days=1)).strftime("%m-%d")
companies = pd.read_csv("data/sichuan.csv")

In [3]:
urls = companies["website"]
names =  companies["name"]
codes = companies["code"]

In [4]:
name_list, code_list, title_list, web_list, info_list, abstract_list = daily_news_spider(driver=driver, urls=urls, date=yesterday, names=names, codes=codes)

http://finance.eastmoney.com/a/202408213161203365.html
http://finance.eastmoney.com/a/202408213161574197.html
http://finance.eastmoney.com/a/202408213161429876.html
http://finance.eastmoney.com/a/202408213161088182.html
http://finance.eastmoney.com/a/202408213161848030.html
http://finance.eastmoney.com/a/202408213161845467.html
http://finance.eastmoney.com/a/202408213161816597.html
http://finance.eastmoney.com/a/202408213161782880.html
http://finance.eastmoney.com/a/202408213161779992.html
http://finance.eastmoney.com/a/202408213161528646.html
http://caifuhao.eastmoney.com/news/20240821154509147817580
http://stock.eastmoney.com/a/202408213161503124.html
http://finance.eastmoney.com/a/202408213161774980.html
http://stock.eastmoney.com/a/202408213161581230.html
http://finance.eastmoney.com/a/202408213161626476.html
http://stock.eastmoney.com/a/202408213161546781.html
http://caifuhao.eastmoney.com/news/20240821202357636234770
http://finance.eastmoney.com/a/202408213161691975.html
http://f

In [5]:
df = eastmoney_df_generator(name_list, code_list, title_list, web_list, info_list, abstract_list)
df.head()

Unnamed: 0,name,code,title,web,item_list,abstract
0,川发龙蟒,2312,华龙证券：磷化工行业头部企业资源优势显著,http://finance.eastmoney.com/a/202408213161203...,"[2024年08月21日 09:16, 作者：\n阙福生, 来源：\n证券时报网, 8人评论]",证券时报网讯，华龙证券研报指出，伴随国内湿法磷酸-磷酸铁行业一体化配套率不断提升，价值链传导...
1,康华生物,300841,康华生物上半年营收和净利润同比增速继续保持两位数增长,http://finance.eastmoney.com/a/202408213161574...,"[2024年08月21日 16:25, 来源：\n证券日报, 8人评论]",近日，康华生物发布2024年半年度报告称，今年上半年，公司实现营业收入7.41亿元，同比增长...
2,康华生物,300841,“一代鞋王”变“中国疫苗出海之父”，36年温商大佬王振滔再下一城,http://finance.eastmoney.com/a/202408213161429...,"[2024年08月21日 12:30, 来源：\n中宏网股票, 6人评论]",康华生物2024年一季度业绩又获增长后，这家公司的实控人兼董事长王振滔没有自满于公司在国产疫...
3,康华生物,300841,西南证券发布康华生物研报，发布员工持股计划，彰显发展信心,http://finance.eastmoney.com/a/202408213161088...,"[2024年08月21日 08:57, 来源：\n每日经济新闻, 6人评论]",西南证券08月21日发布康华生物（300841.SZ）研报称：1）业绩环比增长，趋势改善；2...
4,东材科技,601208,东材科技：2024年上半年净利润1.60亿元 同比下降27.45%,http://finance.eastmoney.com/a/202408213161848...,"[2024年08月21日 22:02, 作者：\n李香才, 来源：\n中国证券报·中证网, ]",东材科技（601208）8月22日披露2024年半年报。2024年上半年，公司实现营业总收入...


In [6]:
eastmoney_docx_generator(today, df)

Finished Creating report/eastmoney/08-22 Report.docx...


In [7]:
n_list, q_list, a_list = daily_dongmi(driver, companies, yesterday)

In [8]:
file_path = "data/dongmi.csv"
new_data = {
    "name": n_list,
    "question": q_list,
    "answer": a_list
}

dm = pd.DataFrame(new_data)
dm.head()

Unnamed: 0,name,question,answer
0,川能动力,请问公司何时进行分红?都已经八月中旬了。,川能动力：您好！公司计划实施2024年中期分红，分红金额预计不低于公司2023年合并财务报表...
1,川能动力,公布中期分红，现在都八月十五日了，还没消息，这是什么情况呢,川能动力：您好！公司计划实施2024年中期分红，分红金额预计不低于公司2023年合并财务报表...
2,川能动力,董秘，你好，请问：川能动力公司有回购股份计划吗？公司市值管理计划怎样？怎样做优做强做大，保值...,川能动力：您好！公司积极贯彻落实国资提质增效相关要求，专注主业发展，不断提升经营效益。公司重...
3,川能动力,高能耗企业都逐步会强制使用绿电，公司作为新能源发电企业能否实际获益,川能动力：您好！全国推广绿电强制消费机制将显著增加对新能源的需求，有望带来绿色电力量价齐升，...
4,川能动力,公司的绿电绿证交易方面，进行到哪一步了,川能动力：您好！公司积极参与绿电交易，已参与四川省绿电交易的风电项目包括沙马乃托一期、小街一...


In [9]:
dongmi_docx_generator(today, dm)

Finished Creating report/dongmi/08-22 董秘问答.docx...
