In [1]:
from selenium import webdriver
from selenium.webdriver.edge.service import Service as EdgeService
from webdriver_manager.microsoft import EdgeChromiumDriverManager
from selenium.webdriver.edge.options import Options as EdgeOptions

import datetime
import pandas as pd

from src.spider_eastmoney import daily_news_spider
from src.spider_dongmi import daily_dongmi
from utils.data_processing import eastmoney_df_generator
from utils.docx_processing import eastmoney_docx_generator, dongmi_docx_generator

In [2]:
# 设置 EdgeOptions
options = EdgeOptions()
options.add_argument("--headless")  # 无头模式
# 初始化 WebDriver
driver = webdriver.Edge(service=EdgeService(EdgeChromiumDriverManager().install()), options=options)

today = datetime.datetime.now().strftime("%m-%d")
yesterday = (datetime.datetime.now() - datetime.timedelta(days=1)).strftime("%m-%d")
companies = pd.read_csv("data/sichuan.csv")

In [3]:
urls = companies["website"]
names =  companies["name"]
codes = companies["code"]

In [4]:
name_list, code_list, title_list, web_list, info_list, abstract_list = daily_news_spider(driver=driver, urls=urls, date=yesterday, names=names, codes=codes)

http://stock.eastmoney.com/a/202408193159344014.html
http://finance.eastmoney.com/a/202408193159602075.html
http://finance.eastmoney.com/a/202408193159619058.html
http://finance.eastmoney.com/a/202408193159539966.html
http://finance.eastmoney.com/a/202408193159522171.html
http://finance.eastmoney.com/a/202408193159449480.html
http://stock.eastmoney.com/a/202408193159403120.html
http://finance.eastmoney.com/a/202408193159124069.html
http://stock.eastmoney.com/a/202408193159350485.html
http://finance.eastmoney.com/a/202408193159446674.html
http://finance.eastmoney.com/a/202408193159590753.html
http://finance.eastmoney.com/a/202408193159258839.html
http://finance.eastmoney.com/a/202408193159106116.html
http://finance.eastmoney.com/a/202408193159476931.html
http://finance.eastmoney.com/a/202408193159467768.html
http://finance.eastmoney.com/a/202408193158980361.html
http://stock.eastmoney.com/a/202408193158762961.html
http://finance.eastmoney.com/a/202408193159277418.html
http://stock.eastm

In [5]:
df = eastmoney_df_generator(name_list, code_list, title_list, web_list, info_list, abstract_list)
df.head()

Unnamed: 0,name,code,title,web,item_list,abstract
0,天齐锂业,2466,天齐锂业股东户数增加812户，户均持股14.03万元,http://stock.eastmoney.com/a/20240819315934401...,"[2024年08月19日 16:01, 作者：\n财智星, 来源：\n东方财富Choice数...",天齐锂业最新股东户数28.82万户，高于行业平均水平。公司户均持有流通股份5123股；户均流...
1,成都银行,601838,多家国有大行股价创新高，银行板块年内涨幅近20%！银行股狂飙的背后：行业净息差呈现企稳迹象,http://finance.eastmoney.com/a/202408193159602...,"[2024年08月19日 20:45, 来源：\n每日经济新闻, 16人评论]",近期A股银行板块持续上攻，8月19日，工商银行、农业银行、建设银行、交通银行等国有大行盘中股...
2,成都银行,601838,大爆发！银行股“狂飙” 估值修复机会要来了？,http://finance.eastmoney.com/a/202408193159619...,"[2024年08月19日 20:00, 来源：\n北京商报, 2人评论]",A股大金融板块高歌猛进，银行股又涨嗨了！8月19日，银行股“狂飙”，迎来一波普涨行情，早盘盘...
3,成都银行,601838,金针菇第一股突然爆发 背后原因曝光！五大银行巨头再创新高 机构怎么看？,http://finance.eastmoney.com/a/202408193159539...,"[2024年08月19日 19:47, 来源：\n数据宝, 20人评论]",近年来，随着新能源汽车渗透率的不断提升，充电桩作为新能源汽车行业重要的基础设施迎来高速发展。...
4,成都银行,601838,又涨了 多只银行股再创新高！10家已披露上半年业绩,http://finance.eastmoney.com/a/202408193159522...,"[2024年08月19日 19:10, 来源：\n21世纪经济报道, 1人评论]",8月19日，银行股持续走强，股价集体再创新高！工、农、中、建、交五大行股价均再创新高，盘中均...


In [6]:
eastmoney_docx_generator(today, df)

Finished Creating report/easymoney/08-20 Report.docx...


In [7]:
n_list, q_list, a_list = daily_dongmi(driver, companies, yesterday)

In [8]:
file_path = "data/dongmi.csv"
new_data = {
    "name": n_list,
    "question": q_list,
    "answer": a_list
}

dm = pd.DataFrame(new_data)
dm.head()

Unnamed: 0,name,question,answer
0,天齐锂业,如果雅宝有意出售他们持有的格林布什股份，请问公司是否会考虑使用优先购买权吗？,天齐锂业：投资者您好，截至目前公司没有这方面应披露而未披露之信息。未来若有相关信息触及公司信...
1,天齐锂业,请问8月10日股东人数,"天齐锂业：投资者您好，截止到2024年8月09日，公司A股股东户数为288,1822024-..."
2,天齐锂业,董秘你好，在此我想提出一个尖锐的问题！按照公司目前的实际营销状况，请问三季度能扭亏吗？又或者...,天齐锂业：投资者您好，公司采用垂直一体化经营模式，将格林布什开采加工得到的优质锂精矿直接应用...
3,天齐锂业,董秘你好，贵公司既然有日喀则扎布耶 20%的股权，盐湖储量也是仅次于sqm的盐湖，为什么只享...,天齐锂业：投资者您好，公司是以锂为核心的新能源材料企业，致力于“夯实上游、做强中游、渗透下游...
4,川发龙蟒,董秘好，请问贵公司近来发布四川省内某磷化工及新能源材料项目选址论证报告编制比选公告，在现有新...,川发龙蟒：您好！公司紧跟国家新能源产业发展趋势，致力于“硫-磷-钛-铁-锂-钙”多资源循环经...


In [10]:
df = pd.read_csv("data/dongmi.csv")
df

Unnamed: 0,name,question,answer
0,*ST金时,23年8月7日，贵司向北京金融法院申请强制执行奥园科星所持奥园美谷的股份，并获得立案。目前轮...,信达证券：尊敬的投资者，感谢您对信达证券的关注。该强制执行所涉股票质押回购业务是由委托人(出...
1,趣睡科技,贵公司在2024年3月29日的互动易称“公司积极开发车载家居产品，公司新开发的车载遮阳帘、汽...,趣睡科技：尊敬的投资者您好，感谢您对公司的关注。公司与小米汽车合作稳定，公司为其供应遮阳帘等...
2,趣睡科技,请问截止7月19号收盘公司在册股东人数多少?谢谢！,"趣睡科技：尊敬的投资者您好，感谢您对公司的关注。截至2024年7月19日，公司股东总户数5,..."
3,观想科技,您好，请问公司的各类技术是否可以应用于民用，民用领域对应车路云这一块是否有相应技术，谢谢,观想科技：尊敬的投资者您好，观想科技致力于以自主可控新一代信息技术在军工行业的应用为核心业务...
4,创维数字,董秘您好，请问贵司是否考虑在xr领域同华为开展业务合作？,创维数字：您好，长期以来，公司与HW建立了深厚、多元化的合作关系，涵盖了智能化应用、AI智能...
5,浩物股份,请问截止到7月31日收盘公司在册的股东人数是多少？,浩物股份：尊敬的投资者，您好。截至目前，中国证券登记结算有限责任公司深圳分公司尚未下发202...
6,电科网安,请问贵公司2024年研发费用占比是多少？新产品布局落地新成果？发展新质生产力的突破口是什么？...,电科网安：尊敬的投资者，您好。公司在新质生产力部分细分领域已经具备了较好的业务基础。在数字经...
7,XD盛和资,你好，不知公司从事的慢性病药物创新涉及糖尿病吗？谢谢,"方盛制药：尊敬的投资者，您好!公司是一家从事药品的研发、生产与销售的高新技术企业,主要品类有..."
8,北化股份,董秘，你好！截止7月31号，股东人数多少？,北化股份：您好，截止7月31号，公司股东人数为44964户，感谢您的关注。2024-08-0...


In [11]:
dongmi_docx_generator(today, dm)

Finished Creating report/dongmi/08-20 董秘问答.docx...
