表格截取抓取信息项目📈📉 打开网址: 🚀https://www.futureelectronics.cn/resources/market-conditions-report/batteries?_ga=2.41840161.2004194343.1708663618-1816887471.1708663618 网页下方有个大图,其中有多个表格,就是需要识别表格中的内容 选择不同产品类别可以查看不同产品对应的厂商信息 网页右上角有pdf下载功能可以将所有的相关信息下载 现对该pdf中所有的表格进行提取并获取其中信息 1、从大图识别各个表格的位置然后切割出来 2、对每个表格使用paddleOCR模型识别厂商、商品的字符串,使用cv2中的matchtemplate对价格趋势的符号进行匹配转换 3、提取出表格所有厂商的有关信息并将结果存储到Result.xlsx中