Skip to content

lparam/DFCF

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commits
 
 
 
 

Repository files navigation

Java使用selenium抓取同花顺股票数据(附源码)

最近有小伙伴问我能不能抓取同花顺的数据,最近股票行情还不错,想把数据抓下来自己分析分析。我大A股,大家都知道的,一个概念火了,相应的股票就都大涨。

如果能及时获取股票涨跌信息,那就能在刚开始火起来的时候杀进去,小赚一笔。但是股票那么多,小伙伴也盯不过来,于是就微信问我,能不能抓取同花顺的板块下的股票信息存到数据库里?他就能根据数据库里的数据,制定一些策略。

image.png

俗话说:哪里有痛点,哪里就有编程!不就是个同花顺嘛,办他!

调研背景

于是我点开了同花顺的板块页面:http://q.10jqka.com.cn/gn/ 发现有好268个概念:

板块网页

分析概念板块的网页HTML发现,268个概念的URL就在HTML中:

板块-网页源码(全部268个概念)

打开其中的“阿里巴巴概念”,发现网页又有分页:

分页信息

分页的数据,是根据接口实时获取的,接口中注入了一些Cooki信息和其他标识,同花顺的反爬虫策略一直比较强,使用模拟接口的方式可能难度会比较大,所以使用selenium模拟浏览器操作这种方式比较完美。

设计方案

技术方向有了,再简单整理一下思路:

配置环境

先介绍下工程所需要的环境,你需要安装Maven,如果没装,点击:

我们使用的方案是模拟浏览器的操作,所以我们需要在电脑安装chrome浏览器和chromedriver驱动。chrome的安装这里就不说了,百度下载个浏览器就行。

关键是安装 ChromeDriver ,需要安装和当前chrome版本一致的驱动才写。

查看chrome版本:chrome浏览器输入:Chrome://version

我的chrome的版本

在根据版本下载对于的驱动,版本最好要一致,比如我的是:79.0.3945.117 (正式版本) (64 位),我下载的就是 79.0.3945.36。

ChromeDriver各版本的下载地址:

淘宝镜像:https://npm.taobao.org/mirrors/chromedriver 谷歌下载(需要翻墙,不推荐):https://sites.google.com/a/chromium.org/chromedriver/downloads

下面这一步可做可不做,不做也能启动工程,只是需要修改代码中的一个配置即可。

配置方式:

将下载好的ChromeDriver文件放到/usr/local/bin/目录下:

cp chromedriver /usr/local/bin/

检测是否安装成功

chromedriver --version

如果不配置,只需要记得ChromeDriver的路径,比如我的是:/Users/admin/Documents/selenium/chrome/79.0.3945.36/chromedriver

验证方案

img

抓取数据入库,验证成功!

注意:

记得修改代码里数据库地址和ChromeDriver的路径。

记得修改代码里数据库地址和ChromeDriver的路径。

记得修改代码里数据库地址和ChromeDriver的路径。

遇到问题也可以关注公众号:java之旅或扫描下方二维码,回复【加群】,加我个人微信询问我

关注公众号:java之旅

About

Java使用selenium抓取同花顺股票数据

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Java 100.0%