Skip to content

自动的抓取中国土地市场网 http://www.landchina.com/ 的数据,只用设置需要数据的起止时间即可!

Notifications You must be signed in to change notification settings

SCU-B418/Web_Crawler_for_www_landchina_com

Repository files navigation

Web_Crawler_for_www_landchina_com

自动的抓取中国土地市场网 http://www.landchina.com/ 的数据,只用设置需要数据的起止时间即可!

主要技术

  1. Selenium (浏览器自动化测试框架) 抓取网站数据
  2. 多进程

使用方法:

  1. 安装python3
  2. 安装软件依赖, 输入pip install -r requirements.txt,把包 装在自己项目的运行环境中。
  3. 将谷歌浏览器驱动 文件夹中的,chromedriver.exe文件复制 粘贴到C:\Program Files (x86)\Google\Chrome\Application文件夹中ps.此驱动对应最新版本的google浏览器,请自行升级.
  4. 根据爬虫任务安排文件 第一步,修改createExcel.py中的参数,运行生成表格;第二步,运行 multiprocessing-sprider.py 爬取数据;(直接运行不用改参数) 默认的参数是 starYear=2013,endYear=2015,startMonth=4,startDay=1

效果

抓取目标

抓取结果

About

自动的抓取中国土地市场网 http://www.landchina.com/ 的数据,只用设置需要数据的起止时间即可!

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages