Crawler for RARBG
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
src
.gitignore
LICENSE
README.md
composer.json
constants.php
main.php
rarbg_crawler

README.md

Readme

简介

这是一个国外某著名资源站RARBG的爬虫。

该项目之所以存在,是因为该站的前端设计过于丑陋,而且存在大量弹窗广告,影响用户搜索资源。

你可以在你的PC或者服务器上搭建该爬虫,并在HTTP请求中提供关键字和页数等参数获取资源列表。

安装

  1. 安装PHP(版本不低于7.1)和composer。

  2. (可选)安装libevent(或libev,libuv)以及对应的PHP扩展以提高性能。

  3. 执行composer install

  4. 修改constants.php中的配置,包括监听端口,memcached等。

  5. 执行./rarbg_crawler,启动服务。

使用

以下是API列表:

GET /torrent/search?keyword={keyword}&page={page}

  • $keyword为要搜索的关键字
  • $page为页数(从1开始)

GET /torrent/magnet?id={id}

  • $id为种子ID

PUT /var/skt

  • Request body为skt值

其他

  • RARBG唯一有效的用于验证的cookie键为skt。目前暂不支持自动获取。请在浏览器中获取并通过API设置到服务端。cookie的时效约为一周,而且可以自动更新。
  • RARBG存在反爬虫机制,如果请求过于频繁就会导致cookie失效,需要输入验证码获取新的cookie才可继续访问。因此尽量避免将服务开放给不受信任的用户使用。
  • 本项目可以作为amphp/aerys和amphp/artax的示例。踩过的一些坑已经写到了注释中。