Keep Simple RPC。免注册远程过程调用
团队里常常需要通过平台下载各数据,但只有一套账号。通常的方案如下:
- 一个账号大家共用。最简单粗暴
- 账号还能登录平台的其它功能,不便于分享
- 账号可能有在线数上限,会导致互踢
- 不同成员可能重复下载相同数据,同一成员也可能反复下载相同数据
- 由IT团队将数据提前下载过来。人力成本最高
- IT团队需要提前规划部署,并向研究团队推广
- 不同数据需要IT团队针对性的提前准备下载,时效性一般
- 有些数据只是临时少量需要,需求变化快
如果搭建一套服务,客户端不需账号,基本不用改动代码,是否解决多成员分享问题?所以这个项目就是为了API转发,只是后来发现本质上是RPC
- 不修改第三方API源代码,实现客户端免登录
- 新接口与原接口一致,基本不用改动代码
- 数据缓存功能,减少下载次数。针对有数据有限额、调用次数有限制等情况
- 跨语言,能将大量Python的数据API转成HTTP服务,由其它语言调用
- 既支持同步调用,又支持异步调用
- 数据缓存转发
- 源代码保护。核心代码不提供,只向外暴露服务
- 远程控制。可调os、sys等库
- 免注册就可以向外自动暴露所有API
- 不得不添加函数白名单与黑名单功能
- 添加了简易版的token认证功能
- 所有API都自动暴露,但并不是所有API都能正常使用。例如:
- 输入与输出无法序列化和反序列化
- 部分API使用方法特殊,也可能无法使用
- 数据量太大,序列化、网络传输都不太现实
- 可先选择不同的通讯方式,目前提供的方式有:HTTP、WebSocket
- 出于数据版权保护,默认添加了IP地址校验开关,限制只在内网使用
- 多人使用时,少数人超量使用,所以又添加了数据量限额功能
- 安装
ksrpc
库
pip install ksrpc[server] -i https://mirrors.aliyun.com/pypi/simple --upgrade
- 直接运行
python -m ksrpc
, 观察提示的config.py
文件路径 - 编辑
config.py
文件,进行ksrpy
的功能管理。如权限配置等ENABLE_SERVER = True
- 再次运行
python -m ksrpc
或对应目录下运行python run_app.py
- 确保服务器上防火墙已经开放对应端口
- 安装
ksrpc
库
pip install ksrpc[client] -i https://mirrors.aliyun.com/pypi/simple --upgrade
- 编辑
examples
目录下的demo_http.py
和demo_websocket.py
中对应的服务地址 - 运行
demo_http.py
和demo_websocket.py
,检查是否运行正常
- 直接可替代的。如
tests
目录下的:os、numpy、pandas、akshare等- 客户端没有安装相应包的情况下,IDE无法自动补全
- 需要服务端进行登录等一类处理的。如
server
目录下的,jqdatasdk、tushare、WindPy等 - 客户端参数无法序列化,需要特殊处理的。如
hack
目录下的jqdatasdk、WindPy等- 需要客户端安装第三方库,IDE的自动补全功能正常
from ksrpc import RpcClient
from ksrpc.connections.http import HttpxConnection
conn = HttpxConnection('http://127.0.0.1:8000/api/file')
conn.timeout = None
math = RpcClient('math', conn, async_local=False)
math.cache_get = True
math.cache_expire = 86400
# 模块中变量获取方法。加了括号
print(math.pi())
print(math.pow(2, 3))
# 创建客户连接
from ksrpc import RpcClient
from ksrpc.connections.http import HttpxConnection
conn = HttpxConnection('http://127.0.0.1:8000/api/file')
conn.timeout = None
client = RpcClient('tushare', conn, async_local=False)
client.cache_get = True
client.cache_expire = 86400
# 对原版库进行定制处理,需要已经安装了原版库
from ksrpc.hack.tushare import hack
hack(client)
# 原版代码可都保持不变
import tushare as ts
ts.set_token('TUSHARE_TOKEN')
pro = ts.pro_api()
df = pro.trade_cal(exchange='', start_date='20210901', end_date='20211231')
print(df)
df = pro.daily(ts_code='000001.SZ,600000.SH', start_date='20180701', end_date='20180718')
print(df)
跨语言示例代码在lang
目录下
跨语言开发文档
此库仅供学习交流,请在数据提供方的授权范围内使用。请勿向第三方转发数据
如果提供服务的机器在内网,无法搭建服务,也无法直接访问怎么办?参考Reverse Shell的概念,本项目提供了Reverse RPC功能
- 公网服务器上安装
pip install ksrpc[server]
,修改配置,运行python run_app.py
,记下公网IP - 内网服务器上安装
pip install ksrpc
(如果网络受限,可下载whl文件本地安装),修改rpc_reverse.py
中为公网IP,运行python rpc_reverse.py
。此代码可粘贴到Notebook中运行 - 观察内网脚本是否能连接公网服务器
- 个人电脑上安装
pip install ksrpc[client]
,编辑examples/demo_reverse.py
中为公网IP,运行,观察结果 - 注意地址不同,内网被控端连接公网IP下的
/client
, 个人电脑连接公网IP下的/admin
,并且要用完全一样的房间号 - 默认情况下,
config.py
中的ENABLE_RELAY = True
已经开启
开发到一定阶段后才发现与rpyc
这个免注册暴露函数的功能类似,大家也可以去学习一下
https://github.com/tomerfiliba-org/rpyc