Skip to content

🔥🔥DatalinkX异构数据源之间的数据同步系统,支持海量数据的增量或全量同步,同时支持HTTP、Oracle、MySQL、ES等数据源之间的数据流转,支持中间transform算子如SQL算子、大模型算子,底层依赖Flink、Seatunnel引擎,提供流转任务管理、任务级联配置、任务日志采集等功能🔥🔥

License

Notifications You must be signed in to change notification settings

spitfireuptown/datalinkx

Repository files navigation

输入图片说明

DatalinkX Stars

Stargazers over time

star Gitee Starts Gitee Starts 作者 jdk版本 SpringBoot版本 MySQL版本 Redis版本 Redis版本 ORM框架 分布式定时任务 计算引擎 计算引擎 部署 部署 前端 RPC框架 同步框架 向量库 大模型框架

🔥🔥 10W+字,共92个文档,带你玩转datalinkx,详情可戳:细致文档带你吃透DatalinkX

异构数据源同步服务DatalinkX介绍

核心功能 :在不同的异构数据源中进行数据同步,对同步任务进行管理和维护

意义:只要公司规模较大,部门与部门之间有数据协作都应该有类似DatalinkX的项目,比如爬虫组的同事爬下来数据要定时同步到数仓组负责的库下。同步服务会集中管理同步任务,收拢同步日志、提高内部工作效率。

输入图片说明

项目特性

  • 简单易用:通过Web页面快速创建数据源、同步任务,操作简单,一分钟上手
  • 定时触发:对接xxl-job定时,设置cron表达式触发同步任务
  • 配置化任务对接:将数据库信息、任务详情界面化配置
  • 高性能同步:使用高性能流式flink、seatunnel计算引擎
  • 支持插件化加载数据源:支持自定义数据源,按照固定规则开发driver放入统计driver-dist中即可使用
  • 容器化部署:支持docker部署

项目地址

项目 GITEE GITHUB GITCODE
项目地址 GITEE GITHUB GITCODE

项目技术栈

依赖 版本 描述
Spring Boot 2.7.15 项目脚手架
SpringData JPA 2.7.15 持久层框架
MySQL 8.0 DB数据库
ElasticSearch 7.9.3 向量库、支持流转的数据库
Redis 5.0 ↑ 缓存数据库
RedisStream 5.0 ↑ 消息中间件
ChunJun(原FlinkX) 1.10_release 袋鼠云开源数据同步框架
Seatunnel 2.3.8 apache开源数据同步框架
Flink 1.10.3 分布式大数据计算引擎
Ollama x 大模型执行框架
Xxl-job 2.3.0 分布式调度框架
OpenFeign 3.1.9 RPC通信服务
Jackson 2.11.4 反序列化框架
Maven 3.6.X Java包管理
Vue.js 2.X 前端框架
AntDesignUI 3.0.4 前端UI
Docker 容器化部署

使用姿势

  1. 登录系统,默认密码admin、admin登录,没有权限相关控制 img.png
  2. 数据源管理,配置数据流转数据源信息 img.png
  3. 任务管理
    1. 批式任务:配置from_db与to_db构造job_graph img.png
    2. 批式任务:配置from_db与to_db构造job_graph,仅支持kafka img.png
    3. 计算任务: 配置画布信息,支持transform算子操作 img.png
  4. 任务级联配置 img.png
  5. 任务血缘 img.png
  6. 任务调度 img.png
  7. 任务执行 img.png

商业版核心功能差异

功能 datalinkx datalinkx pro
支持mysql读写 ✔️ ✔️
支持oracle读写 ✔️ ✔️
支持elasticsearch读写 ✔️ ✔️
支持http读 ✔️ ✔️
支持redis写 ✔️ ✔️
支持operator计算任务 ✔️ ✔️
适配flink、seatunnel多引擎 ✔️ ✔️
支持clickhouse读写 ✔️ ✔️
告警中心 ✔️ ✔️
支持mysqlcdc读写 ✔️
数据源新插件定制 ✔️
UI优化 ✔️
支持定制化需求 ✔️

项目文档

细致文档带你吃透DatalinkX

About

🔥🔥DatalinkX异构数据源之间的数据同步系统,支持海量数据的增量或全量同步,同时支持HTTP、Oracle、MySQL、ES等数据源之间的数据流转,支持中间transform算子如SQL算子、大模型算子,底层依赖Flink、Seatunnel引擎,提供流转任务管理、任务级联配置、任务日志采集等功能🔥🔥

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 5