Skip to content

DataCleaner文档资料

1123786563 edited this page Jun 3, 2020 · 1 revision

开发指南

架构

数据访问

在DataCleaner中,数据的所有资源被称之为"数据存储"。这个概念既包括了本地读取/解析的资源,也包括了相关的资源。如"数据库与应用程序",以关系数据库为例,一些数据存储可以被写入其中。

DataCleaner使用Apache MetaModel framework来访问数据。从DataCleaner的角度来看,Apache MetaModel提供了以下功能:

* 一种与不同数据存储交互的常见方法。

* 一种编程查询语法,它抽象出特定于数据库的SQL语言,并且也可用于非面向SQL的数据存储(如文件等)。

* 开箱即用,即直接连接到许多源。(如,CSV文件,关系数据库,Excel电子表格等)

* 使用一些通用地模型来构建新的资源模型。

DataCleaners数据存储模型也是可扩展的,您可以自己实现新的数据存储,以便将DataCleaner连接到遗留系统、应用程序接口等。

处理架构

Clone this wiki locally