达梦数据交换平台产品白皮书.

2019-03-11 19:03:00 zixun
达梦数据交换平台 ——高效全面的数据集成平台 产 品 白 皮 书 达梦数据库有限公司 2013 年 3 月 本文档含有达梦数据库公司的保密的技术和商业信息未经达梦数据库公司的书 面同意,不得进行拷贝、复印或者以其它任何形式向第三方散发。 我们尽力保证本文档中信息的准确和完整,但是仍然可能出现技术或者文字描 述的错误,如果因使用本文档造成的损失,达梦概不负责。 本文档中包含的信息可能会随时更改,恕不另行通知。 本文档发布于 2013 年 3 月 绪论 近几十年来,信息化的推进和计算机网络的飞速发展,使得人类社会所积累的数 据量已经超过了过去 5000 年的总和,数据的采集、存储、处理和传播的数量也与日 俱增。然而,这些为不同应用服务的数据都存储在许多不同的数据源之中。为更有 效地利用这些信息,实现企业或社会组织数据共享与交换,减少数据采集的重复劳动 和相应费用,需要从多个分布、异构和自治的数据源中集成数据,同时还需要保持数 据在不同系统上的完整性和一致性。因此,如何对数据进行有效的集成已成为增强 企业商业竞争力的必然选择,尤其是对于那些拥有多部门多数据源的大型企业或者 组织来说,每一个部门都拥有自己的数据库,这些数据库可能是独立、异构且自治的, 为了各部门间更好的合作和数据共享,建立一个完善的数据交换和集成系统是极有 应用价值而且尤为重要的。 产品介绍 达梦数据交换平台是达梦数据库有限公司在上十年数据处理经验的基础上,研 制开发的具有自主版权的、商品化的数据交换与处理平台。达梦数据交换平台创新 地将传统的 ETL 工具(Extract、Transform、Loading 与分布式消息平台相结合,实现 了对数据抽取、传输、整合、以及装载的一站式支持,是构建数据中心、数据仓 库、数据交换和数据同步等数据集成类应用的理想平台,同时也可以作为数据加工 处理工具由业务人员直接使用。 1 功能组件 达梦数据交换平台由以下 5 个软件组件构成: 达梦数据集成服务器 DMETL Server DMETL Server 是一个具备数据抽取(Extract、清洗转换(Transform 和装载(Load 功能的通用的数据处理平台,能够为异构数据同步和数据整合应用提供完整的支 持。 ◆达梦数据交换设计器 DMETL Studio DMETL Studio 提供可视化的管理、流程设计、调试功能。 ◆达梦数据交换控制台 DMETL Console DMETl 服务管理、参数配置与初始化。 ◆达梦数据总线 DMETL Databus 提供基于消息的、可靠的、安全的数据路由与交换服务,用于支持广域网上跨 部门的数据交换。 达梦数据交换监控系统 DMETL Web Monitor 对多节点的数据交换网络的管理、监控以及统计分析功能。 2 版本划分 达梦数据交换平台分为标准版和企业版,其中标准版主要提供基本的数据整合 和数据同步功能,企业版则在标准版的功能上增加了基于消息的数据交换与路由、 监控与统计、数据质量管理、数据的发布和订阅等企业级的功能,其主要功能划分 见下表: 标准版企业版 数据清洗转换√√ 增量数据抽取√√ 作业调度√√ 数据发布与订阅√ 自定义函数变量√√ 权限管理√√ 操作审计√√ 实时告警√√ 数据质量检测√ 数据交换与路由(DMETL Databus √ 交换监控与统计(DMETL Web Console√ 典型应用场景 达梦数据交换平台是专门为各种类型的数据集成应用而设计的,使用达梦数据 交换平台,能够大大缩短数据集成类应用的工作量。达梦数据交换平台能够全面而 高效的应用于以下一些场景。 1 异构数据同步 异构数据同步是指在一定的时间范围内,通过特定的技术方式,实现异构数据源 之间的数据一致性。数据同步应用通常有以下一些要求: 性能要求高,通常要达到准实时同步,因此需要实现增量数据抽取,以达到快速同 步和节省网络资源的; 可靠性要求高,故障自动恢复。 达梦数据交换平台可以很好的满足上述要求,可以支持一对一或者一对多的文 件到文件、文件到数据库、数据库到数据库、数据库到文件的数据同步。同步的源 和目的数据可以是不同类型的数据库或者文件,并且在同步过程中可以对数据格式 进行转换以满足源和目上的不同应用系统的要求。 一对多数据同步 2 数据交换 数据交换,通常用于不同部门间的业务协同,数据的流动是通常由应用发起并推 动的,应用获取到数据并完成业务逻辑之后,可以把数据存储下来,也可以丢弃。数据 交换应用通常涉及多个部门的数据库和应用程序,需要部署多台数据交换服务器。 达梦数据交换平台内置了软总线功能,可以连接各种应用和数据源,支持数据自 动路由,保证数据的安全可靠传输。同时达梦数据交换平台也提供了交换监控配置 系统,通过该系统可以实时监控各个交换节点的状态,并可以可视化的修改交换路由 设置。 跨部门数据交换 3 数据整合 数据整合是指将不同来源的数据,经过清洗转换后变为统一格式,存储到数据中 心或者数据仓库中,用于提供数据共享、数据分析等服务。其特点是: 数据量大,数 据种类丰富,需要较高的数据装载性能; 对数据质量要求高,需要有丰富易用的数据清洗转换组件; 数据持续集成,不同类型的数据集成的周期可能不同,需要功能强大的作业调度 与监控功能; 达梦数据交换平台具有数据分区并发清洗和装载、数据质量实时检查以及灵活 的调度设置,能全面满足数据整合应用对于性能、易用性的要求。 数据整合 功能特色 全面的数据源支持 支持各种主流数据库(达梦、Oracle、SQLServer、 DB2、Mysql、Sybase、 PostgreSql 等的全量和增量数据抽取和装载,还支持 TXT、CSV、Excel、XML 文 件、消息服务器、LDAP 服务器、WebService 等数据的抽取和装载。 易用增量数据抽取 内置了各种增量数据抽取方式,用户只需要简单的设置即可实现对各种数据 库的数据的增量数据抽取,为实时数据集成提供了良好的支持。 批量文件处理 支持各种文件(txt、excel、xml 的批量读取和解析,能够自动识别目录中新增和 修改的文件,并且能够在本地和远程服务器之间同步文件夹。 丰富的数据转换规则 内置近 40 多种数据清洗转换规则,支持动态扩充。对于简繁体、汉字拼音、乱 码处理、字符集转换、中文数字的中国特有的问题提供内置的转换规则进行处理。 批量流程创建 提供基于模板的批量流程生成向导,可以快速生成大量类似的转换,大大提高工 作效率。 企业级的监控 提供了 BS 架构的统一监控系统,通过该系统用户可以直观的监控整个多节点数 据交换网络,实时查看后台流程运行状态和统计信息、接收和处理系统告警,并执行 日常的管理和维护工作。 实时数据质量检查 DMETL 内置了数据质量检查功能,能够根据用户定义的规则对流程中的数据质 量进行检查,并对结果进行统计。支持用户定制规则以及和重用质量检查规则 高性 能 采用基于流水线的多线程架构,并支持数据分区处理和并行装载,可以充分发挥 硬件性能,数据处理能力可以随着系统 CPU 和 IO 性能的提升而同步提升。此外还 支持支持单表多连接并行装载、达梦、oracle 的快速装载接口、文本文 件的分段并行解析等。 高安全 提供基于角色的权限控制机制,责权明晰。支持传输加密,不同交换节点之间传 输的数据都是经过加密处理,防止信息泄露。 高可扩展 DMETL 采用基于 OSGI 整体架构,系统的各个模块如流程节点、转换规则、数 据质量检查规则都支持插件机制,可以根据具体业务需求动态扩展。 可编程 提供了简单易用的编程接口 API,通过调用该 API 第三方应用可以快速方便的 调用 DMETL 的各项功能,如创建、执行流程,获取监控和统计信息等。此外, DMETL 还支持编写自定义的 java 函数和表达式来对数据进行处理。 应用案例 1 浦东新区数据中心 该项目建设是结合浦东新区信息化发展的实际需要,解决电子政务建设过程中 出现的信息孤岛、信息共享交换、数据安全存储等问题,面向全区主要委办局,建设 一套安全、高效、经济的公共数据中心,项目总体架构见下图: 项目特色 实现了对多个委办局现运行的各种异质异构系统的支持,包括 windows、linux 以及 unix 操作系统,和对各种品牌的 PC Server、小型机服务器。 支持多种系列的数据库,包括 Oracle 系列、SqlServer 系列、db2、sybase、 mysql、DM 数据库、access 等多种国内外数据库管理系统。 支持通过政务外网或专用光纤连接对各委办局的局域网内的数据进行交换,对 地理位置从 1 公里以内到 10 公里以外的交换节点均支持良好。 2 国家电网主备调数据同步 该项目的最终用户是国家电网。当前国家电网电力调度系统正面临大规模的系 统升级,而当前的系统升级过程中,面临的普遍现实是:旧版系统运行了较长 的时间,系统相对稳定;新版系统则实现了更多更强的功能。为了保证能够平稳 地完成系统的升级,提高系统的稳定性,需要同时运行新旧两个版本的系统,并保证新 旧系统的数据同步。 项目特色 基于 DMETL 表级增量抽取和灵活的转换逻辑,高效的实现了国家电网主备调 系统间的异构数据(数据平台和数据模型、数据结构均不同的同步,保证了新旧调度 系统的平稳过渡和升级。 3 商务部产业安全数据分析平台 该项目的用户是商务部产业安全调查局。项目的核心建设内容是建设一个数据 分析平台,为产业损害预警业务提供数据,为具体业务部门日常作业提供支撑,为领导 决策提供支持。 该项目涵盖了从数据采集、数据加工处理到信息发布的全部过程,系统总体构 架采取分层的开放体系结构,分为数据及其管理层、业务分析层、综合应用层,如下 图所示。 项目特色 该项目数据来源广泛,数据结构复杂,主要包括国家统计局数据、海关进出口数 据、商务部数据直报系统采集数据、各行业协会和专家报送数据、购买的海外竞争 对手贸易数据、调查局自采集数据等。通过 DMETL 工具实现了上述数据的有效整 合,以此为基础实现了商务部产业安全数据仓库。 4 湖北省公安云项目 该项目全称为湖北省公安厅金盾工程多层架构体系建设和政府部门间信息共享 平台项目。项目采用“云计算”理念,利用虚拟化技术,对湖北省公安厅现有的软硬件 资源以及内外部数据进行整合,实现“基础设施即服务(IaaS”、“平台即服务(PaaS”、 “数据即服务(DaaS”、“软件即服务(SaaS”。该项目采用 DMETL 作为数据采集与整 合平台,数据整合系统的结构如下图: 共享服务 分析服务 目录服务 查询服务 应用支撑接口服务 查询服务 项目特色 该项目最大的特点是数据量大,数据种类多,截止 2012 年 6 月已与 30 个省级政 府单位签订数据交换协议,共采集外部数据资源约 6000 万条,完成 8 个内部单位的数 据交换,共采集内部数据资源约 15.5 亿条。 每天数据更新量约 240 万条,并随着数据 资源的增多,每天更新量会进一步攀升。
电话咨询
邮件咨询
在线地图
QQ客服