资料库 什么是Datastage并行扩展器(Datastage px)? -技术百科的定义

什么是Datastage并行扩展器(Datastage px)? -技术百科的定义

目录:

Anonim

定义-DataStage并行扩展器(DataStage PX)是什么意思?

DataStage并行扩展器(DataStage PX)是IBM数据集成工具。 它是数据仓库行业中广泛使用的提取,转换和加载(ETL)工具之一。 该工具可以从异构源收集信息,根据业务需求执行转换,并将数据加载到相应的数据仓库中。


DataStage PX也可以称为DataStage Enterprise Edition。

Techopedia解释了DataStage并行扩展器(DataStage PX)

DataStage并行扩展器具有并行架构来处理数据。 DataStage PX中实现的两种主要并行性是管道并行性和分区并行性。 以并行方式处理数据的能力在很大程度上加快了数据处理的速度。


DataStage Parallel Extender包含多个阶段,通过这些阶段可以处理源数据并将其增强到目标数据库中。 这些以TB为单位定义。 除了阶段外,DataStage PX还使用容器重用作业组件和序列,以同时运行和调度多个作业。


DataStage Parallel Extender的常用阶段包括:

  • 变压器
  • 聚合器
  • 资料集
  • 复制
  • 更改适用
  • 修改
  • 过滤
  • 加入
  • 合并
  • 抬头
什么是Datastage并行扩展器(Datastage px)? -技术百科的定义