目录:
定义-DataStage并行扩展器(DataStage PX)是什么意思?
DataStage并行扩展器(DataStage PX)是IBM数据集成工具。 它是数据仓库行业中广泛使用的提取,转换和加载(ETL)工具之一。 该工具可以从异构源收集信息,根据业务需求执行转换,并将数据加载到相应的数据仓库中。
DataStage PX也可以称为DataStage Enterprise Edition。
Techopedia解释了DataStage并行扩展器(DataStage PX)
DataStage并行扩展器具有并行架构来处理数据。 DataStage PX中实现的两种主要并行性是管道并行性和分区并行性。 以并行方式处理数据的能力在很大程度上加快了数据处理的速度。
DataStage Parallel Extender包含多个阶段,通过这些阶段可以处理源数据并将其增强到目标数据库中。 这些以TB为单位定义。 除了阶段外,DataStage PX还使用容器重用作业组件和序列,以同时运行和调度多个作业。
DataStage Parallel Extender的常用阶段包括:
- 变压器
- 聚合器
- 资料集
- 复制
- 更改适用
- 修改
- 过滤
- 加入
- 合并
- 抬头