目录:
定义-提取变换负载(ETL)是什么意思?
提取转换加载(ETL)是在数据库使用期间(尤其是在数据存储使用期间)进行提取,转换和加载的过程。 它包括以下子过程:
- 从外部数据存储或传输源检索数据
- 将数据转换为易于理解的格式,通常将数据与错误检测和纠正代码一起存储,以满足运营需求
- 将数据传输并加载到接收端
Techopedia解释了提取变换负载(ETL)
ETL过程的第一阶段着重于从存储源检索数据。 大多数数据存储项目都集成了从各种源系统接收的数据。 每个单独的系统可以采用单独的数据组织或格式。 常见的数据源结构是关系数据库和纯数据文件。 它们还可能包括非关系数据库模式(如信息管理系统)或其他数据结构(如虚拟存储访问方法(VSAM)或索引顺序访问方法(ISAM))。 数据源甚至可以包括外部源,例如来自Internet或通过扫描系统的数据。
转换阶段使用一系列规则或操作从源中检索纯数据,以最终形式传递数据以在接收端进行操作。 一些数据源需要很少甚至不需要数据处理。 有时,一个或多个转换对于匹配目标数据库的业务和技术要求可能至关重要。
加载或发送阶段旨在将数据发送到接收端,这很可能是数据存储。 根据应用程序的需要,此过程可能非常简单或非常复杂。 某些数据存储方法可能会用累积数据替换旧数据。 通常,定期对提取的数据进行更新。