目录:
定义-数据提取是什么意思?
数据提取是对数据进行分析和爬网,以特定模式从数据源(如数据库)中检索相关信息的地方。 完成了进一步的数据处理,这涉及添加元数据和其他数据集成; 数据工作流程中的另一个过程。
大部分数据提取来自非结构化数据源和不同的数据格式。 这些非结构化数据可以采用任何形式,例如表,索引和分析。
Techopedia解释了数据提取
仓库中的数据可能来自不同的来源,数据仓库需要三种不同的方法来利用传入的数据。 这些过程称为提取,转换和加载(ETL)。
数据提取过程涉及从混乱的数据源中检索数据。 然后将数据摘录加载到关系数据库的暂存区域中。 这里使用提取逻辑,并使用应用程序编程接口查询源系统的数据。 在此过程之后,数据现在准备就绪,可以通过ETL过程的转换阶段。