目录:
定义-并行数据分析是什么意思?
并行数据分析是一种使用在多台计算机上同时运行的并行进程来分析数据的方法。
该过程用于分析大型数据集,例如大型电话记录,网络日志和文本文档的网络存储库,这些文本文件可能太大而无法放在单个关系数据库中。 该方法通常用于大数据分析和常规数据分析中。
Techopedia解释了并行数据分析
并行数据分析背后的主要概念是并行性,在计算中定义为并行执行过程。
这通常是通过使用多个处理器甚至多个计算机来实现的,并且是分布式计算中的常见做法。 在数据并行分析中,执行数据分析不同方面的不同计算机将同时执行这些过程,然后将结果合并为一个大型报告。
这种并行性的原因主要是为了使分析更快,但是也因为某些数据集可能过于动态,太大或太笨拙而无法有效地放置在单个关系数据库中。 结果将是那些数据集存放在针对此类数据优化的不同数据库中以及不同的机器中,因此线性分析根本不是一个有效的选择。
