问:
什么情况导致大数据生态系统的兴起?
A:有许多因素促成当今的大数据生态系统的出现,但人们普遍认为,大数据的产生是由于一系列硬件和软件设计使得大数据得以存在。
网络研讨会:大铁,见大数据:使用Hadoop和Spark释放大型机数据 在这里注册 |
大数据的常规定义如下:足够大和复杂的数据集使它们无法进行轻松的迭代管理或手动管理。 大数据集通常被标识为无法放入简单数据库网络中的数据集,因为大数据集的分析需要处理数据的服务器方面的大量工作。
考虑到这一点,创建大数据的主要部分是我们称为摩尔定律的想法,或者每两年将电路上的晶体管加倍,从而创建越来越小的硬件和数据存储设备(以及功能更强大的微处理器) 。 结合摩尔定律,可能是因为摩尔定律,可访问软件系统的计算能力不断提高,以至于个人计算机也可以处理大量数据,商务和先锋系统也开始能够处理数据量仅仅几年前就难以想象。 个人系统在对消费者透明的过程中,从千字节迁移到兆字节,然后又迁移到千兆字节。 先锋系统从千兆字节迁移到TB和PB,然后迁移到zetabytes(数量级)之类的数量级,而这对普通市民而言就不那么透明了。
容纳大数据的另一个进步是处理程序处理数据集的方式发生了变化。 处理程序不是通过常规的关系数据库设计进行线性处理,而是开始使用诸如Apache Hadoop和相关硬件管理工具之类的工具来消除数据流程中的瓶颈。
结果就是我们生活的大数据世界,海量数据集存储和维护在数据中心中,并且越来越多的技术被广泛使用,以实现广泛的用途。 从商业到生态,从公共计划到医学,大数据变得越来越容易获得。 同时,政府机构和其他大型组织仍在推动大数据规模的界限,并实施更高级的解决方案。
