发展趋势 关于管理大数据的6大神话

关于管理大数据的6大神话

目录:

Anonim

早在2014年5月,Forrester Research发表了两份报告,得出了有关大数据炒作的某些结论。 该研究公司对250多名营销和业务开发主管进行了调查。 根据该报告的作者,大数据的言论空前高涨,技术供应商正在兜售似乎令人难以置信的产品。


Gartner同意Forrester Research; 大肆宣传围绕着大数据。 在2014年9月的报告中,Gartner揭穿了五个最大的数据神话,Gartner的分析师就大数据及其操纵的误解发表了自己的看法。 那么,大数据最大的神话是什么? 我们来看一下。

神话:每个人在采用大数据方面都领先于我们。

Gartner说,对大数据的兴趣空前高涨。 尽管如此,只有13%的受访者拥有工作系统。 原因:大多数公司尚未弄清楚如何从大型数据存储库中挖掘任何价值。 在这里,Gartner的调查比Forrester的报告更为乐观,该报告发现只有9%的调查参与者表示他们计划在明年实施大数据技术。 (大数据可以提供很多。在大数据可以解决的5个现实问题中了解更多信息。)

误解:我们有这么多数据; 我们不必担心每个小的数据缺陷。

Gartner担心我们人类的脆弱性:“我们拥有如此之多,坏的一点都不会有关系。” Gartner副总裁兼杰出分析师泰德·弗里德曼(Ted Friedman)认为,这是看待情况的错误方法。


弗里德曼说:“实际上,尽管每个缺陷对整个数据集的影响要比数据少时的影响要小得多,但由于存在更多的数据,所以缺陷多于以前。” “因此,劣质数据对整个数据集的总体影响保持不变。”


弗里德曼(Friedman)添加了另一个令人担忧的理由。 大数据捕获通常包含来自企业外部的数据,因此这些数据的结构和来源未知。 这增加了出错的可能性。

误解:大数据技术将消除对数据集成的需求。

可以将两种关键数据分析策略应用于大数据:“写入模式”或“读取模式”。 直到最近,写入模式还是唯一使用的方法。 读取模式是当前数据库管理的热潮。 与需要结构化格式的写模式不同,数据以原始格式加载到读模式数据库中。 然后,开发人员(使用诸如Hadoop之类的非结构化数据库平台)将完全不同的数据转换为可用格式。 读取模式具有明显的优势,但是,正如Gartner所述,数据集成必须在某个时候进行。

误解:使用数据仓库进行高级分析毫无意义。

对于许多信息管理人员而言,花时间创建数据仓库似乎毫无意义,特别是当新捕获的数据与数据仓库中的数据不同时。 但是,Gartner再次警告,即使高级数据分析也将使用数据仓库和新数据,这意味着数据集成商必须:

  • 优化新数据类型以使其适合分析
  • 确定哪些数据是相关的,以及所需的数据质量级别
  • 确定如何汇总数据
  • 了解数据优化可以在数据仓库之外的其他地方进行

误解:数据湖将取代数据仓库。

数据湖是不同数据的存储库,与数据仓库采用结构化格式的数据仓库相反。 与数据仓库相比,创建数据湖几乎不需要任何前期工作(无需格式化数据),这就是为什么对数据湖感兴趣的原因。


Gartner强调拥有数据不是重点-能够操纵捕获的数据进行明智的决策才是重点。 而且,使用(有些未经证实的)数据湖来促进决策是有问题的。


Gartner研究总监Nick Heudecker表示:“数据仓库已经具有支持整个组织中各种用户的能力。” “信息管理领导者不必等待数据湖赶上来。” (在采用前必须了解的关于大数据的7件事中了解有关采用大数据的更多信息。)

大数据有效-可能无法使用新的数据处理方法

阅读报告后,Gartner说出“最大数据神话”而不是“大数据神话”的原因就很清楚了。 Gartner并非对大数据持保留态度。 对于那些认为处理大数据的新方法已经准备好迎接“黄金时间”的人们,Gartner感到不安。

关于管理大数据的6大神话