目录:
通常看起来好得令人难以置信的都是。 Apache Hadoop就是这种情况,这是每个人都在谈论的备受争议的开源项目。 那到底是什么呢? 好问题!
专家疑惑
Third Nature的分析师Mark Madsen前一段时间在InsideAnalysis.com上的一小段文章中将其钉在墙上:“什么是Hadoop。什么不是Hadoop。” 作为知道如何设计实际解决方案然后实际部署它们的人,他的建议不容忽视。
但是这里流淌着更深的电流,现在是时候发掘这种迷人植物的根源了,看看我们是否无法对宏观层面上正在发生的事情有所了解。 毕竟,供应商一直在说这很重要,而且参与者很多。
雇用通勤者!(?)
目前,Hadoop的大部分新兴市场由三个公司组成:Cloudera,Hortonworks和MapR。 在最近通过Boulder BI Brain Trust(#BBBT)进行的颇有争议的简报中,Hortonworks的Jim Walker发表了以下奇怪的评论:
“如果不雇用提交者,就无法推进技术!”
再来?
这听起来不像帕尔帕廷参议员在《星球大战》电影中说的话吗?
帕尔帕廷参议员:“雇用提交者!”
附近的奴才:“但是,先生,想想孩子们!”
对于那些只是想把事情做好的外行来说,提交者就是致力于特定开源项目的人。 Apache Foundation具有严格的协议,通过这些协议,他们的项目可以向前发展,这通常是一件好事。
也就是说,沃克的评论值得审查。 一个明确的问题(冒充游乐场时间的风险)将是:这是一种承诺还是威胁? 他是说Hortonworks可能只是拿起球回家吗?
合作还是竞争?
有趣的是,如果说这是矛盾的话,据报道,Hadoop团队中的大多数提交者(总共约30个)来自Hortonworks和Cloudera,它们是竞争对手。 这是一个非常奇怪的竞争案例。
那怎么办? 这是一个有根据的猜测:Hadoop的名气在很大程度上归功于一群硅谷风险投资家和工程师构想出的一个聪明的计划,他们实际上是想对冲Oracle。
一般的想法是用代码的基础来打入市场,这些代码可以由一堆烂摊子的开发人员增强和支持,他们将随着时间的推移理想地创建包括数据库产品在内的各种数据管理工具。 风险投资人有一天可以投资并套现。 但是游戏中存在一些严峻的挑战。
像所有大型企业一样,Oracle通常会在许多较小的企业中脱颖而出。 还有谁不想只花点麻痹的收入呢? 仅在最后一个季度,甲骨文就预定了约90亿美元。 但是挑战大红色并击败它们是两个截然不同的现实。
免费网络广播:什么是Hadoop及其发展方向?
与Eric Kavanagh,Robin Bloor和Techopedia一起讨论Hadoop与Linux或SOA有何巨大差异,以及为什么其未来仍未编写成书。 |
包装问题
Hadoop的本质是,它无论如何都不是打包的解决方案。 相反,它是一个复杂的模块集合,使高质量的程序员能够利用大量的并行处理算法来完成非常具体的事情。 但是没有花哨的用户界面,并且手册太残酷了。
除了这个挑战之外,这个关键的障碍还包括:您还需要至少对它的作用有一般了解的商人。 这些人必须能够想出如何使用它的想法,然后与开发人员进行沟通,然后开发人员必须随后开发,测试,实施和支持应用程序。
Cloudera和Hortonworks如何安排这种舞蹈来赚钱。 问题是,通过这种方法创建的大多数解决方案都是唯一的,并且通常侧重于操作系统而不是分析系统。 翻译? 这样的东西并不能真正适合打包的软件产品。
包装获利!
这使我们回到了Oracle。 拉里·埃里森(Larry Ellison)和他们的孩子们在干草堆上销售数据库技术,硬件,服务和打包软件。 Cloudera显然已解决了这一问题,因此他们将重点放在了Impala上。 但是Hortonworks?
他们的模型似乎更接近RedHat的模型,RedHat是在Linux操作系统之上建立了十亿美元业务的人们。 企业软件行业的主要供应商纳里(Nary)并不是为Linux而写的,Linux是IBM在此期间击败微软的操作系统。 但是Hadoop并不是Linux,也不是长期。
Geoffrey Malafsky博士曾经是美国海军的纳米技术专家,现在是Phasic Systems和PSIKORS Institute的数据科学家,他提出了Hadoop的价值主张:
-
“ Hadoop非常适合搜索,可以对随机结果进行非常大的趋势分析,并且可能像我前妻曾经做过的那样非常便宜的,巧妙的并行处理:固态和化学反应的量子力学波函数计算。这是一门真正的科学在超级计算机上并进入了并行处理,但这是编程方法的一次硬变,年轻,聪明,朝气蓬勃的研究生将是实现这一目标的人,我怀疑研究经费已开始朝着这个方向发展,以进行一些高性能计算申请。”
您会注意到,这听起来并不像数据仓库,商业智能,数据集成甚至大数据那样。 听起来像超级计算。 出于某些有趣的原因,高性能计算和商业智能世界从未真正以任何有意义的方式发生冲突或融合。
Hortonworks和Cloudera的漫长道路
对于Hortonworks以及Cloudera而言,这确实是一个坏消息。 像IBM和SAP以及Oracle和Teradata这样的大型供应商,请轻描淡写地引用Dire Straits的话:“他们不傻!” 三年前,所有这些都推出了严肃的Hadoop策略。
这些计划的核心是业务用户期望的各种事情:图形用户界面,拖放功能,建模和发现工具,工作流程,治理,安全性; 简而言之,所有使企业软件可用的点点滴滴。 当然,这些大供应商拥有庞大的安装基础。
可以肯定的是,Cloudera和Hortonworks都取得了不错的成绩,但仅占这些主要参与者每年收入的一小部分。 计算挑战者向客户收取的费用,而不是其可能产生的间接费用,而且情况并不那么乐观。 当然,这与早期软件的关注程度是一致的,但是仍然…
Hadoop的未来?
因此,当我们收购IBM收购Cognos,甲骨文收购Hyperion和SAP并购BusinessObjects时,我们是否会看到经典的收购浪潮? 也许吧,但是这个新手并不拥有Hadoop。 他们只是借用它。 就像YARN和Tez一样有希望,释放周期似乎落后于沉重的击球手。
就在前几天,一位业内人士评论说,Apache的政治可能是一个严重的瓶颈。 这不足为奇,特别是当您考虑到所涉及的美元时,创新者就有极大的动力使其致富。 还有没有人注意到Chrome最近在功能和可操作性方面似乎超过了Firefox? 开源,有人吗?
可以肯定的是:该游戏将以一些有趣的方式播放。 是的,哺乳动物(阅读:小贩子)通常可以超越恐龙;但是, 但是全世界仍然有鳄鱼和鳄鱼。 如果您偶然发现一个不知情的人,您可能会发现这些牙齿有多锐利。 几只鳄鱼在一起甚至可以击倒一两头大象。