通过Techopedia Staff,2016年9月22日
总结:主持人丽贝卡·乔兹维克(Rebecca Jozwiak)与Robin Bloor博士,Dez Blanchfield和Dell Statistica的Shawn Rogers讨论了边缘分析。
您目前尚未登录。请登录或注册以观看视频。
Rebecca Jozwiak:女士们,先生们,大家好,欢迎来到2016年热门技术。今天我们有了“ Edge Analytics:最后的物联网经济”。我叫Rebecca Jozwiak。 我将成为您今天网络直播的主持人。 如果您想加入Twitter对话,我们会使用#HOTTECH16的标签发布推文。
因此,物联网无疑是今年和物联网的热门话题,它实际上与机器数据,传感器数据,日志数据和设备数据有关。 没有一个是新的,我们已经永远拥有这种类型的数据,但是那是因为我们实际上还无法使用它,现在我们看到的只是大量使用该数据的新方法。 特别是在医疗行业,金融市场以及石油和天然气,大宗商品中,这只是以前未开发的大量信息。 并不是很多人真正掌握了如何做到这一点。 我们谈论的是大量数据,但是其中包含大量数据,并且您知道所涉及的网络问题,所涉及的硬件或需要处理的数据,如何在不阻塞系统的情况下做到这一点? 这就是我们今天要学习的内容。
这是我们的专家阵容。 我们有The Bloor Group的首席分析师Robin Bloor博士。 我们还有The Bloor Group的数据科学家Dez Blanchfield。 我们很高兴有Dell Statistica全球行销和渠道总监Shawn Rogers。 这样,我就将球传给了罗宾。
Robin Bloor博士:好的,谢谢你。 我要按一下按钮,然后扔一张幻灯片。 我不知道为什么我为物联网创造了这张世界末日的图画。 可能是因为我认为最终它会变得混乱。 我继续前进。 这对于任何物联网演示中的课程来说都是一样的。 您必须以一种或另一种方式说出一切都令人发指。 实际上,大多数情况可能是正确的。 如果您实际看一下这些曲线逐渐扩展的方式。 您知道,个人计算机,智能手机和平板电脑可能会继续增长。 智能电视可能会崛起。 与几年前相比,可穿戴设备现在可能正在爆炸。 互联汽车,不可避免的是几乎所有汽车都将被广泛连接,并一直在传输数据。 还有其他一切。 BI Intelligence的这张特殊图表表明,其他所有事物都将非常非常快地超过明显的事物。
那么关于物联网该怎么说呢? 第一件事只是架构问题。 您知道,当您拥有数据并进行了某种处理时,您将不得不将两者放在一起。 而且,由于现在的数据量很大,并且在各个地方收集数据,因此两者之间自然不再在一起了。 我猜它们曾经是旧的大型机时代。 因此,您可以考虑存在一个处理层,一个传输层和一个数据层。 如今,传输层将以一种或另一种方式在网络之间移动处理或移动数据。 因此,有以下选择:您可以将数据移动到处理中,可以将处理移动到数据中,可以将处理和数据移动到方便的执行点,或者可以分片处理和分片数据。 关于物联网,数据在诞生之初就已经被分片了,并且很可能将要分拆大量处理过程,以便可以运行需要运行的应用程序。
所以我画了一幅画。 对我而言,关于物联网的有趣之处在于,我在此图中讨论了一个聚合域,并指出存在子域。 因此,您可以想象这里的IoT域1是某种汽车,而域2,域3和域4是某种汽车,您将在本地聚合数据,将在该数据上运行本地应用程序,并且您将把各种事情付诸实践。 但是,为了对所有汽车进行分析,您将必须将数据(不一定是所有数据)传输到中心,但必须在中心进行汇总。 如果考虑到这一点,那么您可能希望对同一套IoT事物拥有许多不同的聚合域。 域本身可能会进一步聚合。 因此,您可以拥有这种重复的层次结构。 基本上,我们所拥有的是一个非常复杂的网络。 比我们以前必须做的要复杂得多。
我在下面有一个纸条。 所有网络节点(包括叶节点)都可以是数据创建者,数据存储和处理点。 这为您提供了分发的可能性,这是我们之前从未见过的。 Dez将对此进行更多讨论,因此我将继续讨论这一点。 一旦我们进入了物联网并且所有数据实际上都已分解为事件,此幻灯片的目的只是表明我们将必须对事件进行标准化。 至少,我们将必须拥有这个。 我们将了解事件发生的时间,发生的地理位置,创建事件的进程的虚拟或逻辑位置,创建事件的源设备,设备ID,以便您确切地知道是哪个源设备创建了它,所有权在数据和行为者中,那些有权以某种方式使用数据的人,必须随身携带其权限,这意味着,确实,它必须随身携带安全性,然后数据本身。 当您观察到这一点时,您会意识到,即使您使用的传感器所做的仅是每秒钟左右报告某事物的温度,实际上,还有很多数据只是用来确定数据的确切位置起源及其实际上是什么。 顺便说一下,这不是一个详尽的清单。
因此,就未来的IT前景而言,我的看法是:不仅是物联网,而且事实是我们将处于事件驱动型活动的世界中,因此我们将必须具有事件驱动的体系结构,并且这些体系结构将必须跨越大型网络。 另一件事是实时的一切,我们不一定要是实时的,但我所说的是业务时间,它是必须实际准备好数据并准备就绪的时间进行处理。 您知道,创建之后可能还不到一毫秒。 但是每个数据总是有这样的时间,一旦有了事件驱动的体系结构,就可以以一种实时的方式来思考世界的工作方式,变得更加明智。
慢慢来,因为我们真正在谈论的是物联网上的分析。 尽管如此,洞察力仍然关乎时间,而不仅仅是洞察力的时间,洞察力之后必须采取行动。 因此,我将其归结为洞察力和采取行动的时间。 话虽如此,我将球传给了Dez。
Dez Blanchfield:谢谢Robin。 一如既往的洞察力。 我喜欢这样一个事实,即在每个实例上都很难遵循,但是我会尽力而为。
老实说,我所看到的一件事,而且我经常为它所吸引,这并不是一种卑鄙和消极的偏见,但是对于物联网接管世界却存在着许多担忧和恐慌分配我们,您将开始丢失数据,因此,我想回顾一下过去两到三十年来我们之前所做的一些与互联网密切相关的事情事物,但规模可能不尽相同。 只是为了向我们展示我们实际上已经来过这里并解决了一些问题,而不是在这种规模和速度下。 因为这意味着我们可以实际解决问题,并且知道一些答案。 我们只需要弯腰,重新运用我们以前的一些经验。 我知道这是我们将要进行的整个对话,并且在“问答”部分中,我聊了很多有趣的事情。
但是,当我们考虑圈子中的物联网时,目前在早期设计阶段就已经在设计级别进行了大量集中化。 例如,Fitbit设备通常都集中到一个中心位置,并且很可能托管在某个地方的云平台中,而所有这些设备中的所有数据都指向相同的堆栈前端(包括Web和Web)。应用和基于数据的服务。 但是随着时间的流逝,这种规模将需要重新设计以应对即将到来的数据量,并且他们将对其进行重新设计,以便在多个位置和区域中存在多个前端和堆栈的多个副本。 我们已经看到了这一点,有许多示例可供我们讨论。
关键是,即使我们已经看到了一些我要介绍的解决方案,但数据的规模和数量以及物联网将产生的网络流量确实迫切需要从中心转移。在我看来,这是针对分布式体系结构的,我们知道这一点,但我们不一定掌握解决方案是什么。 当我们考虑什么是物联网的概念时,它是一个大规模的网络模型。 现在有很多东西在吵闹。 直到最近才引起人们注意的事情。 实际上,我认为是昨天,我在开玩笑地谈论着烟囱,但是我去买了一个新的烤面包机,它带有一个选件,可以告诉我很多事情,包括何时需要清洗。 还有一个功能非常相似的新微波炉,甚至可以对我手机上的一个应用程序执行ping操作,说我正在加热的东西已经完成。 我非常认为,如果有两件事我不想和我说话,那就是我的冰箱,微波炉和烤面包机。 我对他们成为愚蠢的设备感到非常满意。 但是我最近有一辆新车,有点奥迪,它的确对我说话,对此我感到非常满意,因为它所谈论的是有趣的事情。 就像实时更新地图一样,告诉我从A点到B点还有更好的路线,因为它通过各种机制检测到了具有发送数据的流量。
我有这张幻灯片。 我们已经看到,大容量网络模型需要从中央捕获到分布式数据处理和分析模型的捕获和交付的转变。 我们已经看到事情从右边的三个小图移动,三个中的左一个,有一个集中的模型,所有小设备都到达中心位置,收集数据,规模不是很大,在那里应付得来。 在中间,我们有一个稍微分散的模型和中心点,这就是我认为下一代物联网将需要的。 然后在右侧,我们得到了这个完全分布式和网状的网络,这是物联网和机器对机器在未来的短期内将会发展的地方,但是我们还不完全出于多种原因。 而且主要是因为到目前为止,我们在大多数通信中都使用Internet平台,而且实际上还没有建立第二个网络来承载大量数据。
已经存在第二个网络,例如Batelco网络。 许多人没有想到电信网络不是互联网这一事实。 互联网在许多方面都是非常独立的事物。 他们先通过电话网络从智能手机路由数据,然后再通过电话网络将数据路由到Internet,通常它们实际上将数据分层为两个网络。 但是,物联网完全有可能需要另一个网络。 我们通常将工业互联网作为一个话题来讨论,我们现在将不对其进行详细介绍,但实质上,我们是在谈论另一个专门为数据或物联网以及机器对机器的运输类型而设计的网络。通讯。
但是我想分享的一些例子是互联网之类的东西,这些例子让我们看到了大容量网络和分布式数据的良好运行。 从第一天起,互联网就是经过专门设计和设计的,能够在核战争中幸存下来。 如果美国部分地区被炸毁,则互联网的设计目的是使数据可以在互联网上移动而不会因我们仍保持连接而丢失数据包。 今天,在全球范围内仍然存在。 互联网具有围绕冗余和路由数据包的多种功能。 实际上,互联网是由称为BGP(边界网关协议)和边界网关协议(BGP)的事物控制的,专门用于应对路由器,交换机或服务器宕机的问题。 当您发送或接收电子邮件时,如果您连续发送三封电子邮件,则不能保证这些电子邮件中的每一封都会遵循相同的路由到达相同的最终目的地。 由于各种原因,它们可能会遍历Internet的不同部分。 可能会发生故障,可能会出现维护窗口,使事物脱机以进行升级,网络中可能会出现拥塞,我们看到了诸如汽车,公共交通以及船舶和飞机的交通网络之类的事物。 我们每天都通过内容传送网络通过浏览器等向笔记本电脑,平板电脑和计算机等设备获取内容。 内容交付网络涉及从您的主要服务平台(例如Web服务器)获取内容副本,并将该副本和少量缓存移动到网络边缘,并仅从边缘的最近部分将其交付给您。
反垃圾邮件和网络安全–如果垃圾邮件事件在加拿大发生,并且Microsoft检测到它,并且发现同一封电子邮件的许多副本发送给一群随机的人,则对其进行校验和检查,该邮件的签名为创建并放入网络并立即分发。 这样一来,电子邮件就永远不会进入我的收件箱,否则,它会立即被标记为垃圾邮件,因为它已在网络边缘的其他位置被检测到。 这样,网络边缘的其他部分就会收到有关此垃圾邮件签名的信息,并将其放入数据库的索引中,如果这些邮件开始出现在地球的另一端,我们就会检测到它们,并且知道它们是垃圾邮件。 网络安全也是如此。 可以检测到并记录并映射在地球一侧发生的黑客攻击,然后突然在网络的另一部分,我们可以与之抗争并提交规则和政策,并进行更改以查看是否可以阻止它。 特别是对于拒绝服务或分布式拒绝服务之类的事物产生了新的影响,其中数千台计算机被用来攻击中央网站。
默认情况下,比特币和区块链是默认的,其本质是分布式账本,区块链,并应对网络中的任何中断或损坏。 欺诈检测和预防,电力和供水设施–我们正在了解电力网络,如果网络的一部分在其上挂有树,并拔出电线杆和电线,我的房子仍然可以供电。 我什至不知道,我常常在新闻中都看不到它。 正如他们所说,我们都习惯了最初存在集中化模型的交通网络,即“通向罗马的所有道路”,然后最终我们不得不使用集线器和辐条的去中心化模型,然后我们去了到网状网络,您可以通过各种网状路线和不同的交叉路口从城市的一侧到达另一侧。 因此,我们在这里看到的是,我们现在正在使用物联网进行的这种集中化模型将不得不推广到网络的边缘。 这比以往任何时候都适用于分析,这就是我们需要将分析推入网络。 为此,在我看来,这需要一种全新的方法来访问和处理数据以及数据流。 我们现在谈论的是一种情况,我相信我们会看到有限的智能在连接互联网的设备上被推到网络的边缘,但是我们很快就会看到这些设备在智能方面有所提高,并提高了他们想要的分析水平去做。 因此,我们将需要通过网络将这些聪明人推向越来越远。
例如,智能应用程序和社交媒体–如果我们考虑社交媒体和某些智能应用程序,它们仍然是非常重要的。 您知道,只有两个或三个数据中心可用于Facebook。 Google的去中心化程度大大提高了,但全球数据中心数量仍然有限。 然后,当我们考虑内容个性化时,您必须在非常本地的层面上进行思考。 许多工作是在您的浏览器或本地内容交付网络层中完成的。 我们考虑了健康和健身追踪器–从其中收集的许多数据都在本地进行了分析,因此,您戴在手腕上的新版Garmin和Fitbit设备正变得越来越智能。 现在,他们不会将有关您的心率的所有数据发送回集中式服务器,以尝试完成分析。 他们正在将智能直接构建到设备中。 车载导航曾经是汽车不断从某个中心位置获取更新和地图的方法,现在智能车已经在汽车中,汽车的决策全由其自己决定,最终汽车将啮合。 这些汽车将通过某种形式的无线网络相互通信,该无线网络可能是下一代的3G或4G无线网络,但最终将是设备到设备。 而我们要应对的唯一方法就是使设备更智能。
我们已经有了紧急预警系统,可以在本地收集信息,然后将其集中发送或发送到网状网络,并就本地发生的事情做出决策。 例如,在日本,人们使用智能手机中的加速度计在智能手机上运行的应用程序。 智能手机中的加速度计将检测振动和运动,并可以确定正常的日常运动与地震的震颤之间的差异。 该电话将立即在本地警告您。 实际的应用程序知道它检测到地震。 但是,它也通过分布式中心和分支模型通过网络共享数据,以便您附近的人在数据流经网络时立即或尽快得到警告。 最终,当它到达某个中心位置或中心位置的分布式副本时,它将向不位于附近区域,尚未检测到行星运动但需要警告的人推回去,因为也许海啸来了。
智能城市基础设施–智能基础设施的概念,我们已经在智能建筑和智能基础设施中建立了智能。 实际上,昨天我将车停在了新城区的城市中,对该城市的部分地区进行了翻新和重建。 他们重新整修了所有街道,街道上还有传感器,实际的停车收费表知道,当我开车开车时,它知道当我刷新两个小时的限制时,那辆车没有动,实际上并不能让我再充值再呆两个小时。 我不得不坐上汽车,离开空间,然后向后拉,以欺骗它,让我再呆在那里两个小时。 但是有趣的是,最终我们不仅要检测进入本地区域的汽车作为本地传感器,而且还需要光学特性,例如通过看着我的车牌的摄像头进行识别的光学特性。我实际上只是拔出并拉回并欺骗了它,它不会让我更新,我会继续前进。 然后它将分发这些数据,并确保我无法在其他任何地方做这些,并不断欺骗网络。 因为它本质上必须变得更聪明,否则我们都会继续愚弄它。
有一个这样的例子,我实际上曾住在80年代末和90年代初的防火墙技术中,该产品称为Check Point FireWall-1。 这是一种非常简单的防火墙技术,我们用来创建规则并围绕某些事物构建策略和规则,以说通过某些端口以及IP地址和网络之间来往的流量类型,从一个地方到另一个地方的网络流量,从浏览器和客户端到我们的服务器端。 我们通过将逻辑从防火墙本身中移出并实际将其移入专用集成电路ASIC中来解决此问题。 它正在控制以太网交换机中的端口。 我们发现服务器计算机(我们实际上用作服务器来作为防火墙做出决策的计算机)的功能不足以处理每小部分数据包检查通过它们的流量。 我们通过将进行数据包检查和Internet检测所需的逻辑转移到分布式的并能够处理通过网络级别的大量数据的网络交换机中来解决了该问题。 我们不必为集中式防火墙而担心,而是将其移至交换机。
因此,我们让制造商建立了将路径,规则和策略推入以太网交换机的能力,以便在实际的以太网端口级别上,也许池中的许多人对此并不熟悉,因为我们现在所有人都生活在无线世界中,但是从前,所有东西都必须通过以太网插入。 现在,在以太网端口级别,我们正在检查数据包,以查看是否甚至允许数据包进入交换机和网络。 其中一些就是我们正在解决的挑战,即从网络中捕获数据(特别是从IRT设备中捕获数据),然后对其进行检查和分析,并可能对其进行实时分析以做出决策。 其中一些目的是获得商业智能的见解,以及有关人如何做出更好的决策的信息,以及在设备与设备进行对话并做出决策的机器对机器级别的东西的其他分析和性能的信息。
这将是我们必须在不久的将来解决的趋势,因为如果我们不这样做,我们最终将面临大量的噪音。 在大数据世界中,我们已经看到诸如数据湖变成数据沼泽之类的事情,最终导致大量噪声,但我们仍未弄清楚如何在集中式解决方案中解决处理分析问题。时尚。 我认为,如果我们不能解决这个问题,那么立即使用IoT并迅速获得平台解决方案,我们将最终陷入非常非常糟糕的境地。
考虑到这一点,我将结束我的观点,即我认为,大数据和分析领域正在发生的最大变化之一是迫切需要对互联网的影响做出反应关于大容量和实时分析的事情,我们需要将分析移到网络中,然后最终移到网络边缘,以应对庞大的数量并进行处理。 然后,最终,有希望的是,我们在集线器和辐射模型中将情报放入网络和网络边缘,从而可以实际管理情报并实时获得见解并从中获取价值。 然后,我将传递给我们的客人,看看这次对话将我们带到何处。
肖恩·罗杰斯(Shawn Rogers):非常感谢。 我是Dell Statistica的Shawn Rogers,从一开始,我完全同意在此涉及的所有主要主题。 丽贝卡(Rebecca),您是从一个想法开始的,您知道,这些数据并不是新数据,对于我来说,花费大量的时间和精力来讨论数据,数据和IoT数据对我来说非常了不起。 当然,这是很相关的,罗宾提出了一个很好的观点,即使您做的事情非常简单,并且您每秒要接入恒温器一次,您也知道,您一天24小时都这样做,实际上,您会遇到一些有趣的数据挑战。 但是,您知道,最终–我认为行业中很多人都在谈论数据–事实并非如此有趣,就丽贝卡的观点而言,它已经存在了很长时间,但是我们过去从未能够很好地利用它。 而且我认为高级分析行业和BI行业总体上已经开始真正转向物联网。 还有Dez,最后一点,我认为这是大数据领域中具有挑战性的一部分或其中之一。 我认为每个人都对我们可以使用这种类型的数据感到非常兴奋,但是与此同时,如果我们不知道如何应用洞察力,采取行动,并且知道数据在何处进行分析,我认为我们将面临人们看不到真正挑战的挑战。
话虽如此,在高级分析领域,我们是物联网数据可能会发生的事情的忠实拥护者,特别是如果我们对其应用分析。 这张幻灯片上有很多信息,我将让大家随便逛逛,但是如果您看一看零售业等最右边的不同行业,就会发现他们有机会通过创新或拥有一些机会而产生节省成本,优化或改进流程非常重要,他们看到了很多用例。 如果您从幻灯片中从左到右看,就会看到这些行业在将分析应用于IoT时如何声称自己具有新功能和新的差异化机会。 我认为最重要的是,如果您要努力走这条路,那么您不仅要担心数据(如我们一直在讨论的那样)和体系结构,而且还必须研究如何做到最好。将分析应用于其以及需要进行分析的位置。
对于今天在电话会议中的许多人来说,您知道,Robin和我彼此认识已有很长的时间,并且在过去关于传统架构,围绕集中式数据库或企业数据仓库等的无数对话中,以及在过去十年左右的时间里,我们在扩展这些基础架构的局限性方面做得很好。 为了支持我们正在应用到信息中的所有出色分析,当然,信息还不如我们今天想要的坚定或强大,当然,信息也在破坏体系结构,数据的速度,数据的数量等绝对在将我们一些更传统的方法和策略的局限性扩展到此类工作。 因此,我认为这开始要求公司对此采取更敏捷,也许更灵活的观点,而我想这就是关于物联网方面的一些内容。
在开始之前,我将花一点时间让所有人都参与其中,为您介绍Statistica是什么以及我们的工作。 正如您在此幻灯片的标题上所看到的,Statistica是用于IoT平台的预测分析,大数据和可视化。 该产品本身已有30多年的历史了,我们可以与市场上其他您可能熟悉的领导者竞争,因为他们能够将预测分析,高级分析应用于数据。 我们看到了一个机会,可以扩大我们分析的范围,并开始研究某些技术,这使我们能够很好地利用Dez和Robin今天讨论的内容,这是一种新方法,您将在何处放置分析,以及如何将其与数据融合。 随之而来的是平台必须解决的其他问题,正如我提到的,Statistica进入市场已有很长时间了。 我们在数据融合方面非常擅长,我想,您知道,我们今天对数据访问的讨论还不够多,但是能够跨这些不同的网络访问并获得正确的数据。正确的时机对于最终用户而言变得越来越有趣和重要。
最后,我在这里再发表一点评论,因为Dez对网络本身有很好的看法,对整个环境中的分析模型具有一定程度的控制和安全性,以及它们如何将自己附加到数据上变得非常重要。 几年前,当我进入这个行业时-我认为现在已经接近20年-当我们谈论高级分析时,它是以非常有组织的方式进行的。 组织中只有几个人可以动手,他们进行了部署,并根据需要向人们提供了答案或根据需要提供了见解。 这确实在发生变化,我们看到许多人正在以一种或多种多样且更灵活的方式来访问数据,将安全性和治理应用于数据,然后能够在数据上进行协作。 这些是Dell Statistica关注的一些重要事项。
但是我想深入探讨一个与今天的标题更接近的主题,即我们应该如何处理来自物联网的数据以及在寻找不同解决方案时可能要寻找的内容。 我现在摆在您面前的幻灯片是一种传统视图,Dez和Robin都谈到了与传感器对话的想法,无论是汽车,烤面包机还是风力涡轮机或您拥有的设备,然后将数据从数据源传输到您的网络,再回到集中式配置中,就像Dez提到的那样。 而且它的网络连接非常好,许多公司最初进入IoT领域时就开始使用该模型。
如果您看一下幻灯片的底部,那么随之而来的另一件事就是这种想法:采用其他传统数据源,扩充IoT数据,然后以这种核心,无论您的核心是数据中心还是它的核心。可能不在云端,这并不重要,您可以选择Statistica之类的产品,然后在该点上应用分析,然后将这些见解正确地提供给消费者。 我认为这是目前的赌注。 这是您必须要做的,并且必须拥有足够开放的架构来使用高级分析平台,并与所有这些,各种数据源,所有这些传感器以及所有这些不同的目的地进行对话你有数据。 我认为这是您必须要做的事情,并且我认为您会发现市场中的许多领导者都能够做到这些事情是对的。 在Statistica,我们将其称为核心分析。 去获取数据,将数据带回到核心,对其进行处理,在必要或有利时添加更多数据,进行分析,然后共享该信息以采取行动或寻求见识。
因此,从功能角度来看,我认为这些当然是肯定的,我们可能都同意,这是绝对必要的,每个人都需要这样做。 它开始变得有趣的地方是您拥有大量数据的地方,正如我所提到的,这些数据来自诸如IoT传感器之类的各种数据源,无论是汽车,安全摄像机还是制造过程,都开始变得有趣起来。能够在实际生成数据的地方进行分析的一个优点。 我认为,对大多数人来说,优势是,当我们开始将分析从核心转移到边缘时,这种能力可以分散正在发生的某些数据挑战,而Dez和Robin最终可能会对此发表评论。今天,但我认为您必须能够在边缘监视数据并对其采取行动,以便不必总是将所有这些数据移至您的网络。 Robin在他绘制的体系结构图片中谈到了这一点,您拥有所有这些不同的资源,但通常都有一些聚合点。 我们经常看到的聚合点要么在传感器级别,要么在网关级别甚至更多。 在您回到核心之前,这些网关作为来自数据源的数据流中的中介存在。
Dell Statistica利用的机会之一是,我们能够从集中式高级分析平台导出模型,从而能够提取模型,然后在不同平台(如网关或内部)的边缘执行该模型。数据库或您拥有什么。 我认为,赋予我们灵活性的是今天对话的真正有趣之处是,您今天在基础架构中是否拥有这种灵活性? 您是否有能力将分析移动到数据所在的位置,而不仅仅是将数据始终移动到您的分析所在的位置? 这是Statistica一直关注的一段时间,当您仔细查看幻灯片时,您会发现我们的姊妹公司Dell Boomi还提供了其他一些技术。 Dell Boomi是云中的数据集成和应用程序集成平台,我们实际上利用Dell Boomi作为一种交易设备,将我们的模型从Dell Statistica转移到Boomi,然后转移到边缘设备。 而且我们认为这是公司将要求的一种敏捷方法,就像我在一分钟前向您展示的版本一样,这是将数据从传感器一直返回到传感器的核心思想。中心,与此同时,公司将希望能够以我在这里概述的方式做到这一点。 而且这样做的好处是Robin和Dez都提出了一些观点,即您可以做出决定并以业务发展的速度采取行动吗? 您是否可以将分析从一个地方转移到另一个地方,并能够节省自己的时间,金钱和精力以及将边缘数据不断移回核心的复杂性。
现在,我首先要说的是,某些边缘数据将始终具有足够高的价值,在这种情况下,有必要存储这些数据并将其保存并带回到您的网络中,但是哪些边缘分析将使您能够以数据实际到达的速度做出决策的能力对吗? 您能够以最快的速度应用洞察力和行动。 而且我认为,在利用高级分析和物联网数据时,我们所有人都将寻找这个东西,这是一次以业务或客户需求的速度发展的机会。 我认为我们的立场是,我认为您需要能够做到这两者。 而且我认为随着越来越多的公司(尤其是来自物联网的公司)正在研究更多样化的数据集,他们很快就会开始着眼于供应商领域并要求Statistica的能力。 就像我们传统上已经做很多年一样,这是在核心上部署模型,或者将其部署在可能不是传统的平台(例如IoT网关)上,并能够对数据进行评分和应用分析在数据产生的边缘。 我认为这就是这次对话中令人兴奋的部分。因为由于能够在数据从传感器移出时在边缘进行分析,从而使我们能够尽快采取行动,但是还可以让我们决定,这些数据是否需要立即一直返回到核心? 我们可以在这里将其批处理然后再分成几部分发送回来,以后再做进一步分析吗? 这就是我们看到的许多领先客户所做的。
Dell Statistica做到这一点的方式是我们具有利用能力,例如,您在Statistica内部构建了一个神经网络,而您想将神经网络放置在数据环境中的其他位置。 我们能够输出这些模型以及您在右上角注意到的所有语言-Java,PPML,C和SQL等,我们还包括Python,并且还能够导出脚本-当您将其从集中式平台中移出时,就可以在需要的地方部署该模型或算法。 正如我前面提到的,我们使用Dell Boomi将其放置并停放在需要运行的位置,然后我们可以将结果带回去,或者我们可以帮助带回数据或对数据进行评分并利用我们的规则引擎采取行动。 当我们开始查看此类数据并重新考虑时,所有这些事情都变得很重要。
这是大多数人在电话上需要做的事情,因为如Dez所言,将数据从这些图的左侧移至这些图的右侧时,这将变得非常昂贵并增加网络负担。时间。 听起来似乎不多,但是我们已经看到制造客户的工厂中有一万个传感器。 如果您的工厂中有一万个传感器,即使您只是第二次进行这些测试或发出信号,那么您每天谈论的是来自各个传感器的八万四千行数据。 因此数据肯定会堆积起来,Robin提到了这一点。 在前面,我提到了几个行业,我们看到人们可以使用我们的软件和IoT数据完成一些非常有趣的事情:楼宇自动化,能源,公用事业是一个非常重要的空间。 我们看到,在能源设施和自动化建筑物内,在系统优化,甚至客户服务以及整个运营和维护方面,正在进行许多工作。 这些是我们认为非常强大的用例。
我想我们是在进行术语分析之前就进行边缘分析的。 正如我提到的,我们在Statistica扎根。 该公司成立于将近30年前,因此我们让客户回溯了很长时间,他们将IoT数据与他们的分析集成在一起已经有一段时间了。 Alliant Energy是我们的用例或参考客户之一。 您可以想象能源公司在物理工厂中遇到的问题。 扩展到物理工厂的砖墙之外是困难的,因此像Alliant这样的能源公司正在寻找方法来优化其能量输出,从根本上改善其制造工艺并将其优化到最高水平。 他们使用Statistica管理其工厂内的熔炉。 对于我们回到科学课初期的所有人来说,我们都知道炉子发热量,热能产生蒸汽,涡轮旋转,我们就能获得电力。 对于像Alliant这样的公司来说,问题实际上是优化在那些大型旋风炉中加热和燃烧的方式。 并优化输出以避免污染,碳置换等额外成本。 因此,您必须能够使用所有这些设备,传感器来监控其中一个旋风炉的内部,然后获取所有这些传感器数据并不断地对能源过程进行更改。 这就是Statistica自2007年左右就开始为Alliant所做的工作,甚至在IoT这一术语还未流行之前。
就丽贝卡(Rebecca)的观点而言,数据肯定不是新数据。 处理和正确使用它的能力确实是令人兴奋的事情发生的地方。 在今天的电话会议中,我们已经讨论了一些有关医疗保健的问题,并且我们看到人们可以使用各种应用程序来执行诸如改善病人护理,预防性维护,供应链管理以及医疗保健运营效率之类的事情。 这是一个持续的过程,并且有许多不同的用例。 我们在Statistica感到自豪的一个就是与我们的客户Shire Biopharmaceuticals。 夏尔(Shire)生产用于真正难以治疗的疾病的特种药物。 当他们为客户生产一批药品时,这是一个极其昂贵的过程,而且这一极其昂贵的过程也需要时间。 当您考虑制造过程时,您会看到挑战,即统一所有数据,在将数据放入系统中的各种方式之间具有足够的灵活性,验证信息,然后能够预测我们如何帮助该客户。 而且,这些过程从我们的制造系统以及驱动这些制造系统的设备和传感器中提取了大部分信息。 对于公司如何通过结合传感器数据,物联网数据和流程中的常规数据来避免损失并优化制造流程,这是一个很好的用例。
众所周知,一个很好的例子说明了制造业(尤其是高科技制造业)围绕此类工作和数据在医疗保健行业中的优势。 我想在总结之前,还想谈谈其他几点,然后再交还给Dez和Robin。 但是您知道,我认为能够在环境中的任何地方进行分析的想法对于大多数公司而言将变得极为重要。 从源头回到中心位置,与传统的ETL-ing数据格式保持联系将始终在您的策略中占有一席之地,但它不应该是唯一的策略。 今天,您必须采取更加灵活的方法。 为了应用我提到的安全性,避免对网络造成负担,能够管理和过滤来自边缘的数据,并确定哪些数据值得长期保存,哪些数据值得转移连接到我们的网络,或者在创建数据时仅需要分析哪些数据,以便我们做出最佳决策。 这种无处不在的分析方法是Statistica十分重视的事情,也是我们非常精通的事情。 它可以追溯到我之前提到的幻灯片之一,即能够以多种语言导出模型的功能,以便它们可以与创建数据的平台匹配并对齐。 然后当然有用于这些模型的分配装置,这也是我们带来的,我们对此感到非常兴奋。 我认为今天的对话是,如果我们真的要认真对待长期存在于我们系统中的数据,并且我们想找到一个竞争优势和创新角度来利用它,那么您必须申请它提供了一些技术,可让您摆脱过去使用的某些限制性模型。
再次,我的观点是,如果您要进行物联网,我认为您必须能够做到这一点,并将数据引入并与其他数据进行匹配并进行分析。 但是同样重要的是,甚至必须更重要的是,您必须具有灵活性,才能将分析与数据放在一起,并将分析从体系结构的中央移到边缘,以获得我提到的优势。之前。 这与我们是谁以及我们在市场上正在做什么有关。 我们对物联网感到非常兴奋,我们认为物联网肯定已经成熟,每个人都有很大的机会通过这种数据来影响他们的分析和关键流程。
丽贝卡·乔兹维克(Rebecca Jozwiak):肖恩,非常感谢,那真是一个很棒的演讲。 而且我知道Dez可能很想问您几个问题,所以Dez,我会让您先走。
Dez Blanchfield:我有100万个问题,但我会控制住自己,因为我知道Robin也有问题。 我所看到的事情之一是广泛存在的一个问题,鉴于您对事物的正确理解,我真的很想对您的经验有所了解。 组织正在努力应对挑战,其中一些组织刚刚阅读了克劳斯·施瓦布(Klaus Schwab)的“第四次工业革命”之类的文章,然后就受到了恐慌。 那些不熟悉这本书的人,基本上是先生们的见解,我认为是克劳斯·施瓦布(Klaus Schwab),他是教授,从记忆中是世界经济论坛的创始人兼执行主席,而这本书实质上是关于整个无处不在的物联网爆炸,并对整个世界产生了一些影响。 我正在与之交谈的组织不确定他们应该去改造当前环境还是投资于建设所有新环境,基础架构和平台。 同样在Dell Statistica中,您是否看到人们在改造当前环境并将平台部署到现有的基础架构中,还是看到他们将重点转移到构建所有新的基础架构并为此次洪水做准备?
肖恩·罗杰斯(Shawn Rogers):您知道,我们有机会为这两种类型的客户提供服务,只要我们有机会进入市场,您就可以得到这些机会以扩大范围。 我们的客户在过去几年中创建了崭新的晶圆厂,并在整个过程中为他们配备了传感器数据,物联网,从端到端的分析。 但是我不得不说,我们的大多数客户都是从事此类工作一段时间但被迫忽略这些数据的人。 您知道吗,丽贝卡(Rebecca)提出了直截了当的要点-这不是新数据,很长一段时间以来,这类信息已经以多种不同格式提供,但是问题出在哪里,移动它,将它带到可以用它完成一些聪明的事情的地方。
因此,我要说的是,我们的大多数客户都在关注他们今天所拥有的东西,而Dez,您之前已经指出了这一点,这是大数据革命的一部分,我认为真正的意义是,这就是全部数据革命,对不对? 我们不再需要忽略某些系统数据,制造数据或楼宇自动化数据,我们现在拥有合适的玩具和工具来获取数据,然后使用它进行智能处理。 而且我认为在这个领域中有许多驱动程序正在使之成为现实,其中一些是技术性的。 您知道,诸如Hadoop等大数据基础架构解决方案使它的成本降低了一些,并且使我们中的一些人更容易考虑创建这种信息类型的数据湖。 现在,我们正在环顾企业,“嘿,我们在制造过程中有了分析,但是如果我们可以从这些过程中添加一些见识,它们会得到增强吗?”我想,这就是大多数我们的客户正在做。 它不是从头开始创建,而是通过使用新数据来增强和优化他们已经拥有的分析。
Dez Blanchfield:是的,在我们已经看到的一些最大的行业中,发生了一些令人兴奋的事情,而您提到的是电力和公用事业。 航空业正经历着这一繁荣时期,我一直在谈论的我一直以来最喜欢的设备之一,即波音787梦幻客机,当然还有与空中客车相当的A330,都沿着同样的路线走了。 787首次发布时,大约有六千个传感器,而我认为他们现在正在谈论新版本中的一万五千个传感器。 与那个世界上的某些人交谈的奇怪之处在于,将传感器置于机翼之类的想法,而在设计平台中有关787的奇妙之处在于,他们重新发明了那个飞机。 例如,像机翼一样,当飞机起飞时,机翼弯曲最多十二米半。 但在极端情况下,机翼可在最高25米的尖端弯曲。 这东西看起来像鸟拍打。 但是他们没有时间来解决所有这些数据的分析工程,因此他们拥有的传感器可以使LED在发生某些不良事件时呈绿色和红色闪烁,但实际上并没有得到深入的了解。即时的。 而且他们也没有解决如何移动数据量的问题,因为在美国国内领空每天有87, 400个航班。 当每架飞机赶上购买787 Dreamliner飞机时,一天的数据量为43 PB,因为这些飞机目前每架飞机都产生约TB的数据。 而且,如果您每天在美国国内乘搭87, 400个航班乘以五或半TB,则最终将获得43.5 PB的数据。 我们实际上无法解决这个问题。 因此,根据设计,我们必须将分析推入设备。
但是,当我查看整个体系结构时,有趣的一件事是-我渴望看到您对此有何看法-是我们已经朝着主数据管理,某种数据管理的首要原则,一切都放在一个中心位置。 我们有数据湖,然后,如果您愿意,我们创建少量数据池,提取我们要进行分析的数据池,但是通过分布到边缘,这是不断出现的事情之一,特别是来自数据库人员和数据经理的事情或从事信息管理业务的人,当我有许多分布式的小型微型数据湖时会发生什么? 在您的解决方案中,关于边缘分析的思维方式已经应用了哪些东西,传统上,一切都会集中在数据湖中,现在我们到处都是这些小小的水坑,即使我们可以在本地对其进行分析以获得一些本地见解,拥有分布式数据集,尤其是当您获得数据湖和分布式区域的缩影时,您面临着哪些挑战以及如何解决这些挑战?
肖恩·罗杰斯(Shawn Rogers):好吧,我认为这是挑战之一,对吗? 当我们离开时,您知道将所有数据运回中心位置或我提供的核心分析示例,然后我们进行了分布式版本,就是您最终会遇到所有这些小孤岛,对吗? 正如您所描绘的,对不对? 他们正在做一些工作,正在运行一些分析,但是如何将它们重新组合在一起? 我认为关键是协调所有流程,我想你们会同意我的观点,但是如果您不同意,我会很高兴,我认为我们一直在关注这种演变一段时间
可以追溯到我们的朋友Inmon先生和Kimball先生的时代,他们曾帮助每个人进行早期数据仓库投资的体系结构,其意义在于,我们离开这种集中式模型已有很长时间了。 我们采用了这种新思路,即允许数据展示其在生态系统中最佳位置的引力,并将数据与可能的最佳平台对齐以获得最佳结果。 我认为,我们已经开始花一些时间对我们的生态系统进行更精心设计,将其作为一种总体的处理方式,就像我们试图同时调整所有这些部分的方式一样。 我要对数据进行哪种类型的分析或工作,它是什么类型的数据,这将有助于指示应将数据存放在何处。 它在哪里产生,数据具有哪种重力类型?
您知道,我们看到了很多这样的大数据示例,其中的人们正在谈论拥有10 PB和15 PB的数据湖。 好吧,如果您有这么大的数据湖,那么移动它是非常不切实际的,因此您必须能够对其进行分析。 但是,当您这样做时,对于您的问题的核心,我认为这给每个人协调环境,应用治理和安全性以及理解对数据进行整理和处理需要采取的新挑战。从中获得最高价值。 坦白地说-我很想在这里听听您的意见-我认为我们现在还很早,而且我认为还有很多工作要做。 我认为像Statistica这样的程序正在致力于使更多人访问数据。 我们绝对专注于这些新角色,例如公民数据科学家,他们希望将预测性分析带到组织中以前可能没有的地方。 我认为这只是解决此问题的早期阶段,但我认为成熟度将必须证明这些平台之间的高级协调或协调,并了解它们上的内容以及原因。 对于我们所有数据人员来说,这都是一个古老的问题。
Dez Blanchfield:的确如此,我完全同意您的看法,我认为我们今天在这里听到的最重要的事情至少是在边缘网关级别实际捕获数据的问题的前端。现在已经基本解决了网络连接问题以及当时进行分析的能力。 现在,它使我们解放出来,可以真正开始思考下一个挑战,即分布式数据湖。 非常感谢您,这是一个很棒的演示。 我非常感谢有机会与您聊天。
我现在要传给罗宾,因为我知道他有,而在罗宾之后,丽贝卡也从听众中得到了一长串的重要问题。 罗宾?
罗宾·布洛尔博士:好的。 肖恩,我想请您多说一点,我不是想给您做广告的机会,但这实际上非常重要。 我有兴趣知道Statistica在什么时间实际产生了模型导出功能。 但是我也想对Boomi谈一谈,因为到目前为止,您对Boomi所说的只是ETL,而且确实是ETL。 但这实际上是功能强大的ETL,对于我们正在谈论的时间安排以及我们在此处讨论的某些情况,这是非常重要的事情。 你能为我讲这两件事吗?
肖恩·罗杰斯(Shawn Rogers):是的,我绝对可以。 您知道,我们在这个方向上的运动肯定是反复进行的,这是一个逐步的过程。 我们正准备在下周发布Statistica的13.2版。 它具有我们今天讨论的所有功能的最新更新。 但是回到一年前的10版,我们宣布了从平台导出模型的功能,当时我们将其称为NDAA。 首字母缩写词代表本机分布式分析体系结构。 我们所做的是,我们投入大量时间,精力并专注于开放我们的平台,并有机会将其用作高级分析的中央命令中心,并从那里进行部署。 首先,我们部署了Robin,这对围绕机器学习的平台做出了非常非常重要的贡献。 因此,我们有能力从Statistica部署到Microsoft的Azure云,以利用Azure的力量来推动机器学习,这是非常密集的,并且是利用云技术的好方法。 因此,这是第一位。
现在,在这里我们将模型导出到Azure,并使用Azure运行它们,然后将数据或结果发送回Statistica平台。 然后,我们转到了我们希望能够从中导出的其他语言,当然其中之一就是Java,这为我们打开了大门,现在我们开始将模型导出到Hadoop等其他位置,因此,我们也在那里玩。
最后,我们专注于能够将具有该版本的模型输出到数据库中。 所以这是第一次迭代,老实说,最终的游戏是物联网,但去年10月的第13版还远远不够。 从那以后,我们到达了那里,这与我刚才提到的所有事情的能力有关,但是又有了某种运输工具。 回到Dez的问题,您知道,挑战是什么?当所有这些分析都在运行时,我们如何做到这一点? 好吧,我们将Boomi用作一种分发中心,因此,因为它在云中并且功能如此强大,正如我之前提到的,它是一个数据集成平台,但它也是一个应用程序集成平台,并且它使用JVM允许我们在可以登陆Java虚拟机的任何地方停放并工作。 这确实为所有这些网关,边缘计算平台和边缘服务器打开了大门,因为它们所有人都具有可在其中运行JVM的计算和平台。而且由于我们可以在任何地方运行JVM,因此Boomi已经转变为可以说是一个很棒的发行版,并且使用我之前的话说,是一个编排设备。
这一点变得非常重要,因为我们知道,一分钟前的飞机场景非常好,而且我提到,就像夏尔这样的制造商,他们在一个工厂中有一万个传感器,必须在某个时候开始解决那种用于高级分析的集中方法。 临时保留它已不再有效。 过去,当我们运行的模型和算法的数量最小时,现在是最大。 一个组织中有成千上万的人。 因此,我们拥有的平台的一部分是基于服务器的,当您拥有企业软件时,您还可以在整个环境中进行调整,评分和管理模型。 这也是业务流程的一部分。 我们需要有一层Robin,它不仅可以让您首先获得一个模型,而且还为您提供了一个调整模型的渠道,可以根据需要不断地对其进行替换,因为这不是您可以手动执行的操作。 您无法使用拇指驱动器在精炼厂四处走动,尝试将模型上传到网关。 您必须在两者之间具有运输和管理系统,因此Statistica和Boomi的组合可以为我们的客户提供服务。
罗宾·布洛尔博士:是的。 好吧,我会很简短,但是,您知道,这是关于数据湖以及在任何给定位置累积PB的想法以及它具有引力这一事实之前所做的声明。 您知道,当您开始谈论编排时,它才开始让我想到一个非常简单的事实,那就是,将一个非常大的数据湖放在一个地方可能意味着您实际上必须对其进行备份,并且这可能意味着无论如何,您都必须移动大量数据。 我认为无论如何,真实的数据体系结构还远远超出了您所谈论的方向。 我想说的是将其分发到明智的地方。 看来您具有执行此操作的强大功能。 我的意思是,我对Boomi的介绍很清楚,所以我可以看到它,或者某种程度上听众看不到,这在某种程度上几乎是不公平的。 但是在我看来,Boomi至关重要,因为它具有应用程序功能。 而且还因为事情的真相是,如果您不希望出于某种原因而在某处采取某些行动,就不要进行这些分析计算。 Boomi参与其中,对吧?
肖恩·罗杰斯(Shawn Rogers):是的,绝对如此。 正如您从以前的对话中所了解的那样,Statistica中拥有完善的业务规则引擎。 我认为当我们深入了解为什么要这么做时,这一点非常重要。 您知道,我曾开玩笑说,除非您要分析,利用数据做出更好的决策或采取行动,否则根本没有理由进行物联网。 因此,我们关注的不仅是能够将模型放到那里,还能够连同它一起标记规则集。 而且由于Boomi在将事物从一个地方移动到另一个地方的能力如此强大,因此我们还可以嵌入触发,警报和采取行动的能力。
这样一来,我们便开始获得这种复杂的物联网数据视图,我们说:“好的,这些数据值得聆听。”但实际上,您知道,知道“灯亮着,灯亮着,灯熄灭,烟雾探测器熄灭或制造过程中发生的任何情况超出规格时,都没有那么有趣。 发生这种情况时,我们希望能够立即采取行动。 此时,此处的数据几乎成为辅助数据。 因为保存所有这些信息并不重要,所以“没关系,没关系,就可以”信号,重要的是我们注意到“嘿,这很糟糕”,我们立即采取了行动。 无论是向某人发送电子邮件,还是我们可以让您的领域专家参与其中,或者我们是否启动了一系列其他流程以立即采取行动,无论是纠正措施还是对信息的响应。 我认为这就是为什么您必须对此有这种协调的看法。 您不能只专注于在各地处理算法。 您必须能够协调和协调他们。 您需要能够看到他们的表现。 实际上,最重要的是,我的意思是,如果您不能增加机会对数据立即采取行动,那么为什么要这么做呢?
Robin Bloor博士:好的,Rebecca,我相信您有观众提出的问题吗?
丽贝卡·乔兹维克(Rebecca Jozwiak):我愿意。 我有很多观众提问。 肖恩,我知道您不想在小时结束后停留太久。 你怎么看?
肖恩·罗杰斯(Shawn Rogers):我很高兴。 前进。 我可以回答几个。
丽贝卡·乔兹维克(Rebecca Jozwiak):让我们看看。 我知道您提到的一件事是,物联网尚处于初期阶段,它确实具有一定的成熟度,这在某种程度上说明了与会者提出的这个问题。 IPv6框架是否将足够健壮以适应未来五到十年的物联网增长?
肖恩·罗杰斯(Shawn Rogers):哦,我会让Dez回应我的回答,因为我认为他离我更接近这种信息。 但是我一直认为我们处在一个非常快的轨道上,可以弯曲和破坏我们现有的大多数框架。 尽管我认为添加新的规范或IPv6框架的发展方向很重要,但这为我们拥有更多设备并能够提供我们所需要的一切打开了大门想提供一个地址。 我认为我正在与客户一起阅读和查看的所有内容以及所需地址的数量,我认为在某个时候会导致这种情况发生另一种变化。 但是我并不是真正的网络专家,所以我不能百分百地说我们会在某个时候打破它。 但是我的经验告诉我,我们将在某个时候破坏该模型。
丽贝卡·乔兹维克(Rebecca Jozwiak):我不会感到惊讶。 我认为框架在各种事物的压力下都是突破性的。 那只是合乎逻辑的,对吗? 我的意思是,您无法使用打字机发送电子邮件。 另一位与会者问:“您可以使用Hadoop框架吗?”但是我想我可能会改变,说您将如何使用Hadoop框架进行分布式分析?
肖恩·罗杰斯(Shawn Rogers):好吧,罗宾(Robin)帮我问了一个历史问题,因此自大约一年前的Statistica版本13开始,我们就能够将模型从系统中移出并进入Hadoop。 而且,我们与Hadoop的所有主要版本都紧密合作。 关于使用Cloudera作为我们合作的主要Hadoop发行版之一的能力,我们确实取得了巨大的成功案例。 但是,因为我们可以用Java输出,所以它使我们能够打开并将分析放置在任何地方。 对于我们的许多客户,我们通常将其放置到Hadoop集群中,这是日常工作,日常工作和日常工作。 简短的答案是肯定的。
丽贝卡·乔兹维克(Rebecca Jozwiak):很好 。 我将再向您抛出一个假期,让您度过一个快乐的假期。 另一位与会者在问,通过物联网分析和机器学习,您是否认为所有数据都需要出于历史目的进行存储,这将如何影响解决方案架构?
肖恩·罗杰斯(Shawn Rogers):好吧,我认为不必存储所有数据。 但是我确实认为,具有娱乐能力,聆听我们希望在组织内任何来源的任何数据源的能力都是非常有趣的。 而且我确实认为,过去几年中我们在市场上看到的变化使我们能够采用全数据方法进行处理,这似乎确实是有回报的。 但是对于每个公司和每个用例来说,情况都会有所不同。 您知道,当我们查看健康数据时,现在有很多监管问题,很多合规性问题需要关注,这使我们保存了其他公司可能不明白为什么需要保存数据的数据,对吧。 ? 在制造过程中,对于我们的许多制造客户来说,能够历史地检查您的过程并能够回顾大量的数据以从中学习并从中建立更好的模型是一个真正的优势。
我确实认为需要保留许多数据,而且我确实认为我们拥有的解决方案可以使今天的数据更加经济和可扩展。 但与此同时,我认为每家公司都会在不必保持原子级的数据中找到价值,但他们希望以实时的方式进行分析并做出决策,以推动创新他们的公司。
丽贝卡·乔兹维克(Rebecca Jozwiak):好的。 不,听众,我今天没有解决每个人的问题,但是我会将它们转发给肖恩,以便他可以直接与您联系并回答这些问题。 但是,谢谢大家的参与。 非常感谢Dell Statistica的Shawn Rogers以及我们所有分析师Dez Blanchfield和Robin Bloor博士。 您可以在Insideanalysis.com的SlideShare上找到存档,我们已经开始将内容重新存储在此处,并且我们也在对YouTube进行改进,因此也请在此处查找。 非常感谢大家。 因此,我将告别您,我们下次再见。