音讯 将分析嵌入到任何地方:使公民数据科学家能够工作

将分析嵌入到任何地方:使公民数据科学家能够工作

Anonim

通过Techopedia Staff,2016年8月25日

要点:主持人丽贝卡·乔兹维克(Rebecca Jozwiak)与Robin Bloor博士,Dez Blanchfield和David Sweenor讨论了嵌入式分析和公民数据科学家的现象。

您必须注册此事件才能观看视频。 注册以观看视频。

丽贝卡·乔兹维克(Rebecca Jozwiak):女士们,先生们,您好,欢迎来到Hot Technologies。 今天,我们的主题是“无处不在的嵌入:使公民数据科学家成为可能”。 我正在为您的通常的主持人进行填写,这是Rebecca Jozwiak为Eric Kavanagh进行的填写。 是的,今年很热。 尤其是“数据科学家”一词得到了广泛的关注,尽管我们曾经称它们为“统计员”或“分析专家”之类的无聊名字,几乎解决了相同类型的活动,但它有了一个性感的新名字,而且引起了很多关注。 他们非常希望在工作场所拥有对组织有益的人人都想要一个。 但是它们是:1)昂贵,2)很难找到。 您知道,关于数据科学家技能短缺的消息已经遍地开花,是的,但是它们仍然为组织提供了巨大的价值,人们都热衷于寻找如何在不降低成本的情况下获得该价值。说话。

但是好消息是,我们看到出现了可以弥补这种短缺的工具和软件。 我们拥有自动化,机器学习,嵌入式分析功能,这就是我们今天要学习的内容,这是一个新名词“公民数据科学家”的产生,这意味着什么? 不,不是您受过训练的数据科学家,它可能是您的业务用户,您的BI专家,来自IT的人员,具有背景但不一定具有专业知识的人员。 但是,这些工具和软件的作用是,即使他们可能不了解深度编码,它也使更多的人可以使用这些智能解决方案。 但是,当您使每个人都可以更多地使用该分析思想时,它只会帮助整体提高性能。 您不必一定要经过培训就可以具有好奇心,这种好奇心可以为您的公司带来良好的见解。

今天与我们讨论的是我们自己的Bloor Group首席分析师Robin Bloor,一位难以捉摸的数据科学家本人Dez Blanchfield来访,然后我们将邀请Dell Statistica的David Sweenor今天为我们做一个演讲。 然后,我将其传递给Robin Bloor。

Robin Boor:好的,谢谢您的介绍。 我在历史背景下对此有所考虑。 我们实际上在这里看到的是达芬奇(Leonardo da Vinci)设计的一种滑翔机,该滑翔机可以由人背负。 我不知道它是否真的有效。 我不得不说,我不会参加。 但是,达芬奇,每当我想到达芬奇时,我都会把他视为有史以来最好奇和最分析的人之一。 很显然,如果您只看那只滑翔机是基于鸟的翅膀而设计的,他就已经以某种方式研究了鸟的飞行以建造它。

如果我们从历史的角度来看-我实际上是在看-分析可能是最古老的数学应用。 有些普查至少可以追溯到巴比伦时代。 我们知道这一点,因为基本上有一些楔形文字的平板电脑具有类似的数据。 不知道是否有任何更早的东西。 但是显而易见的是,您已经拥有了一个人口众多的文明,它实际上需要进行计划,并且有必要知道您正在计划什么以及这些人的实际需求是什么。

那是它的起点,也是计算的起点,因为我认为早期的计算机,早期的机械计算机实际上是,我认为第一个是Hollerith创建的普查,我相信它是IBM。 所有这些都向前发展。 也许是在1970年代与当今之间存在某种插曲,在这里,您可以说还有大量其他应用程序和分析方法都处于次要地位。 是的,分析一直在进行-它发生在大型组织中,特别是在银行和保险公司中,实际上是在通用电气和电信公司之类的公司-但是它并没有在整个企业中普遍使用,现在它开始在整个企业中广泛使用。商业。 确实改变了比赛。 我想引起我注意的第一件事是我特别喜欢的数据金字塔。 我的意思是,这是我20年前(至少20年前)的其中之一来尝试并了解,实际上,当时我正试图了解BI和正在进行的一些早期数据挖掘。 我在这里定义的是数据的概念,示例包括信号,测量,记录,事件,交易,计算,汇总,单个信息点。 您可能将它们视为信息分子,但它们是各个要点。 它一获得上下文便成为信息。 链接的数据,结构化的数据,数据库,数据的可视化,绘图仪,设计器和本体–它们在我看来都可以视为信息,因为您所做的事情汇集了很多种类,并创造了比数据点更多的东西,实际上具有形状,数学形状的东西。

除此之外,我们拥有知识。 通过检查信息,我们可以了解到存在各种模式,并且可以通过制定规则,政策,准则,程序来利用这些模式,然后采取知识的形式。 几乎所有的计算机程序,无论它们在做什么,都是一种知识,因为它们正在处理数据并将规则应用于数据。 我们具有这三层,并且在这三层之间不断进行改进。 在此图的左侧,您将看到输入的新数据,因此,其中许多事情都是静态的。 数据在累积,信息在累积,知识正在潜在增长。 在顶部,我们有“理解”,尽管这是一种哲学观点,但我会坚持认为,理解只存在于人类中。 如果我错了,那么我们将在某个时间点被计算机取代。 但是除了辩论之外,我将继续下一张幻灯片。

当我查看此内容时,有趣的事情是最近发生的事情,有趣的事情是尝试弄清楚分析实际上是什么。 最终,通过绘制各种图表并最终得到一个看起来像这样的图表,我得出了一个结论,实际上,分析开发实际上只是具有大量数学公式的软件开发。 从实际意义上讲,您将采用许多不同的模型并对它们进行研究以产生有关数据的新知识,因此分析性探索与软件开发有所不同。 但是一旦生成了它,它就会以我认为是被动的决策支持的方式实现,即信息只是反馈给用户。 交互式决策支持,例如OLAP,其中为用户提供了结构化的数据集,他们可以使用各种可用工具自行调查和推断事物。 很多可视化就是这样。 然后,如果您可以将收集到的一些分析见解转化为可以实施的规则,那么我们就具有自动化功能,您不一定需要参与其中。 这是我完成所有操作时所看的那种方式。 我开始发生各种事情。 我们可以说,一旦一个活动领域被实际挖掘,彻底挖掘,从各个可能的方向进行了全面探索,最终它就变成了明确的BI。 发明的知识开始变成以各种方式通知各种用户的知识,并希望增强他们实际完成其工作的能力。

我注意到的一件事是,我已经对预测分析进行了大约5年的研究,但是预测分析正在成为BI,就某种意义而言,预测分析正变成有用的信息以供人们使用,正如我已经指出的那样,有自动化的BI报告,BI探索性,BI,不同的等级以及预测分析实际上在所有三个方向上进行。 我所指出的分析过程与软件开发没有什么不同,只是由具有不同技能的不同人员完成的。 我想我应该强调,要成为一名真正的数据科学家,需要花费数年的时间才能获得所需的技能。 他们不是很容易获得,并且不是很多人都能做到的,但这是因为它涉及到非常复杂的水平的数学理解,以便知道什么是有效的,什么是无效的。 分析技术的发展,新知识的发现,分析的植入,是关于使知识可操作的。 我在整个分析中看到的就是这种背景。 这是一个很大的领域,涉及到很多很多方面,但是我认为一般性适用于所有事物。

然后就是业务中断,正如我提到的那样,有许多组织(制药公司是另一个组织),它们的DNA中已经有了分析。 但是,有许多组织确实在其DNA中根本没有它,现在他们有能力,现在软件和硬件比以前便宜得多,现在他们有能力利用它。 我会说很多话。 首先,分析在很多情况下是研发。 您可能只是将分析应用于组织的特定区域,而您似乎正以一种或另一种方式从各种角度再次分析客户订单,并将其与其他数据结合在一起,这似乎很平常。 但是,分析实际上使人们有可能查看整个组织,并几乎分析组织内和整个活动链中正在进行的任何特定活动。 但是,一旦您真正进入该领域,我将坚持认为这是研究与开发。 有人问过我一个问题,那就是“一家公司应该在分析上花费多少?”,我认为思考这一问题的最佳方法就是将分析视为研发,然后问:“您会在业务效率方面花费多少研发费用?”

而那些没有进行分析的企业,还有很多他们不知道的事情。 首先,他们不知道该怎么做。 通常,如果他们实际上是在组织内采用一种方法或另一种方法来进行分析,那么他们几乎别无选择,只能去咨询公司来协助他们这样做,因为对于大多数人来说这是不可能的或非常困难的企业实际上聘请了一位数据科学家,找到了一个,付了钱,并实际上信任他们做您想要他们做的事。 非常困难。 大多数企业不知道如何雇用或教育员工实际完成这项工作,其原因仅仅是因为它不在他们的DNA中,所以它不是其自然业务流程的一部分。 这将馈入下一点。 他们不知道如何使其成为业务流程。 顺便说一句,做到这一点的最佳方法是复制制药公司和保险公司的内容,而卫生保健中心的一些公司则只是查看他们使用分析的方式并进行复制。 因为这是一个业务流程。 不知道如何管理它或对其进行审核。 确实如此,尤其是在现在有许多软件公司已创建可自动执行大量分析的产品的情况下。 审计的意义很重要,当您有一家咨询公司或某人可以信任地了解任何分析计算的结果是什么时,这是您必须做出的选择,但是如果您将真正强大的分析工具放入其中在没有正确理解分析的人的手中,他们可能会得出不正确的结论。 正如我所说,公司不知道如何为此做预算。

这些是分析的形式,我将逐一介绍。 统计分析和统计建模与预测分析显着不同,顺便说一下,大多数分析都是曲线拟合。 机器学习与那些东西不同,路径分析和时间序列基本上在状态流上完成,这又有所不同。 图形分析又一次不同,文本分析和语义分析又一次不同。 这只是指出这是一个非常多体裁的事情。 不是,您不开始进行分析,而是开始研究存在的问题,并寻找适合这些问题的各种工具和各种分析方法。 最后是网。 由于硬件和软件的发展,我认为分析还处于起步阶段。 未来还有很多,我们将在未来几年中看到它的发展。 我想我现在可以将球传给Dez。

Dez Blanchfield:是的,Robin,谈到要采取的艰难行动。 我将从我最喜欢的一个角度(人的角度)简要地访问该主题。 我们的日常生活发生了许多变化。 我认为,目前对我们日常生活的最大破坏之一就是日常工作。 开始工作并尝试去做您要雇用的工作,人们越来越期望您从一个普通人变成一个超级英雄,以及在组织中流动并非常迅速地散发的大量信息,这是一个巨大的挑战,越来越多的我们必须为人们提供越来越好的工具,以尝试应对知识和信息流,所以我想我会尝试从一个有趣的角度来解决这个问题。 但是,这总是让我感到震惊的是,我们如何拥有这种高尚的头脑或快闪族,等等,这驱使我们朝着我们所谓的分析学方向前进,但实际上,我们在谈论的是使人们可以获取信息,并且让他们与之互动并以一种自然且感觉正常的方式进行。

实际上,它让我想起了一个YouTube视频,其中有一个年幼的婴儿坐在地板上,正坐在那里玩iPad,它四处张扬,挤压,挤压和移出图像并在屏幕上玩,那里的数据。 然后,父母将iPad带走,并在孩子的膝盖上放了杂志,印刷杂志。 这个孩子大概不超过两岁。 孩子开始尝试用弹匣的屏幕滑动,然后捏和挤,弹匣没有反应。 孩子举起手指看着它,然后想,“嗯,我不认为我的手指在工作。”然后戳在手臂上,然后想,“啊,我的手指在工作,我能感觉到我的手臂,看起来不错。”它缠绕手指,手指缠绕并做出响应。 是。 然后,它尝试再次与杂志互动,并低调查看它不会挤压,挤压和滚动。 然后他们拿走杂志,将iPad放回原处,突然之间事情就解决了。 因此,这是一个婴儿,她经过训练并接受了使用分析工具或实时流媒体工具进行娱乐的培训,但无法弄清楚杂志的工作方式和翻页方式。

这本身就是一个有趣的概念。 但是,当我考虑到知识在组织中的传播,数据的流动方式以及人们的行为方式时,我常常会想到人们已经学会了如何成为暴民的概念,这是事件的发生以及社交媒体的作用这甚至更容易做到,这个主意就是在这个时间,日期和动作去这个地方,或者是录像和学习这些舞蹈,或者戴上这个彩色的帽子,并在1点钟指向北。 然后,您通过网络将其推送出去,无数人的总人数,数百人,同时出现在同一地点,做同样的事情,这就是令人惊讶的因素,例如,“圣牛,那是但这实际上是一个非常简单的想法,并且通过我们的网络推出了一个简单的概念,我们得到了这个结果,这在视觉上令人震惊,并且在听觉上令人印象深刻。 当您考虑一个组织,我们希望人们的行为方式以及我们希望他们与信息系统和客户打交道的方式时,通常就是这么简单,这是我们试图通过的观念,概念或文化或行为特征通过工具和信息并赋予其权力。

而这就是我在过去两个半个世纪中一直拥有的这一口头禅,也就是说,如果您的员工找不到他们需要做的工作,无论是工具还是信息,他们总是会重新发明轮子。 因此,现在这是一个越来越大的挑战,在这里我们拥有大量的知识,大量的信息和事物正在快速发展,我们希望阻止人们重新发明轮子。 当我们想到工作环境时,回到人的角度,这是我的最爱之一,当我惊讶于隔间不是一个有利于取得良好成果的环境时,我感到惊讶,或者我们像这样恐怖地排队图片在这里,并没有太大变化,只是放下墙壁,称它们为开放的工作空间。 但是在中间环绕着黄色环的中间,有两个人在交换知识。 但是,如果您看着房间的其余部分,他们都坐在那儿尽职尽责地跳来跳去,将信息放到屏幕上。 而且经常不是真正地交换知识和数据,这有很多原因。 但是,在黄色圆圈左侧楼层中间的互动中,有两个人在那儿聊天,交换知识,可能试图寻找一些东西,试图说:“您知道这份报告在哪里吗,我在哪里?可以找到这些数据,我用什么工具来做这件事?”它可能没有用,所以他们一无所有,在地板上四处游荡,打破了隔间办公室的规则,亲自去做。

我们在办公室周围也有类似的环境,我们开玩笑地嘲笑它,但事实是它们非常强大和有效。 我最喜欢的平台之一是移动式或固定式分析平台,称为饮水机,人们在那里站着聊天,交流知识,在站在饮水机时比较想法并进行分析,交换想法。 当您考虑它们时,它们是非常强大的概念。 而且,如果您可以将它们转换为系统和工具,那么您将获得惊人的结果。 而且,我们一直以来都非常喜欢它,这实际上是办公室最强大的数据分发中心,也称为接待台。 如果找不到,您要去哪里? 好吧,您走到办公室的最前面,然后去接待处说:“您知道x,y,z在哪里吗?”我敢于告诉我,他们至少一次都没有这样做过。工作或某个时候他们找不到东西的时候。 而且您必须问自己,为什么会这样? 它应该在Intranet上的某个位置或某个工具之类的地方。 它应该很容易找到。

因此,在数据和分析以及我们为员工提供的工作和人与工作互动方式的工具方面,我认为在最近出现分析工具和大数据平台之前或“数据处理”,也就是过去所说的那样,报告和知识共享远非动态,协作或开放,而当您想到我们希望人们使用其工作的系统类型时,我们会感到经典人们现在称遗产为遗产,但现实是,这只是遗留下来的遗产,今天仍然存在,因此并不是真正的遗产。 但是传统的HR系统和ERP系统–人力资源管理,企业资源计划,企业数据管理,以及我们用来管理信息以运营公司的系统。 它总是孤岛。 从顶端开始,简单的平台(例如部门内部网)尝试交流事物的位置,获取方式以及与周围知识的交互方式。 我们将其弹出到我们的Intranet上。 它只是和那些花费时间和精力将其放置在那里的人一样好,否则它就会落在您的脑海中。 或者,您的数据始终位于食物链的底部,企业SAN以及它们之间的所有内容,因此存储区域网络中充满了文件和数据,但谁知道在哪里找到它。

通常,我们已经建立了这些封闭的数据平台或封闭的系统,因此人们已经恢复使用电子表格和PowerPoint之类的工具来在周围传递信息。 但是,在我看来,最近发生了一件有趣的事情,那就是移动设备和互联网通常都可以使事情实际上变得更好。 并主要在消费者领域。 有趣的是,我们日常生活中开始有了互联网银行之类的东西。 我们不必亲自去实际银行与他们互动,我们可以通过电话进行。 最初是笨拙的,但是后来互联网出现了,我们有了一个网站。 您知道吗,您最近实际去过银行几次? 我实际上不能,前几天我对此进行了交谈,实际上我不记得上次去银行的时间,这让我感到非常震惊,我以为我一定能记得这一点,但是时间太长了以前我真的不记得我什么时候去过那里。 因此,我们现在以手机,手机,平板电脑和笔记本电脑的形式拥有这些小工具,我们拥有网络并可以使用工具和系统,并且在消费者空间中我们了解到情况可以变得更好,但是因为消费者空间的快速变化(企业和环境内部发生了更多的令人不快和冰冷的变化),我们并不总是将这种变化应用于日常工作中。

我喜欢取笑这个事实,即您无法将流数据实时复制到硬拷贝中。 在此图中,一个人坐在那里看正在执行的分析,并且有一张漂亮的图表是由某人制作的,该人可能以统计学家或精算师的身价获得了很多钱,而他们坐在那里试图做在硬拷贝上进行分析并对其进行戳戳。 但是,这对我来说是一件令人恐惧的事情:例如,这些人在此会议室中,我将以此为例,他们正在与历史数据进行交互。 从制作和打印该东西开始,它就已经很古老了,所以也许是一个星期的报告。 现在,他们正在对坏数据的决策不是很多,而是对旧数据的决策,而这些旧数据始终都是坏数据。 他们今天根据历史来做出决定,这是一个非常糟糕的地方。 我们设法在平板电脑和手机等设备上取代了这种硬拷贝,因为我们在消费者领域非常迅速地进行了工作,而现在我们已经在企业领域进行了工作,即洞察力是实时价值。

而且我们在这方面越来越好。 这使我想起了罗宾(Robin)较早提出的观点,即公民数据科学家的概念及其驱动力。 对我来说,一位公民数据科学家只是普通人,他们拥有像iPad这样的正确工具和信息。 他们不必做数学,他们不必知道算法,他们不必知道如何应用算法和规则数据,他们只需要知道如何使用接口即可。 这使我回到了我的介绍以及幼儿坐在那里与iPad,杂志和iPad的概念。 幼儿可以非常快速,直观地学习如何使用iPad的界面来深入了解信息并与之交互,尽管可能是游戏,流媒体或视频。 但是它无法从杂志栏获得相同的响应或交互,只是一页一页地闪烁,这并不是很吸引人,特别是如果您是随iPad​​成长的幼儿。 只要我们提供工具,并为他们提供诸如移动设备(尤其是具有足够大屏幕的平板电脑和智能手机)之类的界面,人们总是可以很快地观察和学习如何驱动工具和事物。通过手指的动作触摸它们,突然间您就得到了公民数据科学家的概念。

可以使用正确的工具来应用数据科学,但又不必真正知道如何做的人。 正如我所说,在我看来,其中很大一部分是受到消费者影响力的驱动,并逐渐转变为需求和企业。 几个非常简单的例子。 我们,我们中的许多人将开始使用我们的博客和网站来做事,例如投放小广告或查看跟踪和移动,我们使用了Google Analytics(分析)之类的工具,我们被一个博客和小型网站所困扰,我们可以在其中添加少量代码,而Google会为我们提供实时洞察力,以了解谁在何时,何地以及如何访问该网站。 实时地,我们实际上可以看到人们访问该网站,浏览页面然后消失。 这真是令人惊讶。 我仍然喜欢这样做,当我尝试向人们解释实时分析时,我愚蠢地只是向他们展示了一个插入了Google Analytics(分析)的网站,并且实际上看到了与访问网站的人们的实时互动,并问他们“想像一下您可以实时了解您的业务。”

以零售为例,也许是药品,我想您将其称为美国的一家药店,在药店,您可以买到从头痛片到防晒霜和帽子的各种产品。 现在我们知道了什么,尝试在没有实时信息的情况下运行该组织是一个令人恐惧的概念。 例如,您可以测量人流量,可以将设备放置在商店周围,并在屏幕的一侧带有笑脸,这是因为您感到高兴,而在最右边则是不高兴的红色,中间是一些不同的阴影。 这些天,有一个名为“开心与不开心”的平台,您可以在这里走进商店,并可以根据客户的真实情感反馈来开心地笑着或悲伤的表情。 而且可以实时互动。 您可以获得实时需求驱动的定价。 如果那里有很多人,您可以将价格提高一点,并且可以进行库存查询并告诉其他人,例如,航空公司会告诉您您现在网站上有多少个座位。在预订航班时,您不只是随机拨打电话,希望您能出现并获得航班。 实时的HR数据,您可以知道人们何时上下班。 采购,如果您正在采购并且有实时数据,则可以执行诸如等待一个小时并对冲美元价格的操作,以购买下一批库存,然后增加一批库存。

当我向人们展示Google Analytics(分析)时,我传达了这种轶事,这个尤里卡时刻,这个“啊!”时刻,这个灯泡在他们的脑海中浮现,就像:“嗯,我可以看到很多可以做得到的地方。 如果我拥有这些工具,并且只有我才能获得这些知识。”而且我们现在正在社交媒体中看到这一点。 精通社交媒体用户的任何人都不会只显示早餐的图片,而是倾向于查看他们获得了多少喜欢,他们获得了多少流量以及他们得到了多少朋友,并且他们通过比如说Twitter作为一种分析工具 您可以访问Twitter.com来使用该工具,但是您可以键入Google Twitter Analytics dot com,或者单击右上角的按钮并下拉菜单并执行此操作,您将获得这些漂亮的实时图形,该图形可以告诉您多少推文您正在做自己以及与他们进行了多少互动。 仅在您的个人社交媒体上进行实时分析。 想象一下,如果我们有Google Analytics(分析),Facebook,LinkedIn和Twitter之类的产品,那么eBay的统计数据就在您的身边,但是在您的工作环境中。

现在,触手可及的实时网络和移动设备已成为一种动力概念。 因此,这使我得出了结论,那就是,我始终都发现,早日利用工具和技术的组织相对于竞争对手获得了如此重要的优势,以至于竞争对手可能永远无法追赶。 我们现在看到的是与公民数据科学家的冲突。 如果我们可以聘请具有技能,所雇用人员的知识的人员,并且可以为他们提供正确的工具,特别是能够查看实时数据并发现数据并知道其所在的位置而无需四处走动的小隔间并大声地提出问题,必须到饮水机旁与人进行一些比较分析,或者去问接待处索引在哪里。 如果他们能在他们的指尖做到这一点,并且可以将其带到与他们的会议上,并坐在董事会中实时浏览屏幕而不是硬拷贝,那么我们突然间就赋予了我们不需要实际工作的员工的权力数据科学家,但实际上是要使用数据科学并为组织带来惊人的成果。 而且,我认为我们实际上已经过去了这个转折点,即消费者被带入了企业,所面临的挑战是我们如何为企业提供服务,这就是我今天讨论的主题。 然后,我将结束我的作品并交出,以了解我们如何解决该问题。 大卫,交给你。

David Sweenor:好的,非常感谢你们,也感谢Robin。 你知道吗,罗宾,我同意你的最初评估。 分析过程与软件开发没有什么不同。 我认为,组织内部的挑战确实是,您可能知道,也许事情没有得到很好的定义,可能有探索性的方面,而有创造性的方面。 而且Dez,你知道,我同意你的观点,有很多重塑方向的事情,而且你知道,我今天没有一个组织,你问,好吧,为什么你要这样做呢? 为什么企业要这样经营? 这很容易质疑,而且在组织中很多时候,很难更改。 我喜欢类比,即事物的消费化。 因此,当我去机场并想换座位时,不再需要使用手机。 我不必走到展位的座席,就可以在15分钟内看着那个座席在单色监视器上键入一些内容来更改我的座位分配。 我只喜欢在手机上进行操作,因此这是一个有趣的发展。

今天,我们将讨论集体智慧。 对于那些不知道的人,Statistica是一个领先的分析平台,已经存在30多年了。 如果您查看分析师行业中的任何出版物,它始终是最直观,最易于使用的高级分析软件包之一,在其中排名最高。 因此,过去几年来,我们一直在致力于一个名为“集体智慧”的概念,并将其提升到一个新的水平。 我想从以下对话开始:您的组织如何完成工作?

这里有两个图像。 左图是1960年代的照片,我不是在1960年代开始我的职业生涯,但右图是–那是我开始工作的一家半导体工厂。 我在那座黑色的建筑物里工作,左上角是黑色的屋顶。 但是他们制造了半导体产品。 这是Google图片的最新图片。 但是,当您回到左侧的1960年代图像时,这非常有趣。 您让这些人排成一列,他们正在制造集成电路和半导体。 但是有一种标准化,有一种标准的做事方式,并且有一个定义明确的过程。 您知道,也许由于这些人都坐在一个开放的环境中,所以也许存在一些协作。 我认为我们在知识型员工队伍中已经失去了一点点。

当我坐在左上角的那栋大楼里时,如果我想与某人合作,它就没有开放。 有这些办公室,也许有些团队很偏远,或者也许我不得不穿越这个校园。 那是一个25分钟的步行路程,我不得不和最右边那栋楼里的人聊天。 我认为我们在此过程中丢失了一些东西。 因此,您知道,我也有同样的想法,为什么会有人–多少人继续在您的组织内重塑轮子? 我想,您知道,整个组织在1990年代和2000年代在CRM和数据仓库以及一定程度上在BI方面做得很好。 由于某些原因,分析工作有些滞后。 在数据仓库,标准化和规范化数据以及所有这些以及CRM方面进行了大量投资,但是由于某些原因,分析工作滞后。 我想知道为什么。 也许有创意-也许您的流程定义不明确,也许您不知道您要为改变事物而试图做出的决定或杠杆。 今天,当我们进入组织时,有很多人在电子表格中非常手动地执行操作。

您知道,我今天早上看一下统计数据,我认为它说80%的电子表格中有90%有错误,其中有些可能非常重要。 就像《鲸鱼》中的那本书一样,摩根大通(JPMorgan Chase)由于电子表格错误而损失了数十亿美元。 所以我有一个前提,那就是必须有一种更好的方法来完成工作。 正如我们提到的,我们有这些数据科学家。 这些家伙很贵,很难找到。 有时它们有些奇怪。 但是我想,如果您必须总结一下数据科学家的身份,那可能是了解数据的人。 我认为这是一个了解数学的人,一个了解问题的人。 确实,有人可以传达结果。 而且,如果您是数据科学家,那么现在这些天就很幸运,因为过去几年您的薪水可能翻了一番。

但说实话,许多组织没有这些数据科学家,但您的组织确实有聪明的人。 您有一个组织,有很多聪明的人,他们使用电子表格。 您知道,统计和数学不是他们的主要工作,但他们使用数据来推动业务发展。 确实,我们要解决的挑战是,您如何应对,如果您幸运地拥有一两个数据科学家或统计学家,您将如何接受它们,以及如何改善这些人与您组织中的其他个人? 如果我们看一下组织的结构,我将开始,并且我将从右到左。 而且我知道这是倒退,但是我们有这行业务用户。

这是知识型员工的大部分,对于这些人来说,您需要将分析嵌入业务应用程序中。 也许他们在呼叫中心屏幕上或其他地方看到分析输出,并告诉他们要提供给客户的下一个最佳报价。 也许它是门户网站上的消费者或供应商,并且立即给了他们信誉或类似的东西。 但是想法是,他们正在使用分析。 如果我们走到中间,那就是这些知识工作者。 这些人现在正在处理电子表格,但是电子表格容易出错,并且在某些时候它们用光了。 众所周知,这些公民数据科学家正在努力为他们做的事情实际上是提高自动化水平。

通过分析,您会听到80%到90%的工作都在数据准备工作中,这不是实际的数学,而是数据准备工作。 无论您是否这样做,我们都在尝试实现自动化,并且我们拥有向导和模板以及可重复使用的内容,并且您实际上不必了解环境中的基础结构。 然后,如果我们看最左边,就会有这些数据科学家。 就像我提到的,它们供不应求。 我们正在努力使他们提高工作效率,是让他们创造出这些公民数据科学家可以做的事情。 可以将其视为乐高积木,这样这些数据科学家就可以创建可重用的资产,供公民数据科学家使用。 一次构建一次,因此我们不必继续重新发明轮子。

然后,这些人可能会担心我们是否可以在数据库中处理事务,并利用贵公司已进行的现有技术投资。 您知道,在当今时代,在全球范围内往返传输数据是没有意义的。 因此,就像我提到的那样,如果我们看一下Statistica,它是一个存在了很长时间的平台。 这是一个非常创新的产品。 数据混合,没有我们无法访问的数据源。 我们拥有您期望的所有数据发现和可视化功能; 我们可以实时进行。 它可能具有–我认为该软件工具中包含16, 000多个分析功能,因此这比我以前使用或理解的数学要多,但如果需要,它就在那儿。

我们有能力结合业务规则和分析工作流来真正做出业务决策。 您不仅在这里,还有一个算法,这是一个工作流,但是您拥有必须始终处理的业务规则。 我们在治理方面非常安全。 FDA信任我们,因此我们被许多制药客户所采用。 您知道,仅在布丁中证明我们具有被他们接受的控制和审核能力。 最后,您知道,我们是开放,灵活和可扩展的,因此您需要创建一个平台,即您希望数据科学家提高工作效率,希望公民数据科学家提高工作效率,将这些分析输出部署到组织内的工作人员。

如果我们看一下,下面是一些可视化示例。 但是能够将您的分析输出分发给业务部门用户,因此左侧的第一个示例是网络分析图。 也许您是一名欺诈调查员,并且您不知道这些联系是如何建立的,它们可以是人,可以是实体,可以是合同,或者其他任何东西。 但是,您可以使用鼠标进行操作,并与之交互以真正理解–如果您是欺诈调查员,则可以了解要调查的对象的优先列表,对,因为您无法与所有人交谈,所以您可以优先。

如果我们看一下右侧的图像,那么对于预测性维护仪表板来说,这是一个非常有趣的问题。 也许您是机场的所有者,并且那里有这些人体扫描仪。 这些人体扫描仪,如果您去机场,那里的某些部件的保质期约为9个月。 这些东西真的非常昂贵。 如果我有多个入口点,机场中的多个扫描仪,第一名,我想确保在每个登机口都配备了适当的人员,对于扫描仪中的部件,我也不想订购尽早,而且我确实想让它们在崩溃之前得到。 我们有能力(也许如果您有一个机场的话)能够预测这些事情何时会破裂并预测人员配备水平。

如果我们在右下角查看,这就是在制造环境中,这只是制造流程的图形表示。 这很难看,但是这些不同的过程区域上都有红色和绿色的交通信号灯,因此,如果我是一名工程师,那儿会有非常复杂的数学,但是我可以深入研究那个特定的过程区域并进行研究参数,然后输入该参数,可能会导致其失控。 如果我们看一下我们的公民数据科学家,那么我们的目标实际上是使公民数据科学家变得容易。 我们有向导和模板,而我认为确实很有趣的一件事是,我们有了这个自动化的数据运行状况检查节点。 实际上,它具有内置的智能功能。

我提到了数据准备–这需要大量时间,包括数据聚合和准备时间。 但是,让我们假设我有我的数据,我可以通过此数据运行状况检查节点运行它,并检查不变性,稀疏性和离群值,以及所有这些东西,它会填充缺失值,并且会做很多我不知道的数学运算不明白,所以我可以接受默认值,或者如果我更聪明,可以更改它们。 但关键是,我们要使该过程自动化。 这件事对清洗后的数据集进行约15种不同的检查和结果。 我们正在做的是使人们更轻松地创建这些工作流程。

这就是我们谈论数据科学家和公民数据科学家之间的协作的地方。 如果我们在右侧查看这些图像,则会看到此数据准备工作流程。 也许这很复杂,也许这是贵公司的秘密秘诀,但我知道您组织中的某人可以访问我们拥有的这些数据孤岛中的一个或多个。 我们需要一种方法,第一,抓住它们并将它们缝合在一起,第二,也许我们需要做特殊的处理,这超出了我们的数据运行状况检查,这就是您公司的秘密。 我可以在我们的组织内创建此工作流,它会作为一个节点崩溃。 您会看到向下的箭头,它只是一个节点,我们在组织内可以拥有一百个这样的东西。 这个想法是,我们有一些人对某个特定的空间有所了解,他们可以创建工作流,而其他人可以重用该工作流。 我们正在尝试最大程度地减少对车轮的改造。

而且,我们可以使用分析建模工作流来做同样的事情。 在右边的情况下,此工作流程可能有15种不同的算法,我想为任务选择最佳的算法。 作为公民数据科学家,我不必理解蜘蛛网上的混乱状况,但是它只是崩溃成一个节点,也许那个节点只是说“计算信用风险得分”。手术部位感染”,您拥有什么。 “计算某件事是欺诈性交易的可能性。”作为一名公民数据科学家,我可以使用别人建立的非常复杂的数学,也许是我组织内部建立的这些数据科学家之一。

从数据科学的角度来看,我已经与喜欢编写代码的数据科学家进行了交谈,并且与讨厌编写代码的数据科学家进行了交谈。 很好,所以我们有一个非常直观的图形用户界面。 我们可以获取数据,可以进行自动化的数据运行状况检查,也许我想编写代码。 我喜欢Python,我喜欢R,但是想法是,这些数据科学家供不应求,而且他们喜欢特定语言的代码。 对于要使用哪种语言编写代码,我们没有特别的偏好,因此,如果您想使用R语言,请使用R语言。 如果您想使用Python,请使用Python。 那很棒。 如果要将分析爆发到Azure,请将分析爆发到云。 因此,此处的目标实际上是提供灵活性和选项,以使您的数据科学家尽可能地高效。

现在的数据科学家,他们是非常聪明的人,但也许他们不是所有事情的专家,也许他们的工作还存在一些差距。 而且,如果您在行业内看一眼,那里就有很多不同的分析市场。 这是一个示例,也许我需要做图像识别,但是我没有那种技能,也许我就去Algorithmia并获得了图像识别算法。 也许我去Apervita并获得了非常特殊的医疗保健算法。 也许我想在Azure机器学习库中使用某些东西。 也许我想在本地Statistica平台中使用某些功能。

同样,这里的想法是我们希望利用全球分析社区。 因为您将不会在这四面墙中拥有所有技能,所以我们如何创建软件-这就是我们正在做的-使您的数据科学家可以使用来自各种市场的算法。 我们使用R和Python已有很长时间了,但这将其扩展到了现有的这些应用程序市场中。 就像您在此之上看到的一样,我们在Spark上使用H2O,因此那里有很多分析算法。 您不必专注于从头开始创建它们,而让我们重用开源社区中存在的这些,我们希望这些人尽可能地提高工作效率。

在有了我们的公民数据科学家和数据科学家之后,下一步就是您如何推广和分发这些最佳实践? 我们软件中拥有技术,可让您在任何地方分发分析。 这更像是模型管理的观点,但我不再受塔尔萨,台湾或加利福尼亚州内的四堵墙或特定安装的束缚,或者您拥有什么。 这是一个全球平台,我们有许多客户,许多站点都在使用它。

所以说真的,关键的是,如果您在台湾做某事并且想在巴西复制它,那就太好了。 进入那里,获取可重复使用的模板,获取所需的工作流程。 这是在尝试创建那些标准以及通用的做事方式,因此我们并不是在每个地方都做完全不同的事情。 而这的另一个关键组成部分是,我们确实想对数据所处的位置进行数学计算。 您不必在加利福尼亚和塔尔萨以及台湾和巴西之间随机整理数据。 我们拥有使我们能够对数据进行数学运算的技术,并且我们将针对该主题进行另一场热门技术网络广播。

但是我们称之为这种架构,这是先睹为快的本机分布式分析架构。 这背后的关键思想是我们有一个统计数据平台,我可以将一个分析工作流导出为一个原子。 我可以建立模型或整个工作流程,所以没关系。 但是我可以创建它,并以适合目标平台的语言将其导出。 在左侧,很多人这样做,但是他们确实在源系统中得分。 很好,我们可以评分,也可以在数据库中进行模型构建,所以很有趣。

然后在右边,我们有Boomi。 这是一项伴随技术,我们将与所有这些一起工作。 但是我们也可以采用这些工作流程,并将其基本上传输到世界任何地方。 任何具有IP地址的东西。 而且我不必在公共或私有云上安装Statistica。 任何可以运行JVM的东西,我们都可以在任何这些目标平台上运行这些分析工作流,数据准备工作流或仅模型。 无论是在我的公共云还是私有云中,无论是在我的拖拉机,汽车,我的房子,我的灯泡,我的物联网中,我们都拥有可让您将这些工作流传输到世界任何地方的技术。

我们来复习。 您知道,我们有业务用户,因此这些人,我们有技术可以使他们以他们喜欢的格式使用输出。 我们有公民数据科学家,我们正在努力做的是改善协作,使他们成为团队的一部分,对吗? 因此,我们希望人们停止重新发明轮子。 而且我们有这些数据科学家,那里可能存在技能缺口,但是他们可以使用所需的语言进行编码,可以进入分析市场并在其中使用算法。 因此,您怎么能不认为这一切都很棒呢? 这很完美,这就是我们正在做的。 我们正在构建可重复使用的工作流程,向人们提供指令,向他们提供Lego模块,以便他们可以构建这些强大的城堡以及他们想做的任何事情。 综上所述,我们拥有一个平台,可以为众多业务用户,公民数据科学家,程序员数据科学家提供支持,我们可以处理任何类型的IoT边缘分析用例,并且可以实现这种集体智慧的概念。 这样,我想我们可能会提出一些问题。

罗宾·布卢尔(Robin Bloor):好的。 我认为第一个-我的意思是,老实说,我是之前曾听过Dell Statistica的简报,老实说,我对我不知道您在演示中提到的事情感到非常惊讶。 我不得不说,一件事,这对我在采用分析方法中一直是个麻烦,是,知道,获得工具不是吗? 这里有很多工具,有开源工具等等,还有各种各样的,我称之为半平台。 但是我认为您与众不同,其中的一些工作流程给我留下了特别深刻的印象。

但是区别在于您似乎提供了端到端的服务。 就像分析是一个复杂的业务流程,从获取数据开始,然后经过一系列步骤,具体取决于数据的不稳定程度,然后在业务流程中可以进行一系列不同的数学攻击。数据。 然后结果会以一种或另一种方式出现,而这些都需要采取行动。 我遇到了大量的分析工作,这些工作做了很多出色的工作,但没有付诸实践。 而且您似乎有很多需要的东西。 我不知道它有多全面,但是比我预期的要全面得多。 我对此印象深刻。

我希望您对电子表格发表评论。 您已经说了些什么,但是我注意到的一件事,以及我多年来注意到的一件事,但是越来越明显的是,有很多电子表格都是影子系统,实际上我认为我的意思是说,电子表格在引入时是一个很棒的工具,而且自从以许多不同的方式出现以来一直是很棒的,但是它是一个通用工具,并不真正适合目的。 在BI上下文中,它当然不是很好,我认为在分析上下文中,这是可怕的。 我想知道您是否对某些示例要发表评论,例如,您知道Statistica已被淘汰,电子表格使用过多或您想对此发表评论吗?

David Sweenor:是的,我认为,您可以查找著名的电子表格错误。 Google或您正在使用的任何搜索引擎都会返回大量结果。 我认为,您认为我们不会取代电子表格。 那不是我们的意图,而是我去的许多组织,有几个这样的电子表格向导或忍者,或者您想称呼它们的东西,但是他们有这些非常复杂的电子表格,您必须考虑一下,当这些人们赢得乐透,他们不回来吗? 因此,我们想要做的是,我们知道电子表格将存在,因此我们可以提取这些电子表格,但是我认为,我们想要做的是开发可视化的工作流表示形式,以便可以理解并与他人共享。 电子表格非常难,很难共享。 而且,一旦您将电子表格传递给我,我就对其进行了更改,现在我们不同步了,我们得到了不同的答案。 我们正在尝试做的是在此周围加上一些护栏,使事情变得更有效率。 电子表格真的很难将多个数据集组合在一起,您知道吗? 他们跌倒了。 但是我们不会替换它们,我们会摄取它们,并且确实有一些人开始转移,因为如果我们有一个节点说“计算风险”,那就是使用电子表格的人正在尝试做的事情。 所以那些都不见了。

Robin Bloor:是的,我的意思是,我想说的是,从我所观察的事物的一种角度来看,我认为电子表格非常适合创建信息。 它们甚至对于创建知识孤岛都非常有用,但是对于共享知识却真的很不利。 他们没有任何机制可以执行此操作,并且如果您将电子表格传递给某人,就好像您可以读懂它,而不是像一篇文章一样准确地解释了他们在做什么。 只是不在那里。 我认为,您对本次演讲以及Statistica的功能印象最深刻的是,它确实不可知。 但是,这个线程贯穿了整个工作流程。 我是否可以假设您可以从整个数据采集一直到将结果嵌入特定的BI应用程序甚至是运行的应用程序中的端到端工作流程,对吗?

David Sweenor:是的,绝对如此。 而且它确实具有端到端功能,并且某些组织完全使用它,而且我对这些公司如今从任何一家供应商处购买所有产品都没有幻想。 我们混在一起。 有些人将Statistica用于所有内容,有些人将其用于建模工作流,有些人将其用于数据准备工作流。 有人使用它向工程师分发数百份工程报告。 因此,我们之间有一切。 它确实是端到端的,并且是一个不可知的平台,因为如果要在R或Python,Azure,Apervita中使用某些算法,请使用这些算法。 太好了,要有生产力,要用自己知道的东西,要用自己喜欢的东西,我们有机制来确保这些东西可以控制和审核。

Robin Bloor:我特别喜欢它的那方面。 我的意思是,我不知道您能否说出超出您所说的范围的话。 我的意思是,我已经看过这个了,但是我没有全面地看过它,当然我们的库中有大量的Python库,但是您可以添加任何图片吗? 因为我认为这是一件非常有趣的事情,所以知道您将拥有值得信赖的组件,因为您知道创建它们的人和正在使用它们的人都可以下载。 你知道吗,你能丰富你已经说过的话吗?

David Sweenor:是的,我认为某些应用程序市场已经存在。 例如,您知道爱荷华大学的John Cromwell博士,他开发了一个模型,该模型可以预测在我们进行操作时实时使用的模型,如果您要获得手术部位感染。 如果该分数足够高,他们将在手术室进行干预。 那很有趣。 因此,也许还有另外一家规模不大的医院。 好吧,Apervita是一个用于分析的健康应用程序市场。 您可以在许多此类应用程序市场中找到一个,可以找到其中一个并重新使用它们,并且交易在您与拥有该应用程序的任何人之间进行,但是您可以找到一个,或者可以说:“这里是我想这是在利用这个全球社区,因为如今每个人都是专家,而且您一无所知。 我认为R和Python是一回事,但“我想执行此功能,在其中一个应用程序市场上发布规格,并请别人为您开发它”的想法。我认为它们可以货币化与纯粹的开源模型相比,这非常有趣并且与众不同。

Robin Bloor:好的。 无论如何,我会将球传给Dez。 您想潜水吗,Dez?

Dez Blanchfield:绝对,我想在电子表格上停留一会儿,因为我认为它已经抓住了我们在这里谈论的很多内容的正确要旨。 您曾对Robin提出过评论,内容涉及从旧的电子表格的物理形式到电子形式的过渡。 我们发生了一件有趣的事情,您知道,当电子表格最初只是一种东西时,它们只是带有行和列的纸,您需要手动将其写下来,然后通过进行计算并进行计算它可以放在头顶或其他设备上。 但是我们仍然有机会使错误因笔迹错误或阅读困难而遗漏,现在我们已将其替换为错别字。 风险在于,使用电子表格时,风险状况会越来越大,但我认为Statistica之类的工具会颠覆风险金字塔。

我经常将这张图片画在白板上,上面是一个人像,一个人,然后将它们的集合放到下面,比如说,想象其中有十个在白板的底部,我画了一个金字塔,金字塔的位置在单人处,金字塔的脚处在人们的集合处。 我用它来设想这样一个想法:如果最上面的一个人做一个电子表格会犯一个错误,并与十个人共享,那么现在我们得到了十个错误副本。 如果要使用宏,请非常小心宏,而Visual Basic则非常小心。 因为当我们构建电子表格之类的电子工具时,它非常强大,但无论好坏,它都非常强大。

我认为Statistica之类的工具带来了反转风险状况的能力,也就是说,您现在可以从个人的头顶上找到很多工具,这些工具可供个人使用。如果我们有一群正在构建这些工具和算法的人员,那么金字塔然后到最底端,金字塔的点现在被倒置是实际的工具。 数据科学家不需要成为数据回归分析方面的专家。 他们也许可以使用该工具,但您可能有五六个统计学家和一个精算师,一个数据科学家和一些数学家在使用该工具,该模块,该算法,该插件,因此在电子表格的表述中如此,因此想象一下,您可以使用的每个电子表格实际上都是由测试宏,测试Visual Basic,确保算法有效的专家编写的,因此当您获得它时,您可以将数据弹出其中,但实际上并不能破坏它因此最好控制一下。

我认为许多分析工具都在这样做。 我想说的是,您现在是否正在现场看到这种情况,是否正在看到从可能会导致错误,错误和风险的电子表格过渡到您正在使用自己的工具构建的过渡平台,现在的数据发现是实时准确的,而构建模块和算法的人员正在消除或减少这种风险状况? 客户服务是在真实意义上看到它,还是您认为这只是正在发生而他们没有意识到?

David Sweenor:您知道,我认为有几种方法可以解决这个问题。 但是,我们所看到的是,在任何组织中,我都提到,我认为从企业投资的角度来看,分析可能落后于我们,这与我们对数据仓库和CRM所做的类似。 但是,我们所看到的,因此,改变组织,克服组织的惰性需要大量的时间。 但是我们看到的是人们拿着他们的电子表格,他们的工作流程,并且我提到了安全性和治理,“好吧,也许我有一个电子表格”,“好,我可以锁定它,并且可以对其进行版本控制。”我们看到了很多组织,也许他们只是从这里开始。 如果更改了,这里就有一个工作流程,但最后还是我去做,谁来更改它呢? 他们为什么改变它。 当他们改变它。 而且,我还可以设置工作流程,以使我不会将此新电子表格投入生产,除非经过一个,两个,三个,但要在工作流程中定义的多个参与方进行验证和验证。 我认为人们已经开始采取行动,各组织也开始在那里采取一些小步骤,但是我建议我们还有很长的路要走。

Dez Blanchfield:确实,我认为,鉴于您正在内部构建安全控制和治理,那么工作负载可以自动将其映射到所有风险,直至首席风险官,这已经成为现实。 您可以开始控制如何访问这些工具和系统,以及谁在使用它们进行操作,因此功能非常强大。 我认为,与此相关的其他事情是,您提供给我的工具类型,比起我们正在谈论的传统电子表格,更适合人类行为,因为如果我有一个充满人的房间使用相同的仪表板和访问相同的数据,他们实际上可以得到不同的视图,因此,从相同的信息中获得的洞察力略有不同,这适合他们的需求,因此他们可以进行协作。 然后,我们将拥有更加人性化的视角,并与业务和决策流程互动,而不是所有人都使用相同的PowerPoint参加相同的会议,并打印出相同的电子表格,并使用相同的固定数据。

您是否看到组织中的行为和文化发生了转变,这些组织现在正在使用您的工具,而他们却看到这种情况发生了,而不是在会议室中有五个人看着同一张电子表格,试图只是用语言表达并在上面做笔记,但是现在他们实际上是在实时与仪表板和工具进行交互,并且唾手可得的可视化和分析功能,并且不仅在会议中,而且在组织中的一般协作中,对话和交互的流程也完全不同? 因为他们可以实时完成任务,因为他们可以提出问题并获得真实的答案。 您目前正在看到这种趋势还是还没有完全发生?

David Sweenor:不,我认为这绝对是从这条道路开始的,而且我认为非常有趣的事情是,如果我们以工厂为例。 也许某人在该工厂内拥有特定的过程部门,他们想以某种方式查找并与该数据进行交互。 也许我忽略了所有过程,也许这是最底层的过程,也许我想在所有方面都对其进行研究。 我认为我们看到的是,第一,人们开始在他们的组织中使用一组通用的可视化或标准可视化,但是它也根据他们所担任的角色而量身定制。如果我是过程工程师,也许这与从供应链角度看待这个问题的人截然不同,我认为这很棒,因为必须量身定制,并且必须从完成工作的角度来审视它。

Dez Blanchfield:我猜想决策过程在时间和速度上都会下降,实际上做出明智而准确的决策也会迅速增加,不是吗? 因为如果您具有实时分析,实时仪表板,并且只要触手可及的Statistica工具,就不必费劲地去询问某人某事,那么您就已经掌握了印刷版。 您可以进行协作,互动并即时做出决策,并立即获得结果。 我认为有些公司确实还没有掌握,但是当他们这样做时,将是尤里卡的那一刻,是的,我们仍然可以呆在小隔间里,在家工作,但是我们可以进行互动和协作,做出这些决定我们的协作使我们立即变成成果。 听着,我想听到您到目前为止要说的话真是太好了,我非常期待看到它的去向。 而且我知道我们在问答环节中有很多问题,所以我将回到丽贝卡(Rebecca)来解决其中的一些问题,以便我们尽快解决这些问题。 非常感谢你。

丽贝卡·乔兹维克(Rebecca Jozwiak):谢谢Dez和是的Dave,我们确实有很多来自观众的问题。 还要感谢Dez和Robin的见解。 我知道这个特定的参与者必须在一小时之内直接下车,但是她有点想问,您是否看到信息系统部门将优先级放在复杂的数据控件上,而不是乐于提供工具来知识工作者? 我的意思是–是吧。

David Sweenor:是的,我认为这取决于组织。 我认为,与营销组织相比,银行,保险公司可能具有不同的优先级和处事方式。 我想我不得不说这仅取决于您要寻找的行业和功能。 不同的行业有不同的重点和重点。

丽贝卡·乔兹维克(Rebecca Jozwiak):好的,这很有道理。 然后另一位与会者想知道,Statistica背后的动力是什么? 是C ++还是您自己的东西?

David Sweenor:嗯,我不知道我是否能用它来说明这一点,因为它已经存在了30年了,它是在我之前开发的,但是有一个运行的Statistica算法分析算法的核心库。 您在这里看到,我们也可以运行R,可以运行Python,可以爆发到Azure,可以在H2O的Spark上运行,所以我想我不得不回答这个问题,因为它是各种各样的引擎。 并且取决于您选择哪种算法,如果它是Statistica,则它会像这样运行,如果您在H2O和Spark上选择一种,它会使用它,因此它们种类繁多。

丽贝卡·乔兹维克(Rebecca Jozwiak):好的。 另一位参加者问专门指向此幻灯片,想知道这种情况,市民数据科学家如何知道要使用哪些可重用模板? 我想我会对此提出一个更广泛的问题。 那,当业务线用户或业务分析师进入并且他们想要使用这些工具时,您会看到什么,他们接起来并运行起来有多容易?

David Sweenor:我想我会回答这个问题,如果您可以使用,如果您熟悉Windows,这是一个基于Windows的平台,因此我截取了这些屏幕截图的顶部,但是它具有Windows功能区。 但是他们如何知道要使用什么工作流程? 它看起来像Windows资源管理器,因此有一个树状结构,您可以对其进行配置和设置,但是您的组织希望对其进行设置。 但是,可能只有这些文件夹,然后将这些可重复使用的模板放在这些文件夹中。 我认为您的公司可能会采用一种命名法,例如这是“计算风险概况”,这是“从这些来源获取数据”,您可以随意命名。 这只是一个免费文件夹,您只需将便笺直接拖到画布上即可。 因此,非常简单。

丽贝卡·乔兹维克(Rebecca Jozwiak):好的。 也许下次演示。 然后又有另一位与会者提出来,这就是您和Robin和Dez所讨论的不准确之处,尤其是在电子表格上,但是浪费/浪费了,他认为这变得更加关键。分析。 有点提及,滥用数据确实会导致一些不幸的决定。 而且他想知道您对开发更多故障安全算法有何看法,我猜想,他使用的是“过分”使用分析这个词。 您知道,有人进来,他们真的很兴奋,他们想要进行这些高级分析,他们想要运行这些高级算法,但是也许他们不太确定。 那么,您如何采取措施防止这种情况发生?

David Sweenor:是的,所以我想我会尽力回答这个问题,但是我认为一切都取决于人员,流程和技术。 我们拥有可以帮助人们的技术,可以帮助您实现组织中想要进行的任何流程。 在将优惠券发送给某人的示例中,也许这并不那么关键,并且如果它是数字化的,那实际上是没有成本的,那么也许只有一个级别的安全控制,也许我们不在乎。 如果我要预测手术部位感染,也许我想对此多加注意。 或者,如果我要预测药物的质量和安全性之类的事情,也许我想对此有所注意。 您是对的,请进行垃圾回收,因此我们尝试提供的平台可让您根据组织要采用的任何流程对其进行定制。

丽贝卡·乔兹维克(Rebecca Jozwiak):好的。 我还有其他问题,但是我知道我们已经过了一个多小时了,我只想告诉我们的主持人,那太好了。 非常感谢Dell Statistica的Dave Sweenor。 当然,Robin Bloor博士和Dez Blanchfield谢谢您今天的分析。 我们将在下个月与Dell Statistica进行另一个网络广播。 我知道戴夫对此话题有种暗示。 这将是关于边缘分析的另一个有趣的话题,我知道将在该网络广播上讨论一些非常引人注目的用例。 如果您喜欢今天所看到的,请在下个月再回来看看。 亲爱的,我向您告别。 非常感谢。 再见。

将分析嵌入到任何地方:使公民数据科学家能够工作