问:
更多并不总是更好。 组织如何减少数据中的噪音以实现有针对性的准确分析?
A:对于大数据系统,公司面临的主要问题之一是如何保持这些项目的针对性和效率。 为大数据而构建的许多工具和资源都是为了在广泛的网络中吸收大量信息而构建的。 他们并不总是那么细心地完善数据并使之保持简单。 但是,为了创建更有针对性和更有用的大数据项目,行业中出现了一些最佳实践。
有针对性的大数据方法的一个支柱是使用正确的软件工具和资源。 并非所有分析和大数据系统都是相同的。 有些可以更有效地过滤掉过多或不相关的数据,并使企业仅关注决定其核心流程和运营的基本事实。
另一个主要部分涉及人。 在参与大数据项目之前,以及在购买供应商软件,追求实现和培训其他人员的过程中,需要由一群人来负责该过程,并委派研究和头脑风暴任务。 这可以将大数据方法变成一种精确的外科手术方法,从而在不使工作变得过于繁重和破坏日常运营的情况下增强业务。
例如,工作队或其他核心小组可以坐下来详细研究实施的方式,企业如何开始评估数据集,他们如何交叉索引帐户,使用哪种纸张或他们将使用数字演示文稿来传播该信息,如何构建有用的报告等。这些详细信息将保护企业免受大数据膨胀的影响。
此外,随着公司开始获得更多的供应商服务,进行更多的大数据处理并使IT体系结构变得更加复杂,他们学会了将最敏感的数据与其他所有数据区分开。
一种实现方法是创建一个分层系统。 例如,客户ID和历史记录的核心数据集可以根据特定的云安全合同或现场保存在专门维护的数据库中。 其他数据集可以驻留在不太专业的数据环境中,这可能是因为它们对数据泄露的敏感度较低,或者是因为它们与业务进行的分析不太直接相关。 分层或多层系统允许经济高效地实施大数据。
这些是企业明智地以正确的方式获取大数据的一些方式。 他们将某些数据集视为最关键的任务,以最少的努力获得最大的商业智能,而不仅仅是清理他们可以获取的任何数据。
