目录:
由于使用了移动设备,社交媒体和其他非结构化来源的数据,数据量正在迅速增长。 诸如Hadoop之类的大数据技术通过引入分析各种来源的大量数据的新方法,在商业领域占据了主导地位。
大数据是指超出组织机构及时管理和分析能力的数据的数量,种类和速度。 大数据的真正优势在于可以为基于事实的快速决策而进行采集,从而可以做出大业务决策。 因此,能够探索和利用大数据的组织往往具有明显的优势。 在这里,我们将研究大数据可以做什么,如何在一个数据丰富的领域中应用大数据,以及大数据在商业和政府其他领域的广泛应用。
数据爆炸
IBM卫生保健和生命科学大数据解决方案主管Charlie Schick表示,定义大数据的最佳方法是“我们所有人每天创建和使用的信息量不断增加,越来越复杂。” 实际上,我们每天使用各种来源(从各种购买交易记录到医疗医学图像,从科学研究结果到社交媒体消息)创建大约2.5兆字节的数据。
搜索引擎以及诸如Twitter之类的社交媒体已经建立了一个新的实例,即大规模收集少量数据。 这也改变了我们关于收集和管理这些数据的思维方式。 当前的文化是在短时间内消耗大量这些小型数据。 这种方法带来了巨大的挑战以及令人兴奋的数据管理机会。 为了使业务模型成功,它应该能够处理大量的数据,并以越来越小的方式捕获这些数据。
在给定数据量的情况下,寻找一种有效的收集机制成为一个挑战。 让我们考虑一下卫生保健和社交媒体数据的情况。 这两个区域都有大量数据集。 这些领域的数据收集是大数据发展的重要一步。 没有适当的数据收集机制,我们将无法获得准确的结果。
探索和处理大数据
展望未来,人们相信能够探索和利用大数据的组织应该能够迅速做出更多基于证据的决策。 利用大数据,我们可以轻松地为几乎任何领域的一些重要问题提供答案。 但是,在这里,我们将研究社会服务领域,在这个领域中大数据可以产生巨大影响。
例如,大数据应该能够分析和回答以下问题,并最终提供更好的患者预后:
- 重新入学与获得社会服务之间有什么关联?
- 住院时间长短和干预效果之间是否有任何关联?
- 家庭住址和访问频率之间有什么联系?
- 是否有可能在家庭状况,干预措施和结果之间找到联系,从而可以帮助我们识别出类似的干预措施候选人进入护理系统?
- 是否有一定的洞察力引导我们调整计划,以应对或超越青少年怀孕或家庭暴力等负面趋势?
大数据使处理这些情况和发现问题的原因成为可能。 一旦确定,这将帮助我们消除问题。 我们只能通过查看趋势和历史数据来发现问题。 在社交媒体中,在分析数据时,我们必须具有趋势分析机制。 我们分析的数据越多,可获得的结果越好,越准确。 大数据不仅提供了处理大量数据的方法,而且还提供了创新的解决方案来处理更广泛的数据。 大数据具有处理结构化,非结构化和半结构化数据集的能力。 (在5大数据可以解决的现实世界问题中了解更多信息。)
社会科学中的大数据分析
社交数据分析不过是分析社交数据而已。 该数据可以来自任何字段。 如上所述,我们需要找出某个部门中负面结果(例如高中辍学)的确切原因。 一旦发现问题,就可以更轻松地处理这种情况。 大数据是使发现这些见解成为可能的工具。
