大数据成功实施三个V
在全球范围内,很多企业都专注于利用大数据的力量。这一过程的第一步通常是理解大数据与更传统的数据环境之间的区别。调研机构Gartner公司在2012年将大数据描述为三个V:数量(Volume)、速度(Velocity)和多样性(Variety)。数量即捕获数据的规模,是描述大数据平台的关键组成部分。根据IBM公司最近的一项研究,现在世界上每天产生超过2.5万亿GB的数据,为大数据平台提供了潜在的海量数据。由于移动电话、传感器和其他连接设备的快速扩展,产生了源源不断的数据流。速度即捕获数据的频率将会继续增加。大数据将我们从一个结构化交易数据的世界带入了一个捕获各种数据的世界,从社交媒体内容到可穿戴设备的健康数据。
一旦企业高管理解了大数据与传统数据环境之间的差异,下一步往往是选择物理平台。在20世纪90年代中期,数据仓库的出现引起了类似的反响。当企业认识到需要有一个独特的信息分析平台来防止对交易环境的影响时,焦点立即转移到技术选择过程上。在采用大数据的这一点上,就像数据仓库的情况一样,重要的是要避免成为牺牲品。那些在选择和构建大数据平台方面行动太快的组织可能采用了这样一个策略,“建立它,他们就会来”。与过去失败的数据仓库项目类似,在没有首先确定具体业务价值的情况下构建大数据平台可能会使企业成为另一个受害者。
最初的三个V是定义大数据概念的好方法;然而,在这里考虑在企业中实施大数据的另外三个极其重要的V——价值(value)、有效性(Validity)和活力(Vitality)。为了防止大数据平台建成后不使用的情况,必须提前了解业务价值,解决方案的有效性必须健全,以供业务采用,最后,企业必须有生命力来执行实施过程。更彻底地检查每一个领域。
在关键业务领域的适当支持下,企业创建一个大数据平台,为每个客户提取、分析和生成定制策略,有可能带来巨大的价值。
最近也有一些关于大数据的演讲,其中一些公司的主要卖点是,“我们的大数据解决方案非常棒,因为用户可以将所有数据加载到低成本的商品服务器上,磁盘存储几乎不需要任何成本,源数据存在的任何格式都可以,并且以后可以弄清楚如何使用它”。不要让这种方法的吸引力导致企业成为下一个牺牲品。在大数据之旅中,一个关键的成功因素始于一个清晰的愿景,即它将如何提供商业价值。例如,如今可以从车辆上的数千个传感器捕获流数据,从制动水平到转弯时的行驶速度。如果使用得当,这些数据可以让保险公司根据客户的驾驶行为调整保单价格。在关键业务领域的适当支持下,创建一个大数据平台,为每个客户提取、分析和生成自定义策略,有可能带来巨大的价值。
建议的下一个重点领域是解决方案的有效性。从技术上来说,一个适当配置的大数据平台可以轻松处理来自几乎无限数量的车辆的流传感器数据。因此,可以创建解决方案,并且它有可能推动重要的业务价值,但是它有效吗?在这个示例中的保险公司开始实现这种类型的解决方案之前,必须探索一些领域。在保险公司经营的州内,根据个人或团体的驾驶模式来定价汽车保险是否合法?负责定价的业务部门是否有能力设定和管理这个水平和速度的价格?随着消费者对隐私的日益关注,消费者是否会同意这种程度的监控,以换取更有针对性的定价?一旦初始解决方案可操作,有效性可能变得更加有趣和重要。通过捕获大量客户的驱动模式,可以确定其他潜在的业务价值领域。例如,保险公司将位置和行为数据见解出售给其他公司用于基于位置的营销是否有效?企业必须解决诸如此类的问题,这些问题超出了大数据解决方案的技术可行性。
最后,企业必须确定它是否具有实现解决方案的活力。在企业内实施第一个大数据解决方案将是困难的。成功将取决于选择强有力的合作伙伴,对现有资源进行交叉培训,并可能增加新资源。目前,熟练的大数据资源的可用性是一个挑战。
大数据领域的软件和应用的成熟度正在快速提高,但与标准的数据和应用开发解决方案相比,仍有很大的差距。大数据解决方案在某些方面类似于电动汽车。电动汽车具有巨大的能源效率、非常高的扭矩和快速的加速,但仍然存在充电站有限、电池成本高、行驶距离问题等痛点。Hadoop等大数据平台已经显示出支持海量数据的能力,其结构化和非结构化模块可以处理大量数据。然而,就像电动汽车一样,这个平台正在经历一些痛点,比如有限的可用资源、新兴的开发工具,以及对与现有环境集成的担忧。
当企业开始其大数据之旅时,利用数量、速度和多样性来更好地理解潜力,但不要忘记价值、有效性和活力,因为它们关系到成功的执行。