凯度TNS:变大数据为更好的数据

变大数据为更好的数据

Mark Kingsbury TNS市场营销科学全球负责人 Bob Burgoyne TNS市场营销科学发展总监

大数据规模巨大、处理速度快、数据类型多得让人头晕目眩。但是要将其充分利用,我们必须谨记它无法自我表达,它所包含的意义与启示必须由我们去分析和挖掘。

 

 

大脑和机器
庞然大物容易令人生畏。然而营销人员和研究人员不能让大数据变成那样子。其中的数字多得让人震惊,这是一个不争的事实:有史以来所产生过的所有数据中有90%是在过去两年内被创造出来的,而且诸如手机、社交网站和销售终端这些“数据水龙头”将会以更快的速度输出原始信息给研究人员分析。因此,我们很容易得出这样一个结论:当新数据不断涌现时,人类直觉一定会被电脑和演算法取代。但如果在这一波又一波的数据浪潮中,我们退居二线,让位于数据处理技术,那么我们将会错过一个绝好的机会。新的数据来源有潜力改变研究的角色,增进我们对人类行为的理解。但是,这只有在我们继续发挥我们人类大脑无限而独特的能力时才能实现。究竟什么是“大”?
如果大数据只是意味着有更多的数字需要处理,那么它会容易管理得多。但大数据远非如此。它代表的是各种不同主题的集合,其中每一种都是独立的范式转换。

首先当然是如今出现和存储的数据的规模。目前,沃尔玛每小时能在包含超过2.5拍字节的数据库中处理超过100万份的顾客交易。这样的公司也许在短时间内就能创造出比有史以来所有研究调查所得出的数据更多的数据。数据速度,即生成海量数据的速度,每一比特都像庞大的数据规模一样令人震惊。如今数据自行生成;一旦事件发生,数据就能被创造出来并进行存储。所以数据的规模及其出现的速度并没有上限。

然而,最具挑战性的转变也许是这种庞大的数据规模、极快的处理速度和多样的数据类型的结合。大数据有各种形式和规模。如今,研究人员正尝试征服新的数据来源,同时新的数据来源也向我们袭来:从手机活动到推特帖子、地理位置信息、面部表情捕获等途径。我们正进行从处理数字形式的分数到专注于形状、移动模式、表情以及人类语言分析的快速转变。而这些数据并不是打包好了给研究人员分析的;它也需要经过转化后才能加以使用。

 

 

数据:你创造,你处理
面临着如此巨大的挑战,我们不难相信,计算能力在开创这个信息新时代中独领风潮的同时,也一定在定义信息的处理方式中发挥着领导性作用。如此看来,研究人员的角色便开始从人转变成地堡中的超级计算机:一架我们只需要输入正确的问题或问题集,把插头接入大数据流-然后静心等待,数据就会从中跳出来的超级计算机。但这个方法存在重大的风险。如果大数据最终仅变成一堆加工过和商品化的数据,那我们都将陷入困境。消化真正的原始数据
如果你相信数据的含义不言自明,那你就错了。数据的含义永远都需要人来解读和阐释;它本身无法传递任何信息。我们处理的每一个统计数值都是基于我们对需要解决的问题、可能得出的答案以及我们能够用来协助提供答案的数据形式的主观判断。而所有这些判断都是人为的。

 

 

 

 

数据和人类的想象力
把结构应用到大数据中会抛出一些有趣的挑战-而迎接这些挑战将需要运用逻辑跳跃和横向思维,而目前为止人类大脑仍是我们所拥有的进行逻辑跳跃和横向思维的最好的工具。什么是给推特上正面的帖子或脸谱网上骂人的话评分的最有意义的方法呢?顾客位置信息的哪些方面和客户项目简介真正相关呢-而我们又可以整合或覆盖其他哪些信息来源,从而组成这些位置信息的背景/情境呢?一辆轿车的位置本身是没意义的。但如果那是一辆在黑色星期五无法在沃尔玛停车场找到合适停车点的轿车,那么这个信息就变得有趣多了。

当我们谈及在大数据时代部署计算机的力量时,我们必须要十分明确我们要求计算机做哪些事。过分依赖非由人类进行的处理能力易遭受混淆相互联系和因果关系、以及无法把有意义的关系和无意义的关系区分开来的风险;还容易导致为我们的思维设定狭隘的限制因素、而我们自己又忘了超越这些限制的风险。

我们必须要继续利用我们的大脑来判断哪些信息是有效和有价值的,以及我们如何能以有意义的方式来对它的各种形式进行编码。作为数据管理策划者,那是我们的工作。但通过充分利用当今机器的力量,我们能够极大地扩大我们能够使用的数据的范围、能够问的问题的范围以及提高我们回答这些问题的速度。当大数据和人类洞察、人类理性合理结合起来时,我们将以人们重未想象过的方式释放它们的潜力。

推荐文章

沪公网安备 31010702002009号