1

如何才能准确预测一位陌生女子何时怀孕?

杜西格在《习惯的力量》一书中曾讲过一个故事:

有一天,一个男人冲进了他家附近的一家零售连锁超市——塔吉特商店(Target),要求经理出来见他。他气愤地抗议说:“我女儿还是高中生,你们却给她邮寄婴儿商品的优惠券,你们是在鼓励她怀孕吗?!”店铺经理立刻向来者承认错误,但是经理并不知道这一行为是总公司运行数据挖掘和个性化推荐的结果。

没多久,这位父亲前来道歉,因为这时他知道自己的女儿的确怀孕了:“我跟我的女儿谈过了,她的预产期是8月份,但我完全没有意识到这个事情的发生,应该说抱歉的人是我。”塔吉特比这位父亲知道自己女儿怀孕足足早了一个月。

这是一个在营销界流传颇广的数据营销案例。

美国折扣零售商塔吉特公司使用大数据的相关关系分析已有多年。类似版本的故事,美国《纽约时报》也曾在一份报道中阐述过,塔吉特公司怎样在完全不和准妈妈对话的前提下预测一个女性在什么时候怀孕:

收集一个人可以收集到的所有数据,然后通过相关关系分析得出事情的真实关况。

塔吉特公司的分析团队首先查看了签署婴儿礼物登记簿的女性的消费记录。他们注意到,登记簿上的妇女会在怀孕大概第三个月的时候买很多无香乳液。几个月之后,她们会买一些营养品,比如镁、钙、锌。

最终,公司找出了大概20多种关联物,这些关联物可以给顾客进行“怀孕趋势”评分,甚至使得零售商能够比较准确地预测预产期,进而在每个阶段给客户寄送相应的优惠券,从而提升商品销售,这才是塔吉特公司的目的。

2

在《大数据时代:生活、工作与思维的大变革》一书中,作者维克托·迈尔·舍恩伯格也讲一个大数据运用的故事:谷歌为什么能够预测冬季流感的传播。

互联网巨头谷歌的工程师们曾在《自然》杂志上发表了一篇引发美国公共卫生官员们广泛关注的论文,解释了谷歌为什么能够预测冬季流感的传播——不仅是全美范围的传播,而且可以具体到特定的地区和州。

原理如下:

谷歌保存了多年来所有的搜索记录,而且每天都会收到来自全球超过30亿条的搜索指令。谷歌把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。

为了测试这些检索词条,谷歌总共处理了4.5亿个不同的数字模型。在将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后发现,他们的软件发现了45条检索词条的组合,一旦将它们用于一个数学模型,其预测与官方数据的相关性高达97%,从而判断出流感是从哪里传播出来的,而且非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。

2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。但是,谷歌不需要分发口腔试纸和联系医生——它是建立在大数据的基础之上的。

故事讲完了。我们想说的是,大数据不是束之高阁的理论,也不是空洞的夸夸其谈。别人家的公司这么会玩大数据,你们家的大数据神技修练到第几层了?

版权声明:本作品由作者首发于经理人分享(managershare.com),若非授权,转发时切勿删除版权信息,否则追究相应责任。

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

(本文属 @经理人分享 原创,转载请注明出处并附上链接。)