郜耿威

齐家网数据产品经理


多年金融,O2O 互联网行业数据仓库和数据产品开发和设计经验;历任东方财富,途牛,齐家网数据规划,产品分析职责。


出品|中国统计网(ID:cntongji)

嘉宾|郜耿威

采访|赵良

审核|赵良

编辑|惊渡


1、谈谈您对数据产品概念的理解


我09年开始接触数据工作,在这么多年实际工作中,从我的角度来说,数据产品可以总结为一句话: 数据产品是以数据为原料、以分析和挖掘为手段来解决用户问题的一个系统。比如说百度的搜索,就是一款经典的数据产品;它的原料是蜘蛛从各个网站收集来的数据,使用分析、挖掘、清洗、排序等一些算法方面的手段,将最符合用户要求的搜索结果呈现给用户。

 

2、在您看来,甲方对内的数据产品做的多还是对外的数据产品多?


对内的数据产品和对外的数据产品基本上都不存在哪方面多哪方面少的概念。在互联网公司,数据产品都是分为两类。一类是对内的数据报表用以辅助公司决策;另外一类是对外的,比如说在电商网站的搜索框以及推荐栏目,它们的实质其实就是个数据产品。

 

3、甲方基于哪些方面的考虑来决定做一款数据产品?


首先我一般把数据产品分为三类,然后再分别来看甲方为什么需要这一类的产品。第一类是搜索类,比如说百度搜索;第二类是推荐类,比如说淘宝里的猜你喜欢;第三类是决策类,决策类又分为两种,一种是辅助决策类数据产品,比如说数据报表,能够让使用者全面了解公司业务情况,但这类产品不能直接解决问题。另外一种可以直接解决用户问题的数据产品,比如说我们常用的自动驾驶技术,它是包着硬件外壳的数据驱动产品。


对于一般公司,当它的业务发展到一定规模,它的数据结构会非常复杂,一些简单的取数满足不了管理层对于精细化运营的需求。这时候他可能需要一个数据部门,来开发一套基于现有的数据仓库的辅助类决策产品。比如说它想要看一个报表,这个报表可能从百度搜索过来有多少人,这些人里有多少转化,有多少人下单。当它的业务达到一定程度,需要更精细化的分析,来降低它的成本,促进它的转化。它才会需要对内的报表类数据产品。


但对于to C端的公司来说,比如电商平台,一开始就需要给用户提供一些搜索,搜索的背后也是一种数据产品。这种数据产品在业务发展的初期就需要来做了。对公司业务的使用方来说, 需要这类数据产品来满足最初的商业模式。


所以要分两类来看,对外的数据产品在业务发展的初期就需要来做;对内的数据产品是公司有一定的数据积累、发展到一定程度才需要做。

 

4、数据产品的立项过程以及后续团队的组成?


数据产品的立项和一般的产品基本一致,首先是由于业务的发展,内部或外部有了一些模糊的需求,然后产品经理做调研,逐层申报,领导调拨一些资源,立项,组织团队开始开发。


数据产品团队,一般是有五种职位构成:


(1)  数据总监:对内统管产品设计,开发全流程;对外争取资源,和其他部门沟通协调等。


(2)  数据产品:负责数据产品的规划设计,数据源头的沟通协调,数据质量的总体把控。


(3)  数据分析:负责研究业务,制定挖掘策略,算法,等等;有些公司分析师要负责撰写业务分析报告来辅助决策。


(4)  数据开发:负责根据数据分析师和数据产品的要求,进行数据抽取,清洗,挖掘计算。


(5)  前端开发:负责数据报表类产品需要前端界面实现,以及对外数据接口的开发和管理。


在实际过程中,有可能一个人身兼多职。比如,在小型公司,产品经理同时担任数据分析师、数据建模人员的角色。 

 

5、一款好的数据产品主要是解决业务的哪些方面?


从我接触的数据产品来说,说大一点最终解决的目的只有一个,就是提升的公司的价值。从提升公司价值的角度来说,又可以分为几个方面:


(1)促进转化率,提升长尾产品销量(推荐类产品);


(2)有效帮助用户找寻目标物(搜索类产品)


(3)提供各个环节的效率分析帮助使用者做决策(报表类产品)等等。


6、像甲方这样的中等企业,对内的数据产品解决的是哪些问题?


在我看来,对内的数据产品解决的问题主要分两块,一块是给公司高层管理人员看的,比如总的数据波动,对公司业务有一个更深入的了解。另一块是给每一个业务人员分析业务细节,比如运营市场部做投放的时候,可以通过报表类的数据产品,找到哪些关键词的效率最高、性价比最高,来进行工作方面的优化。

 

7、如果要实现这样一个数据产品的话,需要哪些条件?


总结来说有以下条件:


(1)公司高层和业务人员有一些基础的数据意识,有利用数据辅助决策的需求。


(2)公司的数据有一定的积累,有一定的数据基础。


(3)公司愿意持续性的投入一笔资金来维持数据团队的运转。

 

8、从业务方的角度来看,这个场景应该是怎么样的?比如业务方提出要求看广告关键字投放,数据产品经理是否需要一个文档,能够满足业务方了解基本场景要求?


业务的场景非常多样化,市场投放,各部分绩效考核,某场活动的用户来源分析等等;


当数据团队开始运行,产品经理就要考虑公司的业务有哪些,各部门业务人员的需求分别有哪些。这需要产品经理去和各个部门进行沟通、对接,了解对方的业务流程,和业务方一起做这件事情。有时业务方提出的要求并不合理,搞不清自己到底想要的是一个怎样的结果。这就需要产品经理去帮助他们梳理这个业务流程,明确核心指标是哪些。双方经确认后,根据业务方需求和我们自身的产品规划,出一份产品说明文档。之后开发人员根据产品的需求,设计数据仓库,ETL,前端展示,最后交付验收。

 

9、针对一般数据产品需求这块,数据权限是怎么控制的?


根据使用方的级别和负责的业务范围来控制权限。除公司高管外,其余业务部门要以部门为单位设立一个数据安全负责人,该部门其余人员申请权限,都必须得到该数据安全负责人的批准。数据安全负责人负责审核部门内人员的数据权限和范围;数据部门根据该负责人的提交的资料进行相应的数据访问权限开放和收回。

 

10、一款数据产品,在开发前开发后,对公司来说会有什么改变?


就报表类产品来说,主要是使得业务部门工作效率和质量有提升。原先他们需要各个环节去找开发求数据,然后再拼起来,难免要耗费很多精力,并且出错的情况也多。有了统一的报表之后,他们用起来方便,数据出错的概率也降低很多。而推荐和搜索类产品无疑是提升了商品或信息在用户面前曝光度和吸引力,从而有效提升了公司的销售业绩。

 

11、设计数据产品的时候,对于整个技术架构,从数据产品到ETL到数据仓库,或者中间库的过程,以及 Hadoop、Spark这类计算,如何来提高报表的效率?


Hadoop、Spark这类计算都是通用的,非实时计算用不到spark这块。数据产品规划好之后就需要开发人员通过ETL工具从各个数据源抽取数据,第一层架构基本上都是源数据层,然后简单清洗(比如日期格式变换,维度数据,测试数据处理等),然后是根据各个业务规划,进行业务内数据串联,构建小型数据集市,最后才是前端的呈现层,一般会有3-5层。工具方面:底层存储主要是Hadoop的HDFS,应用层一般有HIVE,HBASE,storm,kafka等等。

 

12、从一款数据产品来看,比如DMP数据综合管理,数据产品经理怎么去统一口径?


数据口径这块是很难定义的。从公司从上层到下层,他们在数据方面基本上都是非专业的,有些人连uv、pv这样的基本指标都分不清。这就需要数据产品经理有定义指标和推广的能力,去跟公司各个部门的领导和上层沟通,去规范他们工作中不合理的说法和带有个人偏见的说法,形成一个统一的标准,然后不断的去强化和推广。

 

13、您经历了很多数据产品的开发,那您认为一款数据产品是否成功有什么判断依据?


能够帮用户解决问题是一款数据产品成功的唯一标志。具体判断标准有三个方面:一是及时性,能不能及时把数据呈现给用户;二是准确性,所有数据在抓取、清洗和处理的过程中,难免会出现误差,那这个误差就需要被控制在可忽略的范围内,误差不能太大;三是要适用,用户在使用这款数据产品的时候,能不能很快的找到他所需要的数据,能不能很快把这些数据呈现的结果应用到业务中去。在不同的产品不同的业务部门可能分析的思路是不一样的,在这一块数据产品就与业务熟悉与沟通,了解对方实际是如何分析的,这种情况下设计出的数据产品才有可能能够让人用的好、用的开心、用的舒服。

 

14、现在我看外面有很多的数据产品,对我们自身的例如BI数据产品和外部的其他数据产品相比较的优势和劣势在哪里?


优势:最大的优势在于灵活、可定制,比如对公司自身的订单采集,在链条较长时,自身的内部系统能够轻易的追踪,对流量和业务进行漏斗分析时是非常容易完成的,但是像外部的数据产品的架构比较固定,不太好处理,常用的百度数据统计就只是几个常用的模块主要集中在流量方面,对业务就很难支持。还有一些通用的外部报表工具,能够在一定程度上满足定制,但是在分析思路、设计思路、上钻和下钻中不一定能满足公司内部一些部门的特殊需求。


其次是数据安全度高,基本是公司内网,造成数据泄露的风险小。


劣势:主要集中在成本,外部的数据产品的使用成本相对于公司内部自己开发一套来说,是比较低廉的。

 

15、要成为数据产品经理,对于应届毕业生,在招聘时,他们的哪些特点会吸引你?如果是一个有一定工作经验的人转而做数据产品经理,他的哪些特质和特长会让你感觉眼前一亮?


对于应届毕业生,在工作经验和技术方面都相对薄弱,所以和一般的产品经理类似,我会主要考察他解决问题的个人思路,出一个小型的分析类问题,不一定是数据方面的,看他解决问题的思路包括切入点、展开点和收尾方式。但对于有一定工资经验的人,他的产品观和世界观是相对固化的,这时候就需要考虑他的产品思维是否与我们的部门相匹配,另外技术的宽度与深度能否胜任公司内部相对应产品的要求。

 

16、对于数据产品这个职业,未来的职业发展会如何,在工作中需要注意什么?


首先是学习能力,数据产品尤其是对于内部决策是一个跟随类的产品,跟随类产品需要随着公司内部的业务变化而变化,尤其是对于一些内部业务发展较快的公司来说,它的业务模式可能每天都在变,那么你本人就需要较快的学习吸收能力。另外技术方面和产品形态的更新也是非常快的;早期的数据产品只是简单的报表、使用一些产品数据库,但是从大数据技术成熟开始,各种数据处理技术层出不穷。对处理数据方面的很多技术,产品经理不需要有很深的理解,但是对基本的设计思路、技术解决方案需要有所了解,否则出了问题,你可能都不知道问题出在哪。而且现在这一方面的发展是非常快的,可能又有一种新的数据架构要出现了,而且本身hadoop是一个比较庞大的体系,所以说学习的能力是非常重要的。


其次是养成做事的严谨性,之前我有一个相熟的技术方面的能人,说过一句话“你现在写的每一行代码,都决定了你未来的高度!”这句话是指一个人在写代码时是否周到、是否用心、是否仔细,决定了他工作中的一些习惯和思路,也可能就决定了他未来的发展。但是我们很确信严谨性是第一位的,也就是你做的方案是有漏洞的还是是一丝不苟的。因为在一般的产品中你做的方案可能是会有瑕疵的,在运作了之后可以还进行逐步的修改,但在数据方面如果你的方案有漏洞,可能就会导致他人分析数据后的结论是错误的,对业务的影响是比较大的,而且事情已经发生,后期的补救效果是很微弱的,无法弥补损失,所以对于严谨性的方面大家都要做到对自己苛刻一些。主要就是学习能力和严谨性。

 

17、针对严谨性,我们的数据产品在设计初期,如何能确保不尽量的出错?有没有什么好的方法?


关于严谨性这一块,我认为不仅在设计初期,而是贯穿整个产品生命周期。


方法我觉得有三点:首先是需要有一个严谨的意识,严谨的意识是需要日积月累,经常反省慢慢养成的;第二点是勤快,主要表现在和业务方的沟通,了解对方的分析思路和方法,能确保产品最起码的样式和分析逻辑,不至于经常修改,还要勤与开发部沟通,因为所有的数据产品的数据来源尤其是业务方面的数据主要都来自于开发的业务库,业务库是经常有变动、调整的,经常的了解这些变动并思考这一变动是否会影响数据的准确性。在有这两方面的意识和自身严谨的潜意识后,第三需要多看自己的数据,我对自己所带的数据产品经理都会要求他们每天早上一来就对自己的报表进行分析,对于报表中某些地方常见的数据波动范围有一定的掌控,这样一旦有数据异常我们就能及时知晓并跟进。

 

结束语:谢谢耿威的精彩分享,未来如果有其他的问题我们也会代为转达。



End.


本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:ishujiang),转载时请注明作者及出处,并保留本文链接。




数匠往期专访回顾

LoveData大数据100+系列访谈第001期——专访 | 阿里巴巴资深数据分析师的成长之路

LoveData大数据100+系列访谈第002期——专访 | 北京大学高材生的数据分析学习历程

LoveData大数据100+系列访谈第003期——专访 | 高级BI经理:流量分析之实际操作分享

LoveData大数据100+系列访谈第004期——专访 | 高级BI负责人:初创型企业如何搭建数据体系

LoveData大数据100+系列访谈第005期——专访 | 涨姿势了!数据分析在航空业可以这么玩

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

作者:佚名
来源:中国统计网