推荐理由:大数据及移动互联网时代,每一个使用移动终端的人无时无刻不在生产数据,而作为互联网服务提供的产品来说,也在持续不断的积累数据。数据如同人工智能一样,往往能表现出更为客观、理性的一面,数据可以让人更加直观、清晰的认识世界,数据也可以指导人更加理智的做出决策。
(本文由 @记小忆 授权发布,未经作者许可,禁止转载)
数据驱动的时代,无论你的工作内容是什么,掌握一定的数据分析能力,可以帮助你更好的认识这个世界,更好的提升工作效率。
数据分析流程主要分为五个关键环节:明确数据分析目的、明确数据源及数据口径、数据处理、数据分析、输出。
一、明确数据分析目的
任何一件事在做之前都是有目的性的,数据分析也是如此,在进行数据分析之前首先要明确数据分析为什么要做?下面通过用户、需求、场景三要素拆解法来明确数据分析的目的。
1、用户
这里提到的用户是指数据分析内容或者结果给谁看?这里的目标用户主要分三类:你自己、企业内部业务部门、外部客户。这里主要对后两种进行解析。
企业内部业务部门:
这类用户通常会通过制定不同策略提升企业某些指标的提升,可以是市场部门、运营部门或者是维系部门。他们往往指导企业内部积累了大量数据,但是不知道如何使用,如何通过数据分析形成有效的决策。
外部客户:
这类用户通常不具有某一领域或多个领域的行业数据,希望通过这些数据了解他的用户或市场,而恰巧你的企业具备这样的数据,这种情况下通过数据价值变现,形成对外的数据分析输出,对外部用户来说可以更好的了解市场,对于你来说也可以通过数据形成价值变现,为企业带来收益。
2、需求
你的用户即数据分析问题提出者为什么要做数据分析,他们是希望通过数据分析发现问题还是希望提升某个业务指标,这些都是在做数据分析前需要了解的,只有了解了需求才能制定更合理的数据分析思路(后面会介绍到数据分析方法)。
3、场景
场景更多体现的是数据分析的场景,如业务部门想了解用户在注册流程中的用户流失原因,那么这就是问题的场景,要根据场景去定义问题,梳理数据分析思路,选择数据分析的方法。
二、明确数据源及数据口径
1、数据源
数据的获取主要有三种方式,第一种通过一些基于前端页面的数据采集工具获取,如GrowingIO等可视化的数据采集产品;第二种是在产品设计过程中通过数据埋点的方式,在需要数据时可以进行简单提取,这种方式的前提是在产品规划阶段就已经对未来的数据获取提前做好了准备;第三种是如果前期没有进行功能埋点、可视化的采集工具也无法获取数据时,找研发团队通过后台脚本或技术研发的方式获取数据。
2、数据口径
数据口径,即定义某一个数据指标的含义。举个简单栗子来说,针对于用户流失指标的定义,不同的产品或者不同的领域会有所不同。对于普通电商产品来说,用户三天之内没有登录或购买就是流失,但是对于奢侈品电商来说,仅仅用几天没有登录或购买即算作用户流失是不合理的。
对于数据口径的明确,需要结合数据分析任务提出者的需求以及具体业务场景,定义清晰的数据口径对后面的数据处理以及数据分析具有关键的意义。
三、数据处理
数据处理阶段主要做的工作是数据清洗、数据补全、数据整合。
1、数据清洗
发现数据中的异常值,如对连续多天的用户登录数据进行处理时,如果有一天的登录数远远超过正常值,那么就需要分析,该天是否有重大营销活动,还是采集数据时出现的错误,通过异常值不仅可以发现数据采集方法的问题,同时可能通过异常值找到数据分析的目标。比如对信用卡诈骗的分析,就是通过查找异常数据的方式。
2、数据补全
针对数据缺失的情况如何解决,一种方式是根据数据前后的关联关系填充平均值等方式,另一种则是直接选择丢失该条记录不用于数据分析。两种方式各有优劣,建议结合具体问题具体分析。
3、数据整合
在采集数据时,不同类型数据之间可能存在潜在关联关系,通过数据的整合,丰富数据维度,更利于发现更多有价值的信息。如用户注册数据与用户购买数据相关联,可以通过用户的基础属性信息判断用户购买的商品是自己使用还是送人等等。
四、数据分析
数据分析思路又叫数据分析方法,数据分析一定是以目的为导向的,通过目的选择数据分析的方法。通常来说主要有以下集中分析思路
1、异常分析
通过数据分析发现异常情况,找到解决异常问题的方法。
2、寻找关联关系
关联关系也可以成为购物车分析,耳熟能详的沃尔玛尿布与啤酒的案例就是关联关系的最佳实践,通过分析不用商品或不同行为之间的关系,发现用户的习惯。
3、分类、分层
通过用户特征、用户行为对用户进行分类分层,形成精细化运营、精准化业务推荐,进一步提升运营效率和转化率。
4、预测
通过用户历史行为预测用户未来可能的行为,提升用户感知和使用体验。
五、输出
在前面层提到,数据分析的目的是通过数据清晰的了解用户、产品和当前业务形态,从而得到有效的战略决策指导下一步的发展。
如何通过数据清晰了解用户、产品和业务生态?一行行枯燥的数字是无法让业务部门或外部客户直观了解数据背后的含义的,所以需要通过数据可视化的方法,简单来说就是将一行行的数据转化为图表,直观化展现数据的趋势、数据之间的关联关系等等。在对数据可视化时,需要着重考虑数据有几个维度、数据要向看的人展现什么,这些都影响着数据可视化的形式。
如针对注册用户男女性别比例的展现可以用饼状图,展现注册用户数随时间变化的增长趋势可以用曲线图,展现注册用户归属地可以通过柱状图或地图等等。在选择可视化方式时,要充分考虑数据的特点以及希望用图表展现出来的内涵是什么,这样才能用合理的方式展现出更直观的分析结果。
此外,数据分析的输出通常以数据分析报告的形式展现,数据分析报告的主要结构如下:
- 数据分析背景
- 数据来源及数据说明
- 数据分析方法
- 数据可视化
- 数据决策
以上是一份较为正式的数据分析报告的大体框架,如果针对日报一类并不要求正式性的数据分析结果展现,则可以具体问题具体分析。
六、总结
数据分析方法论一定是为指导具体工作实践而服务的,所以仅仅掌握方法论并不够,还要通过实践不断完善优化方法。只有当你真正去做数据分析这件事时,才能发现自己的不足,说再多不如直接去做。