案例:例如网易新闻APP日活突然下降5%,需要尽快排查一下数据下跌的原因。
这是一道经典的数据分析师面试题,考察的重点不在于从哪些指标去分析,而是面对这样的问题时的分析框架与逻辑思维,这是一个优秀的数据分析师必须具备的能力。
针对数据异常类问题,可参考如下分析框架:
1. 对数据异常原因做出假设,利用数据验证
影响DAU因素较多,对所有维度直接拆解耗时耗力。所以需要结合以往经验及各种信息,对数据异常的原因做出假设,然后对数据从不同维度拆分来验证假设。可能随着之前的假设的验证不断进行新的假设,直到定位原因。
2. 确认数据真实性
将时间轴拉长(3个月),做同比和环比,看近期异常还是历史异常;
查看与该指标关联的其他指标是否异常;
找数据流相关产品和研发确实数据真实性。
3. 常见拆分维度
根据以上维度拆分之后,每项数据都需要和历史数据做对比,计算影响系数。
影响系数越大,说明此处为主要原因所在。
通过上述维度进行初步拆分,可以大致定位数据异常范围。
4. 外部原因分析
外部:外部原因分析可以根据PEST(政治、经济、社会、技术)模型进行分析。
5. 内部原因分析
通过初步分析定位范围之后,需要进行进一步的排查,一般从三个维度来分析:产品、技术、运营;可以和这几个人一起拉一个会讨论一下。同时应注意数据统计口径是否发生变化。
6. 总结
所以我们整个的分析流程大致为:
先结合以往数据异常进行假设 —— 在一个假设得到验证之后 —— 从不同维度进行拆解,确定异常范围 —— 从产品、运营、技术侧逐一排查,最终找到原因。
以上分析框架不仅局限于DAU波动,对于数据异常类问题即可根据以上模型进行分析。
想要更多方面的知识分享吗?可以关注我的其他专栏:
数据科学-机器学习:这里有常用的机器学习算法非常通俗的解释,也有不同算法之间的比较,在这里,你会发现,算法其实就在我们的生活中。
数据科学-软件技能:在这里,你可以快速掌握入门数据科学领域所需的技能,让你在大数据的世界中,能够随心所欲的把玩数据,让数据给你答案。
数据科学-统计学:在这里你可以了解统计学是如何发展的,并且在实际生活和工作中起到了什么至关重要的作用;这里,同样有全网最全面、逻辑最清晰的AB测试流程总结,我力求构建起理论与实践的桥梁,让大家将统计学知识在工作和生活中运用自如。
数据分析师养成之路:数据分析师现如今风头正盛,各种培训机构,社群组织鼓吹7天、一月成为数据分析师,或许这皆有可能。但是我认为想要成为一名真正的数据分析师,是需要不断成长的,需要逐步构建起一套能够洞察事物的逻辑思维与分析框架,不止是在工作,同样,也在生活中,这是一个漫长的过程。
参考: