6.3 制定需求分析框架和分析计划

在本阶段,针对前面对业务的初步了解和需求背景的分析,数据分析师制订了初步的分析框架和分析计划。

分析框架的主要内容如下:

❑分析需求转化成数据分析项目中目标变量的定义。具体到本案例,高活跃度免费用户的流失是这样定义的,在某个时间点(A点)用户是满足高活跃度用户标准要求的(属于高活跃度用户群体),随后过A点7天,也就是1周之后,这1周也是配合运营的时间节奏来确定的,该用户从高活跃度群体跌落到中级甚至是最低级的活跃度群体里,并且在过A点14天,即2周之后仍然没有回到高活跃度标准的,就定义为高活跃度免费用户的流失群体。数据分析师在给出这个初步定义时,要强调上述高活跃度用户的流失定义只是当前的初步定义,随着后期进行数据抽取,并与业务方进一步讨论,有了更深入的分析后,上述流失的定义是可以修改和完善的,修改和完善的最终目的是为了数据分析和挖掘的工作能最有效地支持业务应用,并提升业务工作效率。

❑分析思路的大致描述。具体到本案例,分析思路是通过搭建分类模型来比较准确且有效地来提前锁定有可能流失的用户群体。

❑分析样本的数据抽取规则。关于数据抽取的规则,限于企业的商业机密,不能分享太多,基本上是指根据上面目标变量的定义,选择一个适当的时间窗口,然后抽取一定的样本数据。

❑潜在分析变量(模型输入变量)的大致圈定和罗列。经过前期与业务方的调研和沟通,数据分析师和业务方已经大致圈定了相关变量,即从业务经验判断和以往的分析工作中,提炼整理出来的大约63个原始变量,具体见表6-1。因涉及企业的商业隐私,这里就不具体说明各变量的中文含义了,总而言之,是从业务经验的角度大致罗列了这些似乎对目标变量的预测有意义的相关变量。

00042.jpeg

00043.jpeg

❑分析过程中的项目风险思考和主要的应对策略。具体到本案例,项目风险思考主要包括模型效果不好的可能性,即有可能分类模型的思路被证明是不好的,也有可能是模型效果不好,或者准确度不高,或者模型不稳定。是否有相应的分析对策来部分弥补,如果分类模型的思路被证明是行不通的,可以退而求其次进行流失用户的群体特征细分,或者重新定义流失用户等。

❑项目的落地应用价值分析和展望。具体到本案例,则主要集中在3个方面:模型投入应用后提前锁定有高流失风险的高活跃度用户群体,从而可以使运营方有针对性地开展挽留、服务等运营工作;可以将建模过程中发现的有价值的、最可能影响流失的重要字段和指标选择性地提供给运营方,用于制定运营方案和策略的依据和参考;针对影响流失的核心指标和字段,可以提供给相关业务方,以作为进行客户关系管理的依据和参考线索。

分析计划主要是指分析过程中时间节点的安排和相应的分析进度的设置,具体可见以下示例,见表6-2。

00044.jpeg