9.7 一个典型的聚类分析课题的案例分享

9.7.1 案例背景

A公司推出了一个在线转账的产品,用户通过该产品在线转账时交易费用相比普通的网银要便宜。在经过一段时间的测试性运营之后,企业积累了一定数量的、使用该产品的付费用户数据,现在产品运营团队需要基于该批实际使用的付费用户数据,来分析找出有价值的特定群体,进而通过精细化运营提升付费用户数量。

由于该产品上线时间很短,业务方对于付费用户的特点并不十分清楚,另外前期运营阶段并没有做专门的定向推广,所以常规的分类(响应)模型并不适合当前的业务场景。在此情况下,数据分析师想到通过聚类分析技术锁定部分特征明显的目标群体,通过精细化运营促进付费用户的有效增长。

9.7.2 基本的数据摸底

数据分析师与运营方协商,针对前期测试性运营时所产生的那部分实际付费的用户来整理特征,根据业务逻辑推测和业务经验判断,大致整理出了15个可能的特征字段。

在进行聚类分析之前,先对部分异常值进行了删除处理。关于异常值的详细介绍,可参考8.4.2节的内容。

由于在聚类分析中参与聚类的变量不能太多,同时考虑到聚类样本数量有限,因此本项目实际聚类的变量数量为4个。更多的其他变量指标可以在聚类完成后进行群体描述时添加进来,再进行群体特征分析。在聚类之前,针对所有数值型变量进行相关性检验,对于高度线性相关的变量只保留一个进入聚类过程。

考虑到企业的商业隐私,下面展示的分析过程和聚类结果是基于抽样的部分样本得到的,聚类中的群体数量不代表企业的真实用户规模,特此说明。

9.7.3 基于用户样本的聚类分析的初步结论

聚类分析过程是个不断探索、反复尝试的过程,经过多次比较,最终决定基于login freq、tp index、pv3个指标来进行聚类,在聚类完成后根据有价值的群体再增加其他有意义的字段,来进行特征描述,并得到如表9-1所示的聚类结论。

00097.jpeg

上述样本共聚类成8个群体,整体的Over-All R-Square为0.755 34,说明群体间的差异性比较明显。考虑到部分群体内样本数量太少,在实际应用中可以忽略不计,所以上述聚类结论中比较有代表性的群体为:

❑第7组,聚类样本中该组共有192个用户,占样本总量的30%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.436 632,该组login freq均值为148.92,tp index均值为11.34,pv均值为8133.23。

❑第3组,聚类样本中该组共有51个用户,占样本总量的8%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.495 173,该组login freq均值为138.17,tp index均值为68.98,pv均值为8028.51。该组与第7组中的各指标非常类似(除了tp index差别较大之外)。另外,这两组都是可以作为优质用户群体合并的,这是后来业务方的理解。

❑第5组,聚类样本中该组共有304个用户,占样本总量的47%。该组RMSSTD(Root-Mean-Square Standard Deviation)为0.258068,该组Login freq均值为21.32,tp index均值为2.56,pv均值为1808.43。

上述3组共占样本总量的85%,具有相当的代表性。

在上述基本聚类的基础上,又增加了业务方认为值得考虑的一些其他变量到这3个群组中,来进行特征描述,最后总共得到5类典型付费用户群体。经过与业务方的讨论,决定挑选其中两个群体的特征指标进行目标用户圈定,并进行具体的精细化运营。这两个群体的典型特征如下:

❑群体A。占样本数量的15%,主要特征为:全部是企业俱乐部用户,全部有在线交易历史,俱乐部年限小于4年,登录次数大于110次,pv量大于10 000,进一步过滤发现,绝大部分有P4P消耗记录。

❑群体B。占样本数量的10%,主要特征为:全部是个人俱乐部用户,全部有在线交易历史,俱乐部年限小于2年,登录次数大于100次,并且俱乐部指数小于80。

运营方根据上述两个群体特征,从参考数据中提取出了满足上述特征阀值的20000潜在目标受众,并进行了为期1周的定向在线运营活动,通过3轮营销推广活动(不同的渠道,不同的文案),产生了以下运营成果。

在为期1周的定向运营活动里,这20 000名目标受众中共937名用户被成功转化为付费用户,付费转化率为4.69%,与前期无特定目标的即时通讯工具群体运营的付费转化率不足1%进行对比,可以看到这次运营活动的效率提升是非常明显的。

为了让读者能更清楚、直观地认识到本次在线精细化运营的价值,在这里还分享一下传统领域的营销推广转换率数据,以便于大家参考和比较。2006年,世界知名的计算机硬件和软件系统服务提供商Oracle公司在中国市场做过一次比较成功的定向运营推广活动。先向200 000企业高层相关人士通过EDM(电子邮件营销)、Banner(官方网站的横幅广告)、直邮、电话访问以及夹报广告等各种传播方式传达Oracle的产品理念,经过两个月运营,有20 000目标受众对此表示出了兴趣,其阅读了宣传资料或者访问了产品宣传网站,进一步跟进,有2000人填写了反馈问卷,并下载了相关资料,最终,Oracle得到了900个销售机会。Oracle公司本次为期3个月的定向运营,得到的销售计划转化率为0.45%。