第6章 数据挖掘项目完整应用案例演示

举一隅,不以三隅反,则不复也。

——《论语·述而》

6.1 项目背景和业务分析需求的提出

6.2 数据分析师参与需求讨论

6.3 制定需求分析框架和分析计划

6.4 抽取样本数据、熟悉数据、数据清洗和摸底

6.5 按计划初步搭建挖掘模型

6.6 与业务方讨论模型的初步结论,提出新的思路和模型优化方案

6.7 按优化方案重新抽取样本并建模,提炼结论并验证模型

6.8 完成分析报告和落地应用建议

6.9 制定具体的落地应用方案和评估方案

6.10 业务方实施落地应用方案并跟踪、评估效果

6.11 落地应用方案在实际效果评估后,不断修正完善

6.12 不同运营方案的评估、总结和反馈

6.13 项目应用后的总结和反思

数据挖掘是科学,也是艺术,或者说一半是科学,一半是艺术。所谓科学,是指数据挖掘的算法、流程和分析技术的应用是科学的、严谨的;所谓艺术,是指在具体的分析过程中,融入了分析师的创新思维、主观的判断和取舍,尤其表现在挖掘思路的推敲和衍生变量的创建等方面。

本章将以一个完整的数据挖掘项目为例来进行分享和跟踪,包括从业务需求的提出到落地应用反馈的全过程,一方面揭示数据挖掘全过程中所有环节的顺序、内容和相应的关键目标,另一方面从科学和艺术两个方面来具体阐释数据挖掘中各个步骤的特点和价值。

事物的发展很少是一帆风顺的,更多的时候充斥着反复曲折,呈螺旋前进状态,只要每一次的反复和曲折都能够有所提升和突破,那么离成功就会越来越近了。本章的案例也真实地反映了商业实战中的数据挖掘是如何在曲折反复中逐步前进的。完成一个好的模型,达成一个满意的业务应用结果,这只是数据分析师分内的任务和工作职责;而自觉主动地从项目中总结、提升自己,从挫折中发现自己的不足,从而积极改进、完善,更应该成为数据分析师的态度和专业理念。

通过本章的案例,希望向有缘的读者传递以下几个方面的信息:

❑数据挖掘实战中的流程会有一些基本的顺序,按着流程进行挖掘是数据分析严谨性的体现。

❑数据挖掘和模型搭建只是数据化运营中的一个环节,数据化运营是跨团队跨专业的协同作业,数据挖掘模型和结论只有在落地应用的业务场景中才能得到检验,才能体现出价值。从这个角度来说,没有落地应用的数据分析和数据挖掘还不是严格意义上的“完成”。

❑落地应用中的运营方案对模型的应用效果影响极大,所以数据分析师不仅要熟悉数据分析和模型搭建,还要熟悉与运营相关的业务技能,这也是数据挖掘和数据化运营中复合型技能的要求。

鉴于对企业商业机密的考量,本章的项目描述中对于大部分数据都做了有意识的修改和处理,所以案例中的数据已经不能代表企业的真实数据特征了,特此说明。