第19章 几个经典的数据挖掘方法论

因为经典,所以值得回味。

19.1 SEMMA方法论

19.2 CRISP-DM方法论

19.3 Tom Khabaza的挖掘9律

数据挖掘作为一门复合型应用学科到目前已经有将近30多年的发展历程,经过一代又一代挖掘者的不懈探索和推动,已经产生了一系列经典且得到广泛实践检验的分析应用方法论。作为数据分析师和数据分析爱好者,学习、掌握并努力实践了这些方法论就等于是站在了巨人的肩膀上,掌握了这些先进的思想武器,可以帮助自己找到正确的分析方向。

本章着重介绍目前在数据挖掘实践领域影响深远、奉为圭臬的SEMMA方法论和CRISP-DM方法论,另外还介绍了来自Tom Khabaza的著名挖掘9律(9 Laws of Data Mining)。

这些方法论来源于数据挖掘业务实践,可有效服务于数据挖掘的业务实践。它们就像夜空中的北斗星,让数据分析师面对纷繁复杂的业务分析需求,不再迷茫,更可以为数据分析师提供强有力的心理支持。

让我们一起走进经典,掌握经典,最终能自由地让经典武装自己、提升自己。