第9章 聚类分析的典型应用和技术小窍门

物以类聚,人以群分。

——《战国策·齐策三》

9.1 聚类分析的典型应用场景

9.2 主要聚类算法的分类

9.3 聚类分析在实践应用中的重点注意事项

9.4 聚类分析的扩展应用

9.5 聚类分析在实际应用中的优势和缺点

9.6 聚类分析结果的评价体系和评价指标

9.7 一个典型的聚类分析课题的案例分享

从本章开始到第13章,将针对常见的分析(课题或算法)类型分别进行详细介绍,包括典型应用、案例、模型的评价指标和体系、相关技术应用在实践中的优点和缺点、主流的应用场景和扩展的应用场景等,还有一些重点技术要领和小窍门。

本章则是针对聚类分析的上述相关问题来展开讲解和进行总结的。之所以把聚类分析作为第一个专题来进行探讨,主要是想强调聚类分析技术在数据分析挖掘中的重要性和常用性,聚类技术一方面本身就是一种模型技术,通过有效聚类后的结果常常就可以直接指导落地应用实践;另一方面聚类技术又常常作为数据分析过程中前期进行数据摸底和数据清洗、数据整理(数据转换)的工具。鉴于聚类技术在实践应用中的上述多样性、多元性,数据分析师应该要对该技术的实践应用有比较深刻的认识和比较熟练地掌握。