5.3 技术尖端论

“技术尖端论”也是数据分析师,尤其是年轻的刚接触数据分析应用的数据分析师里比较有代表性的一种错误观念和思想。持有这种观念的分析师,会过分追求所谓尖端的、高级的、时髦的、显示自己技术水准的数据分析挖掘技术,认为分析技术越高级越好,越尖端越厉害。在数据分析项目实践中的主要表现就是面对一个分析课题,持“技术尖端论”的分析师首先想到的是选择一个最尖端的、最高级的分析技术去解决,而不是从课题本身的真实需求出发去思考最合理、最有性价比的分析技术。

任何一个数据分析课题,至少都会有两种以上的不同分析技术和分析思路。不同的分析技术常常需要不同的分析资源投入,还需要不同的业务资源配合,而产出物也有可能是不同精度和不同表现形式的。这其中孰优孰劣,根据什么做判断呢?是根据项目、课题本身的需求精度、资源限制(包括时间资源、业务配合资源、数据分析资源投入)等来做判断和选择,还是按照分析技术的高级与否做判断和选择?不同的考虑方式和选择结果,决定着项目的资源投入和对业务需求满足的匹配程度,一味选择尖端的、高级的算法和分析技术很可能会造成项目资源投入的浪费,并且很可能不是最适合业务需求的方案。最贵的,不一定是最适合你的,我们在生活中的体验和感悟同样也是适用于数据分析课题的场景和数据化运营应用的。

举一个实际的案例来说明。如某在线新产品上线试运营了两个月,产生了一批付费购买的用户,现在产品运营团队希望能比较深入、全面地了解目标用户的基本特征和大致的群体规模。针对这个分析需求,基于当前的业务背景(刚刚上线运营两个月)应该用什么样的分析思路和分析技术呢?目标用户特征群体筛选课题的解决思路,至少有3种以上的分析技术可以完成:有简单的技术,如统计描述总结、相关性分析、假设检验等;有常规的技术,比如聚类分析等;也有更加需要资源投入的技术,比如针对单个目标用户的预计付费概率的预测模型。具体到本案例,由于产品刚刚上线运营两个月,业务方对目标用户的大致情况还没有一个详细、全面的了解,而且无法使用精确的付费概率预测模型(2个月的数据很难完全支撑起一个有效的预测模型的搭建和验证),所以综合考虑,简单地统计描述总结,进行相关性分析和假设检验是现阶段、现有业务背景下比较具有性价比的优选思路和解决办法。

追求技术的进步和发展本身没有错,但是一味强调技术的先进性,忘记了业务因素对分析课题的决定性影响,忘记了数据分析工作的目的是为业务服务、满足业务需求的根本宗旨,实际上就是本末倒置、舍本逐末,其实践后果通常就是浪费了分析资源,或者丢掉了最佳性价比的方案,或者根本无法与真实的业务需求有效对接。

应对并防止“技术尖端论”的一些有效的管理措施和管理制度包括5.2节谈到的课题需求评估机制,即用专家集体的力量提炼出最合适的、最具性价比的分析思路和技术,以及经常性的分析师团队的技术分享,如项目课题分享、同行间的课题交流,从不同的实际案例中深刻体会如何权衡分析思路、为什么“适用性”比“尖端性”更好、为什么“性价比”的考虑比单纯的“技术性高低”的考虑更可靠更有意义,从而逐渐开阔分析师的思路和视野,丰富分析师的经验。