昆仑数据线上课No.4 | 工业大数据实用“避坑”指南

来源: | 作者:pmod6d781 | 发布时间: 2020-03-04 | 6254 次浏览 | 分享到:

不光在码头，其实工厂内的调度优化也是这样，我们虽然追求全局优化，但还是要考虑现实的条件，哪些数据不可得，包括得到之后他节省的成本到底有多高，都要认真考虑，当然技术上肯定会尽最大的努力来做。

3、空中楼阁：与组织形态失配的数据分析很难落地。

过去我们也做过一些，从技术上可行，甚至精度还不错，例如在设备故障诊断里一些重大部件的故障预测，虽然样本比较少，结合一些机理和数据挖掘知识，有的时候还可以做出来一个不错的结果。但是结果落地的时候，其实大家很沮丧，问题就在于我就发现一个问题，有的时候预示着在现有的考核体系下，可能会某种程度上暗示着现有的运维团队做的不到位，过去的定期维护做的不太好。这时候要指望现场一线团队给出真实的或者及时的反馈，通常很难。

大家可以联想一下，包括质量提升等各种课题都会遇到类似的问题，在工业以外，甚至在商业里的很多预测，推行的时候也会遇到类似的问题，这个课题正好是某个部门负责的，他天天用自己经验来做，现在你用数据分析比以前更好，除非这个项目从归口，从组织形态上做一定的调整，否则通常很难让他真正用起来。

4、避实就虚：追 “时髦”，讲“套路”，忘记了本来可行的做法。

例如院线的票房预测，上映之前的预测，会决定排片到底当时排多少场，排什么时间段，到底做什么样的排片策略？

当时Google发了一篇论文，说通过Google搜索量可以准确预测一个影片的票房，这是一篇引用度蛮高的论文，当时国内好多人非常兴奋,但把这样的方式应用到国内，发现精度并不理想。其实我们是半信半疑的，一个影片票房的基本面是什么决定的？

例如，电影类型与地区的匹配度，它是恐怖片还是什么片？院线里面不同的影院，比方有的是生活区的有CBD的；比方成都喜欢看古墓片，比方广州喜欢看粤语片，上海喜欢看小资片，比方哈尔滨基本上一般是抗战片、武打片比较好，不同地域的人的喜好，是不是都反映在搜索量上？除了题材之外，还有演员的活跃度，在社交媒体的活跃度，导演最近获过什么奖？包括题材是个什么片？后来我们加入了很多，比如地理信息，包括一些过去不同院线之间的销售趋势，包括在什么社交媒体上看演员之间的影响力的增长趋势，以及导演、演员和演员之间谁和谁搭配比较好。

我们当然希望用最简单的方式，就能预测票房、备品备件需求，但还是要多问问本质问题，基本面要考虑全一点。有时候不是难在预测上，而是要考虑一些外部的人为和不可控的影响，包括宏观经济的变化。