昆仑数据线上课No.4 | 工业大数据实用“避坑”指南
来源: | 作者:pmod6d781 | 发布时间: 2020-03-04 | 1119 次浏览 | 分享到:

不光在码头,其实工厂内的调度优化也是这样,我们虽然追求全局优化,但还是要考虑现实的条件,哪些数据不可得,包括得到之后他节省的成本到底有多高,都要认真考虑,当然技术上肯定会尽最大的努力来做。

3、空中楼阁:与组织形态失配的数据分析很难落地。

过去我们也做过一些,从技术上可行,甚至精度还不错,例如在设备故障诊断里一些重大部件的故障预测,虽然样本比较少,结合一些机理和数据挖掘知识,有的时候还可以做出来一个不错的结果。但是结果落地的时候,其实大家很沮丧,问题就在于我就发现一个问题,有的时候预示着在现有的考核体系下,可能会某种程度上暗示着现有的运维团队做的不到位,过去的定期维护做的不太好。这时候要指望现场一线团队给出真实的或者及时的反馈,通常很难。

大家可以联想一下,包括质量提升等各种课题都会遇到类似的问题,在工业以外,甚至在商业里的很多预测,推行的时候也会遇到类似的问题,这个课题正好是某个部门负责的,他天天用自己经验来做,现在你用数据分析比以前更好,除非这个项目从归口,从组织形态上做一定的调整,否则通常很难让他真正用起来。

4、避实就虚:追 “时髦”,讲“套路”,忘记了本来可行的做法。

例如院线的票房预测,上映之前的预测,会决定排片到底当时排多少场,排什么时间段,到底做什么样的排片策略?

当时Google发了一篇论文,说通过Google搜索量可以准确预测一个影片的票房,这是一篇引用度蛮高的论文,当时国内好多人非常兴奋,但把这样的方式应用到国内,发现精度并不理想。其实我们是半信半疑的,一个影片票房的基本面是什么决定的?

例如,电影类型与地区的匹配度,它是恐怖片还是什么片?院线里面不同的影院,比方有的是生活区的有CBD的;比方成都喜欢看古墓片,比方广州喜欢看粤语片,上海喜欢看小资片,比方哈尔滨基本上一般是抗战片、武打片比较好,不同地域的人的喜好,是不是都反映在搜索量上?除了题材之外,还有演员的活跃度,在社交媒体的活跃度,导演最近获过什么奖?包括题材是个什么片?后来我们加入了很多,比如地理信息,包括一些过去不同院线之间的销售趋势,包括在什么社交媒体上看演员之间的影响力的增长趋势,以及导演、演员和演员之间谁和谁搭配比较好。

我们当然希望用最简单的方式,就能预测票房、备品备件需求,但还是要多问问本质问题,基本面要考虑全一点。有时候不是难在预测上,而是要考虑一些外部的人为和不可控的影响,包括宏观经济的变化。