昆仑数据线上课No.4 | 工业大数据实用“避坑”指南
来源: | 作者:pmod6d781 | 发布时间: 2020-03-04 | 6252 次浏览 | 分享到:

从某种程度上,数据分析的整个过程,和传统的工科工程化方法是一样的。任何东西都是基于一定的假设所做出来,放到一个现实中,或者相对客观的现实中去验证,验证完之后,反复的去观察,这样才有可能从一定规律上反映了这个物理现实。

什么叫科学的态度,就是要反复问,任何东西都是可以被证伪或证实的,没有什么东西是绝对对或者绝对错的。

6、舍本从末:把一个简单的问题复杂化

数据分析师,有时候经意不经意地把一个问题给复杂化了,有时候有些工艺机理非常简单,基本面就在那,没必要把这个问题拔到一个深度学习或者一个什么高深的方法来做。

该简单的问题就简单处理,不要在不重要的地方花太多时间,好多数据分析师都是比较较真的,像我早期也是,细枝末节没搞清楚,心里就不舒服。数据分析作为一个工程化方法,要抓大放小,在一定的时间、空间、时间、费用的约束下,做到最好。

我以前学控制的,到大四的时候,接到一个实际卫星的姿态控制项目,上来我们就列状态方程传递函数,因为卫星模型也比较成熟,先证明稳定性,再通过根轨迹或者是波特图设计做控制系统的设计。我自己当时非常得意,因为上学上了十几年,第1次看到自己学了这么多年的东西,终于在现实中间有点用了。

我们去跟航天的专家交流,对方给的评价也比较高,当时我问,你们做卫星设计的时候,怎么做?他说,其实没有你考虑那么复杂,把不重要的全忽略掉,卫星三个轴都是耦合的,你不妨假设三个轴是解耦的,剩下的你就把它想象成一个刚体,到底偏了几度,你到底多少分钟想把它转回来?你能加多大的力?加多大力,电流马上就转换成控制参数。星箭分离之后,到底喷气怎么喷?你想加多大的冲量,一个冲量喷一下持续多少秒,然后产生多大冲量,冲量产生多大加速度,我要多少秒纠正过来?基本面就这么多,就这么简单。

当时对我触动蛮大的,不要一上来就把一些不重要的复杂因素都考虑进去,这个观念一路影响我后面的研究与分析。当然任何简化都是有前提的,在卫星仿真里面,这种简化是在小角度或者接近稳定的情况下使用,如果大部件分离或者太阳能翻板刚打开等大动态的情况下,简化是非常危险的。

再举个例子,风力发电机叶片结冰,可以做成结冰检测,在结冰严重,PLC警报之前,早期检测出来;也可以做结冰预测,但这两个问题难度差是十万八千里。结冰预测的前提,首先要做天气预报。大家也都知道宏观天气预报,气象局努力了这么多年,也上了很多手段,在有些地方有时候还是预测不准。且不说我们要做局部天气预报,每个风机每个截面都要做,还要做到以小时计,这非常难的,这是一个世界难题,非常难做。