工业大数据分析的误区与建议(上下篇)

编辑时间: 2016-08-30 11:14:24    关键字:

工业大数据分析的误区与建议(下篇)

  前言:上篇文章解读了工业大数据分析的特点,指出工业大数据分析应该注重与机理模型的融合,充分利用领域先验知识。那么,工业大数据分析是不是存在典型的模式,可促进不同领域分析模型的借鉴和复用?

  本篇将尝试从分析算法的应用侧重点、分析模型与机理模型融合方式、业务应用场景等三个维度归纳工业大数据分析的典型范式。

  6类算法应用范式

  数据分析本质上是一种统计手段,需要足够的样本才有可能发挥显著作用。另外,数据分析作为探索未知的一种技术手段,它的作用也与机理复杂度密切相关。因此,这里从产品相识度、机理复杂度两个维度,将分析算法应用分为6类模式。

  1)从工业产品的相似度来看,可分为大量相似产品(如风力发电机)和少量定制化产品(如就地建设的化工反应塔)。相似产品在数据分析时可以充分利用产品间的交叉验证,而少量定制化产品应深度挖掘时间维度;

  2)从产品机理的复杂性来看,有简单的black-box产品(如电子消费品,通常不会深入元器件内部去分析)、明确机理产品(如风力发电机)、复杂机理产品(如鼓风机、化工厂)。复杂机理产品在工业大数据分析时,应更加重视机理模型和专家经验的融入。

工业大数据分析的误区与建议

  6类算法应用范式图解

  4种融合范式

  分析模型与机理模型的融合可以分为4种模式:

  1)分析模型为机理模型做model calibration,提供参数的点估计或分布估计,例如Kalman滤波。

  2)分析模型为机理模型做post-processing。例如,利用统计方法对WRF等天气预报模型的结果做修正或多各机理模型综合,提高预测的稳定性。

  3)机理模型的部分结果作为分析模型的feature,比如,在风机结冰预测中,计算风机的理论功率、理论转速作为数据挖掘模型的重要特征。

  4)分析模型与机理模型做ensemble,比如,在空气质量预测中,可以WRF-CHEM/CMAQ等机理模型的结果,与统计预报模型的结果进行融合,发挥统计模型对局部。

工业大数据分析的误区与建议

  4种融合范式图解

  3类业务应用范式

  通过对复杂过程的演化过程和上下文的全面深入刻画,工业大数据可以对产品/设备可靠性、运作效率、产业互联网等3类业务应用场景都有很大促进作用。一些行业的典型工业大数据分析场景如下图所示。

工业大数据分析的误区与建议

  小结

  工业大数据分析能否真正落地,取决于能否创造经济价值。价值的持续创造,必须与生产/管理流程和上下文相结合,必须理解工业的特点、工业数据的特征和工业界的特殊要求。

  这些特殊性决定了工业大数据分析的思路和方法有别于商务大数据,更应以“小数据分析”的心态,融合机理模型和领域经验。

  在分析模式上,本文将工业大数据分析归纳为6类算法应用模式、4种融合模式和3类业务应用模式,以期促进不同行业分析模型的复用。

  参考文献

  [1]王建民,“大数据与智能制造”, RONG 系列论坛,2016年1月9日

  [2]王建民,“中国工业大数据的实践与思考”,中关村大数据产业联盟论坛,2015年3月26日

  [3]郭朝晖,“别让商务大数据的思路,误了工业大数据”,物联网智库,2015年11月23日

  [4]王晨、杨良、田春华等,“工业大数据发展历程”,《2015年中国大数据技术与产业发展报告》第9章。

    (注:本文来源于昆仑数据K2Data,作者田春华,版权及著作权归原创者所有,转载请注明来源。)

推荐热图

合作推荐

2010-2018 可思数据版权所有 About SYKV | ICP备案:京ICP备14056871号