从典型案例看DeepSeek等大模型对工业数据智能的创新赋能路径
来源: | 作者:pmod6d781 | 2025-04-27 | 27 次浏览 | 分享到:

在全球工业加速迈向智能化的时代浪潮中,工业企业正面临着诸多机遇与挑战。如何借助前沿技术优化设备管理流程,实现精准智能决策,成为工业企业提升核心竞争力、突破发展瓶颈的关键所在。而DeepSeek的推出又会为工业制造领域带来怎样的趋势与变革?

本文将从昆仑数据的实践案例出发,探讨以下观点:

1. 工业数据智能的核心需求未变,大模型成为强有力的技术手段;

2. 大模型存在能力边界与限制,精准匹配应用场景至关重要;

3. 大模型并非开箱即用,需经历完整的应用开发与运营过程。

一、从两个工业大模型案例出发

案例一:水电运行数字化与智能化系统建设现状

案例背景:作为典型的能源行业,水电行业信息化与数字化水平较为领先,在数据基础建设方面投入较大,相比许多行业具有优势,完整经历了信息化建设、大数据分析以及数字化和智能化阶段。

在传统数据挖掘分析模式下,存在诸多问题:

  • 各类应用相互割裂,缺乏系统性关联;

  • 面对新问题需重新研发模型,研发周期难以满足业务需求;

  • 同时存在交互方式不便、使用门槛较高等痛点。

实施策略:基于此,昆仑数据与客户共同创建新架构,该架构包含三个核心元素,契合技术发展趋势。早期有两个技术核心:一是工业数据工程,聚焦数据的分层管理与应用;二是数据挖掘与分析,依托数据工程师、数据算法工程师及数据科学家团队开展工作。进入大模型时代后,大模型成为新的决策引擎,形成“2 + 1”架构。该架构仍以数据为核心,决策引擎由单一的小模型扩展为小模型与大模型协同,二者发挥各自优势,显著增强了对工业智能的支撑能力。

在该水电行业客户的案例中,构建了数字完整体及水电信息模型,将数据模型与实时数据存储其中。但存在信息模型与实际水轮机对象脱节的问题,例如水轮机经大修或检修后,实际测点组成发生变化,而现场缺乏更新数字模型的流程,导致二者逐渐脱节,数字模型的效用随之降低。因此,此类信息模型出现失效问题,且长期难以推进优化。经研究发现,大模型在解决该问题上具有天然优势,能够从检修报告、入场报告等资料中提取信息,转化为结构化信息模型并完成模型库的更新。



在能源行业,发电设备诊断与运维是典型应用场景,涵盖在线监测、指标分析、异常检测、故障根因诊断及后处理等完整流程,这也是业务用户的核心需求。在小模型时代,上述四个步骤均由不同小模型独立完成。进入大模型时代后,基于电解铝案例的实践思路,通过构建智能体,实现对设备诊断全流程的覆盖。以4号阀门这一部件为例,询问其运行是否正常时,健康状态检测及相关评估工作目前由小模型完成更为可靠。在异常根因诊断方面,大模型具备潜力,因为其知识储备广泛,经适当优化,可结合自身逻辑与底层数据进行深度分析。当出现特定故障模式时,后续的处理措施推荐工作,本质上属于知识库应用范畴,亦是大模型的优势领域。



案例二:电解铝生产智能化

案例背景:铝电解是具有非线性、多变量耦合、时变和大时滞特性的复杂工业过程,且易受原料质量与人工干预等外部因素干扰。下达电解槽操控的指令至关重要,例如确定当日原料投放量、氟化盐投放量以调节电解质成分、调整电压,从而保障整体生产效率、产量与安全性达到最优值。电解铝生产的核心在于槽控,目前该工作高度依赖经验判断。

从数据智能的角度分析,槽控面临两个挑战:

  • 其一,电解过程的极为复杂,涉及磁场、热效应、浓度等专业机理,且影响因素众多,即便通过仿真手段也难以准确模拟。若从现场数据挖掘角度进行建模,难度会更高。

  • 其二,在工业生产中常出现不可观测、缺乏测量手段或机理明确但建模困难的场景,导致槽控决策过程高度依赖人工经验。工作人员收集决策所需的信息本身就是一大痛点。而不同操作人员依据观察到的现象与自身经验下达指令,存在显著的个体差异,导致出铝量、设备使用寿命以及能耗方面出现较大波动,影响生产效率和经济效益。

针对这些痛点,公司采用大模型与小模型融合策略,开发出AI槽控助手。该助手具备以下能力:

1. 在数据获取与感知智能层面,充分发挥大模型优势,整合多元数据源,涵盖数据库、线下结构化数据及时序数据等,并运用大模型文本转SQL等技术,实现信息的实时、全面获取。

2. 针对电解槽核心状况的分析与推荐工作,当前大模型在预警、推荐等任务上存在能力局限。基于昆仑数据在传统数据挖掘与机器学习领域的优势,开发了一系列槽控推荐模型,并将其作为工具与大模型结合。例如当用户提问“今天应投放多少氟化盐”时,系统会调用背后模型生成推荐值。大模型在此交互过程中带来显著改进:不仅能输出推荐结果,还可依据特征工程中的特征,解释推荐数值的依据,例如说明“推荐添加5单位氟化盐的原因”。这种解释能力提升了推荐结果的可信度,更利于现场操作人员采纳。



实施策略:采用大模型智能体框架,首先集成数据库中的日报、工艺报及档案数据等结构化数据;其次接入传统的知识库,采用RAG(检索增强生成)技术;最后将数据分析团队开发的小模型,即槽控推荐模型,作为大模型的工具。通过整合这些元素构建智能体,实现既定功能。


二、工业智能是钉子,大模型是一把新锤子

通过上述两个案例的分析,对大模型给工业数据智能领域带来的变化展开思考。当前存在一种普遍观点,认为大模型无所不能,甚至主张摒弃以往的小模型实现“弯道超车”。基于深入分析得出相应结论:

1. 在工业领域,无论是大模型还是小模型,均属于技术手段范畴,而工业生产现场降本增效、提质优化的业务目标始终不变。为实现该目标,工业现场员工与管理人员每日的核心工作是在工业标准化基础上处理异常情况。若生产无异常,现场可实现无人化管理,但实际生产中各类异常频发,因此构建完整的感知、决策与行动流程,成为工业生产数据智能的核心目标。在这一流程中,小模型与大模型均作为驱动引擎发挥作用。大模型的出现为工业生产增添了新的技术手段,拓展了感知、决策与行动的能力边界,提升了整体效率。

2. 工业现场工作的另一核心要素是隐性知识的挖掘,这一点同样恒定不变。许多工业岗位的工作内容,并非仅依靠高校专业所学知识即可胜任,现场存在大量难以显性化、结构化的隐性知识。以往通过小模型实现知识显性化,即知识代码化、代码模型化,而大模型的出现提供了新思路。大模型在处理自然语言模态时,可承载更多知识,对结构化要求较低,带来诸多新机遇。

总结来看,工业智能的业务目标恒定不变,大模型为其增添了强有力的工具。



具体分析大模型与小模型的关系:大模型特性类似人类,其优势在于知识储备丰富、响应迅速,但存在生成内容不可靠的“幻觉”问题。正如图灵所述,绝对可靠的机器难以具备智能,追求高智能便难以苛求其绝对可靠。反观传统专项数据分析模型,更似机器,被设计用于解决特定问题,对输入条件存在严格约束,输入不满足时无法正常运行,且开发新功能需构建新模型,如同制造专用设备。

因此,二者呈现天然互补性:重复性、固定性工作适合由小模型这类“机器”完成,创新性工作则以大模型为主体,大模型与小模型可实现完美融合。从工业智能的概念来看,其完整构成要素包括数据、显性或隐性的工业知识,以及将这些知识模型化后的大模型和小模型。



三、从DeepSeek到工业大模型应用

工业大模型在工业现场的应用现状与消费互联网存在显著差异,在程序开发领域,大模型已引发革命性变革。然而工业领域由于场景专业性强、要求严格,大模型应用整体发展相对滞后。但随着DeepSeek等突破性技术的出现,显著加速了工业大模型的应用进程。DeepSeek的出现促使企业主动或被动地思考大模型在工业领域的应用价值,业内普遍认为,2025年将成为大模型深度应用的关键一年。

此外关于大小模型融合,也需探讨其应用边界。从大模型的局限性来看,逻辑推理、精确计算等任务并非其擅长领域,这一特性受大模型底层技术原理所限。从原理层面分析,大模型进行计算,如“1+1=2”,并非真正意义上的计算;在逻辑推理方面,它也只是从语言学习中获取规律。设备预警及需进行数值分析的任务,明显超出大模型的能力边界。



然而,故障诊断目前处于模糊地带,大模型在此具有较大潜力。传统故障诊断面临故障原因存在万种可能性、依赖专家规则判断的问题,而大模型可先列举出100种可能性,再结合数据排除98种,显著缩小诊断范围。在知识咨询、教育培训、创意类工作等领域,则是大模型的优势应用场景。

从DeepSeek到工业大模型的应用受广泛关注,部分人认为DeepSeek出现后,以往的应用开发、智能体构建及提示词编写等工作不再必要,这实则是认知误区。DeepSeek虽为更强大的模型,但其应用仍需进行“培训”。从大模型应用全流程来看,主要分为预训练、后训练和应用三个阶段。预训练与后训练同属训练阶段,底座大模型开发者与应用单位均可参与,而应用环节则主要由应用单位负责。若将其类比,预训练相当于学校教育,后训练为职业培训,应用则是上岗工作。

探索工业大模型的应用场景,需从三个维度考量:

  • 基于大模型“类人”特性及其能力边界,思考其适用任务,如数据库访问、决策建议生成、特定内容生成及信息获取等;

  • 明确应用环节,涵盖研发设计、生产制造、客户服务等。不同环节特点各异,客户服务侧重知识交互与对话,而生产制造环节涉及严谨决策,对大模型的应用要求更为复杂。

  • 第三个维度是人员适配,可采用智能体思路,将智能体对标实际岗位,依据岗位说明书设计智能体的功能边界。

在大模型应用开发技术方面,存在典型的应用阶梯,涵盖从基础提示工程、固定工作流、智能工作流到后训练的演进过程,这是应用单位开展大模型场景开发的技术路线。后训练环节凸显DeepSeek的重要性。DeepSeek不仅提供优质的底座模型,还为后训练指明方向,其经验包括:采用两阶段监督微调(SFT)与强化学习组成的多阶段训练法训练推理模型;通过蒸馏技术,基于同源模型训练小参数量模型以提升推理能力,这些成功经验可供用户侧借鉴。



对于应用企业而言,在完成试点应用后,必然会进入持续运营与深化应用阶段。在数据、算法、算力三大要素中,算力可通过资金投入解决,算法领域开源技术的积累使各方均可受益,新技术出现后也能快速应用。而私有数据将成为企业未来重要的资产壁垒。因此,企业需思考如何构建自身的数据集体系。



专家介绍

徐地,昆仑数据首席架构师,中科院博士,前IBM中国研究院研究员。主要研究实践方向为云服务、工业大数据工程、大模型应用等。曾先后为新能源、石油、装备、化工、电子制造等多行业头部企业提供工业数字化解决方案指导,并带领工业互联网平台、大模型应用平台产品研发。发表国际顶级计算机体系结构会议第一作者文章两篇,专利10余项。同时徐地也是资深软件工程师和架构师,认证ScrumMaster,具备多年敏捷研发团队管理经验。