西门子 RXD 大会尖峰对话：破局工业 AI 全文实录（含完整版视频）

来源：西门子中国作者：收藏
2026-03-30 14:13

2026 年 3 月 23 日，西门子 RXD 大会（Real Meets Digital）期间，西门子大中华区总裁兼首席执行官肖松，北京数据集团副总经理、北京国际大数据交易所董事李振军，国机数科董事长王宇航，银河通用机器人联合创始人、大模型负责人张直政，在会议期间进行了题为《破局工业 AI》的圆桌讨论，重点讨论了工业 AI 时代，如何更好应对场景和高质量数据等挑战，加速推动工业 AI 价值落地。

以下内容为尖峰对话实录，希望能给大家带来新视角、新思考、新收获。

01工业 AI 是座金矿

但真金不易挖

肖松：AI 正在重塑我们的物理世界，西门子的战略就是深度融合数字世界与现实世界，以建立强大的生态赋能我们全球的客户，在工业 AI 时代实现高质量的增长。

前段时间，我一直在思考一个问题，特别是在 1 月份，我去了拉斯维加斯的 CES 之后。关于未来软件和硬件的关系，我得出了一个感受和结论：AI 加速融入物理世界的时候，软件依然重要，但硬件比过去更重要，而软硬融合的能力将释放无限的潜能与价值。

软硬融合是工业 AI 的落地底座，软件是大脑，硬件是手脚。但是真正要去实现从感知、决策到执行的工业智能闭环，干出真实的降本增效，干出质量的提升，并不容易。

相信我们大家有共识，工业 AI 是座金矿，但要挖出金矿里的真金，也并非易事。

02场景和高质量数据不可分割

互相耦合

问题1：

如果破局工业 AI 的话，你们认为哪些局是首先需要破的？

王宇航：对于工业 AI 的落地来讲，从企业层面和社会层面可能要从三个方面或者是三个角度去解决它落地的问题。

第一，管理局。企业内部对工业 AI 落地的认识。工业 AI 的落地不是一次简单的技术革新，是一次管理再造，流程再造，是一次企业内部的结构重组和管理革命。因此它不是技术部门的事情，它一定是主要领导乃至是一把手的事情。

第二，技术局。在工业领域，我们需要的不是大语言模型，需要的是多模态模型。因为工业知识不仅仅是以文字的形式存在的，它还包括图像、音频、视频、代码乃至各种公式。我们可以想象两个智能体的对话，肯定不是说着中文或者是英文，而是代码的交换。在这种情况下，以大语言模型为代表的“文科大模型”对于工业生产的现场场景、问题和目的的实现，它的作用就不是特别明显。因此就需要有高质量的多模态的产业的专用模型或者垂直领域的专用模型。

第三，成本局。任何一个企业都要关注自己的投入产出。如果他的投入大于他的产出，或者说他花在人工智能上的费用对比他降低的成本、增加的收益，不能够形成一个闭环的话，这样的工业 AI 实际上对工业生产是没有价值的。

肖松：简单总结下，第一，工业 AI 是个“一把手工程”。第二，工业需要有自己行业的垂直模型，特别是融入了我们行业知识，这个非常重要。第三，要真的降本增效。

李振军：大模型落地的关键实际上是三个条件：算力、模型和数据。现在算力和模型算是平权了，我们各个单位组织，都具备能够获得这些技术和模型的能力。但是，各个行业里面应用模型的水平，实际上是参差不齐的。从这里面，我们很容易能够看到它的演进趋势。

前面我们西门子的专家都讲到了，它其实是从数字世界逐步向物理世界演进的，因为在数字世界里它的数字化程度好，它天生有大量的数据。所以像互联网、媒体、法律、包括金融等天生在处理数据的行业里，模型的渗透更高一些。

而工业行业是制造业，我们将原材料变为产品，最终是用一个物体来呈现的。这中间，它的数据不是天生形成的，是要随着生产管理运营去采集生成数据的，而物理世界的数据采集难度其实更大。所以大家说制造业应该是 AI+ 中最有价值，也是最难的一个领域。

那么如何破局呢？

第一，唤醒工业行业。特别是我们大型工业企业的内部数据、私域数据，比如生产制造、运营管理。所谓唤醒，并不是说拿出来卖，而是我们有更好的方式让它产生价值。

第二，场景驱动。我们的信息化在工业里是一个辅助能力。我们都要做相应的投入，这个投入不能是盲目的，应该有很明确的场景，有了明确的场景，它的价值很快就能出现。同时，我们做数据的相关部门，要更好地跟业务部门找到数据对接的结合点，这样才会清晰得形成相应数据库。我认为这个工作不可能跳跃，是基础性的工作，也是慢活。

张直政：我们今天探讨的工业 AI 有一个前提，其实是大模型大数据驱动的工业 AI。破局点主要有三个层次：

第一，我们要想清楚今天的工业 AI 跟过去的工业 AI 有什么区别？我们需要面临和解决的新问题在哪？过去的工业 AI 我们想的是怎么解决一个单点问题，举一个简单的比喻，可能是对工业某一个场景某一种劳动力进行替代，实现降本增效。但是大模型驱动的工业 AI 绝不止于此。我们今天谈大模型驱动工业 AI，它改变的不再是对单一工种的替代，而是对整个生产关系和生产方式的变革。这个在我们看来已经是第四次工业革命，它不再是一个单点突破，而是一个体系化的突破。所以我们必须得认识到这一点，它改变的不只是人和机器的对话方式，甚至是机器人和我们传统工业制造装备的交互方式，以及围绕这些交互方式发生的一系列生产关系的变革。这也是我们和很多国际公司正在共同探讨的。

第二，有了技术突破以后，怎么让它在工业场景里面产生真正的价值，这个是我们关心的。在它背后，我们不得不面临一个问题，就是如何源源不断地获得驱动这个技术前进的高价值数据。这个就回到了我们技术、产品和应用怎么去 fit 的问题。现在大家知道具身智能领域有各种各样的技术，但是什么技术用在什么工业场景里面最合适，这个问题我们依然在探索。接下来我们会花大量的时间和科研人力找到这个fit点，然后把我们的humanoid robot，把我们的具身大模型部署到不同的工业场景里，然后再采集真实的机器人在真实的工业场景里面干活的数据，来解决最后一公里的问题。

第三，我们研究的创新方式怎么持续发展。这需要我们今天把过去的仿真积累，和今天新的数据采集和回流的方式深度结合，在不同的阶段使用不同的数据方式，训不同的模型用不同的数据。打一个比喻，训大模型如烹小鲜，那我们需要的素材、大模型需要的训练数据绝不止一种类型，在这个过程中，我们如何构建数据金字塔，如何合理的利用数据金字塔，如何把数据金字塔驱动的新模型、新工具部署到工厂里面，让它产生一个新的生产关系的变革，这是我们要持续不断投入和探索的点。

问题2：

从场景的角度，请王总分享国机数科在场景方面的思考和创新实践。

王宇航：第一，希望在数据和模型的使用过程当中要能够“看得懂”、“用得上”、“算得清”。

也就是我在工业 AI 的落地过程当中，我的所有投入以及数据，在生产当中落地，最后能够形成正向的收益。

但是现在的问题恰恰出现在三脱节：首先是技术和场景的脱节。刚才我说到，大语言模型和现在的工业生产其实并不完全匹配。就像很多工业知识可能是图纸、可能是照片，现在的大语言模型还不能很好地解决，所以需要训练多模态垂直领域的专业模型。

第二个是业务和数据的脱节。我们企业在生产经营的过程当中，每天都产生大量的数据，但这些数据就像尾矿一样，你知道它里面有价值，但不知道怎么把它提炼出来。甚至说，提炼数据价值所消耗的成本可能远远大于提炼出来的价值本身，包括这些数据非标准的、非结构化的制式和格式的治理成本，也会给企业带来很多的问题。

第三个是投入和产出的脱节。需要做到三融合，首先是装备制造业和生产服务业之间融合，其次是科技创新和产业创新融合，最后是物理世界人类社会和数字空间融合。人工智能应用绝不是人工智能产业的事，也不是生产制造业自身的事，它应该是一个跨界融合的事。

我们的科研院所、人工智能的厂商以及生产制造企业，要联合研发和训练用于工业的专业模型，在共创过程当中价值分配机制要同步形成，以工业 AI 为代表的智能经济新形态能够更早实现。

问题3：

具身智能就是 AI 走向物理世界的一个场景。

银河通用是非常重视场景选择的，特别是最近发布的 Galbot S1就很聚焦工业场景，尤其是搬运这个细分场景。

请直政博士分享下你们的实践，你们认为未来人形机器人要具备哪些能力才能走进车间？

张直政：这正我们最近最关注的点，什么是高价值场景，什么是高价值数据，这两个问题是互相耦合的，以我们新产品Galbot S1 这款重载机器人为例，我们要研发这款机器人是因为我们看到在工业场景的痛点中，缺少一个能够长时间运行并且负载达到 50 公斤以上的人形机器人。在整个全球范围里，它的硬件就是没有人设计生产出来，如果我们没有硬件，所谓的具身智能连硬件都没有，就更不用谈基于这种硬件去采集对应的高价值数据。

首先，高价值场景一定要区分于传统方案，传统的 AI 方案已经能够解决一系列结构化的场景、结构化的任务。这一类，我认为不是今天大模型和新技术需要解决的挑战。

第二，高价值场景还要求它具有一定的规模性。因为今天的大模型驱动主导的具身智能，它的背后是大量高价值数据所驱动的。如果把今天的具身智能大模型和多模态大模型或是大语言模型来个对比，我们就知道具身智能大模型训练所需要的数据量远超 OpenAI 的 GPT，远超 Google 的 Gemini。因为传统的多模态大模型它只解决对话理解的问题，它输出的信号是语言。它是一种离散的，跟我们硬件解耦的信号。但是具身智能，它的魅力和潜能体现在它跟硬件耦合，跟场景耦合。我们需要输出连续高位的动作信号来控制不同的硬件。

第三，具身智能的数据跟场景相关。我们希望机器人做什么，跟硬件也相关，我们在什么硬件上用这样的大模型。在这种大背景下，我们如何获得高价值的数据？我刚刚谈到具身智能的数据采集，其实是跟我们的技能相关，跟场景跟硬件绑定。举一个简单的例子，特斯拉在训练自动驾驶模型时，如果你在一条笔直的高速公路上开车，这种技能这种场景非常容易学会，这种数据也很 cheap，很容易获得。但如果你在一个路况非常复杂的道路上、即将发生交通事故的这种场景下，这种数据就非常难采集，它本身量就很少，你想复刻当时的情景也很少。

具身智能是同样的道理。我们把一个机器人的技能，从 0 分训练到 80 分，它的数据很容易获得。但是我们把它的技能从 80 分训练到 100 分，达到我们工业落地的要求，这个很难。这个就需要我们合理的利用银河通用一直在积累的仿真合成技术。我们在仿真器里面去复现在现实生活中极少出现的高价值场景，然后让这种高价值数据大规模的生产，我们要让模型自己知道掌握了什么知识、没掌握什么知识。对于已经掌握的知识对应的数据，就可能不需要或者是需求量少。对于还没掌握的新知识，我们就需要有目的地采数据。我们为什么非常注重和工业伙伴合作，把一个没有到 100 分、没达到落地要求的数据放到真实场景里面去？因为只有让机器人在真实场景里面干活，我们才能针对他现有学到的 knowledge 来进行查缺补漏，有针对性的做补充。

我们要把这种高价值的场景和高价值的数据耦合起来，来探索这种新工具，新模型，能enable什么应用。OpenClaw 非常火，它解决的问题不只是人和模型之间的交互和对话，它更解决我们如何训练一系列的 agent，它们相互之间配合来完成以往一个公司、一个团队需要做的事情。具身智能也一定会往这个方向发展。我们要解决的不只是人和机器人的协同，更多的是机器和机器之间如何高效通讯，如何高效作业。这里面有一个天然的本质性因素，就是人和人之间的大脑很难共享，我们是靠语言来传递信息、来交流。但是机器人可以共享大脑，可以把不同机器人的经验收集起来训练同一个大脑，然后用同一个大脑来控制一个机器集群。这里面包括我们的 humanoid robot，甚至未来我们可以把传统的工业生产设备也囊括进来。到那一天，我们面临的就不是单一的生产工具，而是整个工厂是一个以机器人为核心重新设计的工厂，重新设计的工业生产体系。这是我们当下正在努力的目标。

肖松：场景这个局要破的话，关键在于你是否能够获得数据，结果是不是可以泛化，价值是不是可以量化。所以说要破这个局，场景和数据是不可分割的。我们谈的场景，有初级场景和成熟场景之分。如果从这个角度来讲，成熟场景就是数据非常充分，比如预测性维护、视觉检测等；初级场景来讲，像具身智能就是个初级场景，毕竟数据是缺乏的。成熟与初级场景的区别就在数据。

问题4：

请问李总，你们在数据交易里面最关注的几个核心点是什么？工业 AI 在中国落地，要真正获得高质量数据，需要破哪些局？

李振军：总体看目前数据流通交易市场，流通增长最快的还是大模型训练所需要的数据集，这是数据集里呈现出的很大一个特点。像知识产权、标准化、影视数据，甚至是一些医学影像数据，它们都在进行交易，带有半公开的行业属性。纯公开的数据，市场上可以不用买。模型通过训练这些数据，就能够达到所谓的“小学生水平”。

目前，工业数据的供给相对较少，我觉得跟工业的生产方式有关系。首先因为工业的门类太多，细分行业又很多，每一个工业厂房大部分都是离散式分布的，它相对独立，无法大集中，很难像互联网、电信、交通行业一样，它的生产方式决定了它的数据是伴随着业务生产出来的。所以我们不能期待它是一个跨越式的，而是一个渐进式的。

同时，工业企业的内部流程非常复杂，不管是生产准备还是流程控制，甚至是库存、供应链，每一个打开来看时，如果你不具备10-20 年的行业经验，很难找到有用的数据，更不知道如何使用数据。

工业数据有一些不符合现在数据的需求，其原因，我认为主要是脱节了，就是数据供应跟数据加工脱节了。

有数据的工业企业中，大部分的数据人员更多的是信息化的辅助系统，是少数群体，而且有些不是专业做数据加工分析处理的，数据加工这方面的投入就参差不齐。

当然有像宁德时代这样的优秀企业标兵，他会数据全采，甚至边处理边应用边优化。但大部分企业没到这个阶段，而且这种投入很大，所以导致了我们大量的工业企业内部实际上是有生产但没数据采集，有采集不存储，边采边丢，可能只存一个月就没了。当你想用全年数据进行训练时，会发现例如故障数据可能都找不到了。

或者是采集完后，加工处理能力不够，无法处理成标准化的数据，只有结构化数据才能运用到模型训练中。但他不知道模型训练需要什么参数、什么类型。所以我觉得脱节就是现在的生产方式，有点像小作坊。

最近国家数据局也提出数据工厂的模式，数据应该像我们制造业工厂一样，应该有标准化的流水线，特别是能够将制造环节跟我们的专业环节结合。例如现在医院里面大量的数据需要进行标注，普通人员是标注不了的，必须得主治医师。

我们工业也是一样，普通生产人员无法标注这些制造业数据，所以一定要把这个脱节给它勾连起来，做数据的环节要跟做业务的环节结合起来，要创造一个新的数据生产方式。

这个模式，我们大家都在努力探索。将数据的采集、存储，模型的训练、应用融为一体来看，让数据工程师和专业工程师在一起工作。

随着数据越来越有价值，企业都把它们看成了宝贝，自己即使不用，也不愿分享。因为没有把握判断，数据分享后是否会影响到自家的产品竞争力。

所以现在急需要找到一种很好的利益价值传递链条，其实相较一些数据应用比较成熟的行业，这种模式并不是没有。比如征信数据领域，它一定来自于十几个数据源才能形成对标。中小企业做普惠金融的信贷，他需要一个画像，在银行贷出款后，他就会付给这个数据的生产商一定回报，数据生产商再会付给这些数据源一定的回报，这就是一个基于市场定价的价值分配。

问题5：

高质量数据集这个话题进入了今年中国政府的工作报告，重要性进一步提升，请问王总，国机数科在数据“采-集-用”方面有什么思考和未来计划？

王宇航：高质量数据集是什么呢？有点像把地底下的石油或者是铁矿挖出来变成标准可交易的大宗商品，比如说把铁矿石炼成钢材或者是这个型材，石油炼成汽油或者是柴油，甚至就是可交易的原油。它是把一个矿产挖掘出来变成可交易的商品，资源到产品到商品的一个过程。每个生产企业都有大量的生产数据，但这些生产的数据并不是高质量数据，需要进行标注清洗加工。我们现在进行了一些尝试，我们把科研院所的数据进行梳理、标注、训练，我们把它做成高质量数据集合产业垂直模型，这样的话就可以和其他的用户、和其他的行业数据需求方进行交易。这个尝试我们现在已经在开始了。

我们另外做的一个高质量数据集就是在农业领域。它虽然不是工业生产过程，但它实际是工业产品在使用过程当中产生的数据。比如说一台拖拉机，它的作业数据就是这台机器自身在作业过程中所记录的一些作业数据和机器自身的数据，所以我们说一个工业产品涵盖了研产供销服各个阶段。在出厂之前，它主要是设计数据、生产数据，但是出厂之后就是使用数据和运维数据，它全生命周期的数据实际上就有不同的价值。这些尝试是为了推动国家的智能经济新形态早日实现。

智能经济的内涵或者是核心特征是什么呢？数据驱动、人机协同、跨界融合、共创分享。

人机协同实际就是人和大模型或者是具身智能之间的相互合作，而不是简单的用机器来代替人，最重要的是跨界融合和共创分享。因为不跨界，人工智能是难以跟产业融合的。

最后要有一个分享机制。因为就像刚才我们李总已经讲过的，一个数据产品，一个征信报表或者一个模型生成的过程中，需要多元异构的数据。不仅仅是多模的，而且是多元的，来自于不同机构的，那么在这个模型和数据产品最后生成的过程当中，各个数据源价值如何界定，收益如何实现。如果没有这种机制的话，数据交易就很难在全社会进行推广。

问题6：

北数所一直在致力于数据生态的建设，请分享下你们的实践和思考。

李振军：数据，既有技术属性，又有资源属性。资源属性很特殊，它区别于其他的资源，不是我占有了别人就无法再拿走，数据易于拷贝，很容易侵权。

所以国家这几年一直从制度层面、技术层面、产业场景层面，推进数据产权制度的落地。国家数据产权制度将数据权利分成了数据持有权、数据使用权和数据经营权。目的是让拥有数据的角色是清晰的，产权是清晰的，让你敢去使用数据、开发数据，开发完之后取得收益。

总体来讲，国家在大力鼓励让数据流转起来。依托顶层设计和配套政策，可以减少我们在数据流通中的一些法律风险，同时在经济上的收益权更有保障。我们通过出售数据可以获得收益，可以将其纳入资产负债表成为资产，甚至开公司时，可在评估后纳入到股权里。

当前数据市场的主要矛盾，还是供给不足。在数据交易所里面，我们跟大模型的合作订单是敞开式的。但供给很慢，从收集、加工数据，到交付验收、模型训练，这个周期是比较长的。如果有规模化、标准化的数据工厂，提供数据的人也会觉得安全可信，数据工厂也有能力将数据变成产品，这很重要。

今天我们已是全球市场的一部分，会有数据跨境合作，像西门子也是一家跨国企业。国家主管部门也在推动数据跨境的便利化，有一揽子的政策即将落地了。其目的就是提供一个稳定、可预期的数据跨境的合作机制。这里面会有很多重要行业，比如说具身智能的机器人的训练数据，就是很重要的一个方向。

以上这些，都需要整个产业界、监管部门一起努力，找到一个既合规又高效的流通合作方式。加快建立规则、加快建立标准，让数据能够守住安全底线。因为不管是任何一方，对数据安全都特别的关注。其实这个过程，是在边试验边完善制度，目前没有完全成熟的制度，需要我们一起探索。

问题7：

AI 时代，人最大的优势就是想象力。最后一个问题，想请三位一句话总结，未来三到五年，大家认为中国的工业 AI 能够突破到什么程度？

王宇航：AI 能让整个社会没有提供不了的产品和服务，只有尚未提出的需求。

李振军：AI 在工业领域将无处不在，也会让工业产品变得智能化、人性化。

张直政：未来 5 年，特定的工业场景里，我们将会迎来“One model, One system, One factory”。

03强大生态

才能真正释放 AI 无限潜能

肖松：今天我们着重聊了数据和场景，算是为大家抛砖引玉。但工业 AI 真正要破局，要实现规模化，还有很多的拦路虎。但我觉得我们要以一种乐观的态度，因为现在 AI 已经进入了“周更”的频率，最近很火的 OpenClaw 从诞生到火起来就几个月时间。所以我相信，我们不断出现的新技术，会帮助我们去解决我们现在面临的问题。

但是要破局工业 AI，场景、数据、软件、硬件、人才缺一不可。唯有建立强大的生态，才能真正释放 AI 的无限潜能。西门子举行科技大会就是这个初心，我们希望建立强大的生态。我们西门子 Xcelerator，就是一个为工业人提供的共创、共享平台。我们希望有一天，在西门子 Xcelerator 上都能找到每个人想要的工业智能体，去解决车间的问题，提高质量，提高效益。

在这里诚挚邀请各位伙伴加入到我们的工业 AI 的生态，让我们一起在工业 AI 这座金矿里面挖到真金！

谢谢大家。

赞一下(0)踩一下(0)