清华大学王晨：工业大数据—从智能制造到工业互联网

2019年9月6日见解 Admin

近日，清华大学大数据系统软件国家工程实验室总工程师、工业互联网产业联盟副秘书长王晨在由清华大学全球私募股权研究院举办的“‘智能+’时代新机遇”论坛上发表了以《工业大数据：从智能制造到工业互联网》为题的演讲。他所在的清华大学大数据系统软件国家工程实验室，是2017年由国家发改委正式批复、清华大学唯一一个在大数据方面的国家级实验室。在演讲中，他介绍了实验室对于工业大数据的理解，工业大数据如何赋能智能制造，以及如何在智能制造的基础上未来走向工业互联网。

工业产生转型升级作用的路径

大数据系统软件国家工程实验室将工业产生转型升级的作用的路径，总结为加减乘除四个象限。

所谓加和减就是智能制造。智能制造更关注于企业内部的事情，狭义的智能制造关注制造，即生产环节，广义的智能制造则包含企业的全寿生命周期，从研发设计到生产制造再到运维服务。智能制造不外乎在在现有流程上加了一些东西、减了一些东西，它基本可以被总结为八个字：提质、增效、降本、控险。今天，智能制造做的事情就是加法和减法。

但在这个时代光做加减法是不够的，比如私募股权机构投资一个企业，企业每年做一点加法，投资人可能不会满意，而是希望企业实现指数级的增长。如何实现？工业互联网可能就是实现乘法和除法的路径。乘法就是平台效应。比如淘宝，容纳无数的商店在它的平台上开店挣钱，就是一个案例。但是在工业领域，是否可以构建一个工业互联网平台？以服装行业为案例。传统的第一代的服装企业，比如雅戈尔，有自己的设计、工厂、店面，即完整的产业链条。第二代服装企业，比如海澜之家，舍弃工厂选择全代工生产，转为做营销，以门店为资产。互联网时代的服装企业，比如韩都衣舍，既没有工厂也没有店面，成本几乎为零，所有的店面依赖淘宝，只负责快速设计、把控供应链，最后的“总盘子”虽然不一定有传统企业那么大，但是利润率高。因此除法就是企业聚焦自己的核心竞争力。轻资产高利润运营，这是未来中国中小企业创新创业之道。打造工业互联网的平台生态，不是说只有这个平台才能挣钱，但平台上的每个人都有可能挣钱。

三个层次：工业大数据行业的分类

实验室接触了也做了很多与工业大数据的应用，并将其分为了三个层次。第一个层次是单元级，即针对工业设备，不仅限于设备的远程运维，还包括对设备故障的提前预警、故障分析，以及设备的优化运行、资产管理等等。首先我们需要将设备的运行状态进行精确的数字化测量，这种测量手段其实是将工业大数据的连续空间离散化。这个连续空间很复杂，而能测量的物理量、精度、传感器数量都是有限的，所以全空间采样无法实现。但随着数字化水平提高、信息化进程推进、智能化应用迭代，未来的测量过程也会升级。

第二个层次是工厂层次。这个层次不是关注单体设备，而关注整个工厂的运营效率、产品质量和安全、环保问题。工业讲求的是包括人、物料、工艺、设备、环境在内的因素，在复杂的动态系统中能够协同作用。假设把全中国都看作一个大工厂，怎么在产业链条上提升自己的效率？我们今天做工业大数据，做“智能+”，就是这个用途。首先要回答数据在哪里，其实数据在任何一个地方。以前工业上管数据管的相对粗糙，传统在信息化领域做的相对较好的是管理信息化，而现在很多工业数据只是用来做监控以及做故障发生时做数据的回放。这些数据拿来怎么做两化融合（信息化和自动化的数据融合）没有做。

第三层次是怎么拿到其他人的数据？比如说挖掘机要自动化施工，需要了解GIS数据、环境数据，但这些都不是传统制造业企业拥有的数据。这说明今天工业大数据的内涵，比传统的数据内涵要大得多。自动化以及跨界整体的数据，构成工业大数据的体系。

工业大数据的分类和挑战

实际上，工业数据有三个特点。第一个特点是多模态。过去很简单粗暴地将数据分成结构化数据、半结构化数据、非结构化数据，但工业企业不是这样。今天看到的很多好像格式不一样的、非结构化的工程数据，真正把它打开的时候是不一样的。非结构化数据的使用效率取决于结构化的程度，只有结构化才可以被高效利用；第二个特点是高通量，很多设备是不停机的，所有的数据是7*24小时连续产生的，量非常大；第三个特点是强关联，在工业的不同行业，数据关联遵循不同的规律而非简单的聚合。

所以工业大数据本身的特点带来了非常多的挑战。除了数据获取的挑战，随之而来的就是数据分析、应用的挑战。这里边最大的限制是因果关系，即数据驱动的方法只能告诉我们关联性，而无法不能告诉我们因果性。比如淘宝推荐商品，只知道推荐相关商品，却不关心这个事情的因果——为什么用户是这样的人。但这在工业上是行不通的，尤其是控制方面，因此模型需要长时间的分析和验证。

工业领域存在白盒模型和灰盒模型，白盒模型即工业机理，企业会根据工业机理设计工序、产品结构和工艺，这是第一步。当它们被设计完之后，运行中又会出现大量的不确定性，这些不确定性的消除靠的就是专家、工匠的经验，让整个流程生产变得更加稳定和高效，这是灰盒态。不再对机理和知识本身进行分析和理解的数据模型，是一种黑盒模型。工业大数据和工业智能的本质就是，将这些经验和知识量化学习出来，挖掘心中有口中无的隐性知识，或者尝试通过数据方法把统计关系找到，再交还给工匠分析。工业就是工业，它存在的时间比信息化时间长，积淀比信息化多，而大数据和人工智能技术只是给工业上带来小的变化，尝试帮它去消除不确定性。

大数据、人工智能在工业中的应用

首先是智能制造。比如某个机床的良品率下降，那么机床可以猜到刀具可能磨损了，主动提出要换刀，或者炉温过热，就自主将温度往下调两度。如果设备可以自主告知、自主变化，而不是按照事先设定的逻辑来操作，这才是智能化。真正的数字化车间应该是什么样的？分了三个层次：第一层是大数据集成。以攀钢为例，它做钢轨最大的问题是产品质量，很多钢轨表面不平整，必须要修正。如果发现表面不平整会怎么办？调整工会猜测原因、调试、再生产，经过很多迭代之后调稳。而大数据能够建立数据集成体系，让决策者看到每个钢轨发生了什么、控制参数是什么、检测参数是什么。这样一个以物料为中心、以工序流程为轴的数据集成体系，能够为调整工提供更多更好的决策信息；第二层是大数据统计分析。能不能将好的批次的数据和差的批次的数据进行叠加对比，看控制参数的差异？大数据可以猜测造成问题的原因，至少可以排序，让调整工按照排序来做检查和调整；第三层是机理模型。通过大量的数据和反馈，工业企业可以构建一个相对准确、正向的仿真模型，并在数字孪生体、数字空间进行调试，最后在工厂里进行测试，这就是数字孪生带来的智能化体系。

那么工业互联网的逻辑对于智能制造来说改变了什么？从业务的角度来讲，工业互联网更多关注产业互联网的边界，而不关注企业内部的生产环节，它可以被总结成三个融合跨界：一是业务融合跨界，通过对产业链上下游业务边界的拓展，企业可以尝试整合上游的上游，也可以服务于下游的下游，我们是一个产业链协同视角下的大工厂；二是数据链条融合跨界，业务的拓展带来了数据边界的拓展，今天的数据不局限于企业原有的数据。比如说要服务于建造商，需要环境数据、操作数据、气象数据；三最根本的是技术改变，相比IT技术的发展，工业软件和IT产业不在一条发展曲线，但现在通过云计算技术可以轻量级地让用户做这样的开发，对于激励、知识的沉淀，可以在很多领域产生了技术溢出机会。工业互联网平台的出现，让工业企业能将花大量时间研发的仿真模型有可能沉淀成小而精的新形态工业软件。

清华大学全球私募股权研究院

清华大学全球私募股权研究院（简称清华私募研究院，英文名称Institute for Global Private Equity, Tsinghua University,英文简称Tsinghua PE ）是清华大学的校级研究机构，依托清华大学经济管理学院，与清华大学法学院和清华大学社会科学学院共建。研究院将发挥清华大学作为多学科综合性大学的优势，创造性地开展工作，为国家政策制定提供智力支持，引领私募股权领域的学术发展和人才培养，建立全球私募股权资源发展合作共赢的交流平台，助力中国的私募股权行业的发展。

About
Latest Posts

Admin

发表评论 取消回复

发表评论取消回复