内容简介
维修决策是智能运维的核心技术,对于确保高端装备可靠性和控制运维成本具有极其重要的意义。《高端装备智能运维——模型、算法与应用》从基于时间的预防维修策略,到基于状态的预防维修策略,再到目前*先进的预测性维修策略,系统性地介绍建模方法、求解算法以及实际应用;详细阐述维修策略发展背后的支撑技术、每种策略的特点和优势,以及适用场景。
目录
目录
第1章 引言 1
1.1 研究背景 1
1.2 预防维修策略回顾 1
1.2.1 基于时间的预防维修策略 2
1.2.2 基于状态的预防维修策略 3
1.2.3 预测性维修策略 4
第2章 系统失效建模 6
2.1 两状态失效建模 6
2.1.1 指数分布 6
2.1.2 韦布尔分布 7
2.2 多状态退化失效建模 8
2.3 连续状态退化失效建模 9
2.3.1 维纳过程模型 9
2.3.2 伽马过程模型 10
2.3.3 逆高斯过程模型 10
第3章 基于时间的预防维修决策建模 12
3.1 单设备系统动态工况下预防维修策略 12
3.1.1 问题描述 14
3.1.2 决策建模 15
3.1.3 求解算法 20
3.1.4 算例分析 21
3.1.5 小结 24
3.2 考虑故障后多维修方式的系统预防性更换策略 24
3.2.1 问题描述 26
3.2.2 决策建模 26
3.2.3 求解算法 28
3.2.4 算例分析 30
3.2.5 小结 35
3.3 考虑生产等待的单设备系统维修和更换策略 35
3.3.1 问题描述 36
3.3.2 决策建模与求解算法 37
3.3.3 模型扩展 40
3.3.4 算例分析 43
3.3.5 小结 47
3.4 考虑屏蔽故障的两设备串联系统维修策略 47
3.4.1 问题描述 48
3.4.2 决策建模 49
3.4.3 求解算法 52
3.4.4 算例分析 54
3.4.5 小结 59
3.5 多设备流水线生产系统预防维修策略 61
3.5.1 问题描述 62
3.5.2 单机系统预防维修策略 62
3.5.3 多机系统预防维修策略 70
3.5.4 算例分析 71
3.5.5 小结 79
3.6 证明与推导 80
3.6.1 命题3.1.1的证明 80
3.6.2 式(3.12)的推导 80
3.6.3 定理3.2.1的证明 81
3.6.4 定理3.3.1的证明 82
3.6.5 模型的结构性质 83
3.6.6 定理3.4.1的证明 86
第4章 基于状态的预防性维修决策建模 88
4.1 多状态单设备系统动态运行工况下视情维修策略 88
4.1.1 问题描述 90
4.1.2 决策建模 90
4.1.3 求解算法 94
4.1.4 算例分析 95
4.1.5 小结 98
4.2 相关失效模式下单设备系统视情维修策略 98
4.2.1 问题描述 100
4.2.2 可靠度建模 101
4.2.3 决策建模 103
4.2.4 算例分析 107
4.2.5 小结 114
4.3 相关失效模式下两设备系统视情维修策略 114
4.3.1 问题描述 116
4.3.2 可靠度建模 117
4.3.3 决策建模 118
4.3.4 算例分析 124
4.3.5 小结 127
4.4 常规退化和冲击下多设备系统动态检测-更换策略 127
4.4.1 问题描述 129
4.4.2 决策建模 130
4.4.3 模型扩展 134
4.4.4 算例分析 137
4.4.5 小结 144
4.5 证明与推导 145
4.5.1 命题4.1.1的证明 145
4.5.2 命题4.1.2的证明 145
4.5.3 Z的分布推导 146
4.5.4 式(4.22)的推导 146
4.5.5 引理4.3.1的证明 146
4.5.6 引理4.3.2的证明 147
4.5.7 引理4.3.3的证明 147
4.5.8 引理4.4.1的证明 148
4.5.9 引理4.4.2的证明 148
4.5.10 定理4.4.1的证明 149
第5章 预测性维修决策建模 150
5.1 退化和失效数据融合驱动的RUL预测 150
5.1.1 退化与寿命数据融合模型 151
5.1.2 离线参数训练 152
5.1.3 在线RUL预测 154
5.1.4 算例分析 155
5.1.5 小结 161
5.2 基于比例风险模型的预测性维修策略 161
5.2.1 问题描述 163
5.2.2 决策建模 164
5.2.3 Metropolis-Hastings算法 166
5.2.4 算例分析 167
5.2.5 小结 171
5.3 证明与推导 171
5.3.1 引理5.1.1的证明 171
5.3.2 粒子滤波方法步骤 172
5.3.3 引理5.1.2的证明 172
第6章 总结与展望 173
参考文献 174
试读
第1章引言
高铁、轨道交通、飞机等高端装备的可靠运行对保障人民的生产生活安全具有极其重要的意义。近些年,我国民用以及军用领域的相关高端装备保有量都经历了跨越式发展,如何针对这些高端装备开展智能运维,以在确保其可靠度的同时控制运维成本成为维修保障人员以及科研人员关注的焦点。本章1.1节简单阐述智能运维的研究背景;1.2节针对智能运维的核心预防维修策略的发展进行回顾,主要包含基于时间的预防维修策略、基于状态的预防维修策略以及预测性维修策略。
1.1研究背景
装备通常会因使用和环境因素的影响而发生退化。这种退化*终会导致系统失效,进而引发安全问题、设备损坏、质量问题以及意外停机。几十年前,维修工作普遍被视为在失效发生后才必须进行的任务,且往往难以管理。如今,在设备发生失效前提前进行预防维修以降低失效概率,已被广泛视为一项不可或缺的业务职能和装备管理的关键要素。企业相关部门日益认识到,通过更有效地规划预防维修措施,执行有效的维修策略,可以提升其运营效率和可靠度,并控制运维成本。
对设备安全可靠运行的要求以及运维成本的控制,推动着维修策略技术的发展。由于自动化的影响,工业资产总成本中很大一部分如今与维修活动相关。例如,海上风电场的运营与维修成本占其全生命周期成本的25%,成为这类资产主要的成本构成之一;航空发动机的运维费用占到全生命周期成本的一半以上;在流程工业和化工行业中,超过25%的员工从事维修作业。企业间的激烈竞争正促使众多企业重新审视其生产系统的维修策略。维修策略优化包括构建维修决策建模与求解算法,旨在改进或优化维修策略。
本章知识是后续内容的铺垫和基础,主要对预防维修决策建模方法进行总结和回顾。
1.2预防维修策略回顾
预防维修策略针对系统随着使用或者环境影响会发生失效,以*大化可用度或者*小化成本等为目标函数建立模型,确定维修的时机以及方式。从物理结构来说,系统可以分为单设备系统或者多设备系统,当考虑多设备系统时,设备之间往往存在经济相关性、失效相关性、结构相关性,导致单设备系统的模型无法直接适用,由此引申出了成组维修(group maintenance)以及机会维修(opportunistic maintenance)。
系统的退化失效可以分为两状态(正常和失效)失效、多状态退化失效,以及连续状态退化失效。两状态失效主要通过设备失效时间的概率密度函数(probability density function)进行刻画。多状态退化失效主要是假设各个状态之间的转移满足马尔可夫性,状态只能从好状态向退化状态方向进行转移,***的是三状态系统,即正常(normal)、缺陷(defective)、失效(failed)。正常可以跳转到缺陷或者失效,缺陷可以跳转到失效,失效为吸收态。连续状态退化失效是假设系统的某个性能参数退化满足某个随机过程,当这个性能参数退化*次超过某个阈值时,即定义失效,也称为*达时间。第2章将详细介绍主流的退化失效建模方式。
维修方式可以分为*小维修(minimal repair)、非完美维修(imperfect maintenance),以及完美维修(perfect maintenance)。其中,*小维修将系统恢复到失效前的状态,即恢复系统运行,不改变其失效率;非完美维修将系统恢复到失效前与全新的一个中间状态,非完美维修的模型较多,后续会详细展开;完美维修将系统恢复到全新的状态,更换(replacement)可以理解成完美维修。
目标函数主要可以分为两大类:可用度(availability)以及成本(cost)。根据维修策略周期的长短,目标函数可以进一步分为短周期可用度、稳态可用度、周期内总成本以及长周期成本率。其中,可用度主要考虑维修将导致系统不可用,产生停机时间;而成本则是考量费用问题。值得指出的是,在优化目标函数的过程中,也会考虑以可靠度等为限制条件。
本书主要从预防维修策略的发展分别介绍,即基于时间的预防维修、基于状态的预防维修以及预测性维修。值得指出的是,广义来讲,预测性维修属于基于状态的预防维修的一种,本书中将对它们进行区分,以便更好地阐述相应的区别。传感技术、信息技术以及计算技术等支撑和推动了预防维修策略的发展。理论上来讲,预测性维修是目前*先进的预防维修策略理念,可以取得更好的结果。然而,在实际的应用中,有的场景无法满足执行预测性维修的条件,基于时间的预防维修或者基于状态的预防维修可能是更好的选择。所以,本书将针对三种预防维修策略,系统地介绍理论建模、算法、案例应用以及适用场景等。
1.2.1基于时间的预防维修策略
基于时间的预防维修策略中,“时间”可以是日历时间、役龄、里程或者次数,该策略又可以分为周期性预防维修策略以及非周期性预防维修策略。基于时间的预防维修大都针对两状态系统,基于系统的失效时间建立维修决策模型,适用于无法对系统的健康状态进行刻画以及监测等场景,对于运维人员来讲容易实施。当系统发生失效或者预防维修只能采用整体更换,即每一次维修将系统恢复到全新的状态时,往往为周期性预防维修策略;当考虑非完美维修时,每一次非完美维修后的效果比上一次差,*终需要执行更换,将系统恢复到全新的状态,往往是非周期性预防维修策略。决策包含整个更换周期,以及更换周期内的非完美维修次数和对应的时间。
多项研究探讨了模型参数已知时的基于时间的预防维修策略。文献[1]提出了一种精确逼近方法,用于求解序贯更换策略的近似*优解,其计算简便,且适用于任意失效分布。文献[2]研究了二手产品系统的*优役龄更换策略,将不确定的初始役龄建模为服从连续概率分布的随机变量,并建立数学模型,旨在*小化这些系统在无限时间范围内的单位时间成本期望。文献[3]探讨了泊松过程到达的维修机会下,维修在设备到达特定阈值后*个机会时刻或到达固定维修役龄时执行(以先发生者为准),构建了相应的维修决策模型。文献[4]研究了当生产等待发生时可执行机会更换,以*小化长周期成本为目标函数,建立了役龄限值与更换阈值的综合优化模型。文献[5]探讨了***优役龄更换策略的扩展模型,考虑系统随时间退化,推导并分析了长期单位时间期望成本,同时研究了相应的*优更换问题。文献[6]提出了一种基于役龄的更换策略,其中预防性更换只能在特定日历时间执行,当发生失效或者役龄超过阈值时执行更换,其模型应用于加拿大某电力公司配电系统木杆的真实数据案例。文献[7]研究了役龄更换策略,并分析了预防维修未按时执行的影响,实际维修时间与计划时间存在概率性差异。文献[8]针对故障率随时间增长的单元研究了基于役龄的维修,外部冲击会以某个概率导致失效率骤增,该概率与役龄进而导致故障率骤增。文献[9]假设所有冲击均导致故障率上升,在达到特定役龄或经历特定次数冲击时执行预防维修。文献[10]提出二维保修策略,当物品达到特定役龄或使用量时执行预防维修(以先发生者为准)。文献[11]研究了分组更换策略,并考虑机会值、期望值和临界值三种*优性准则。文献[12]优化了随机使用单元的分组维修策略。文献[13]以期望成本函数为主要准则比较了役龄更换与分组更换策略。
还有研究者在基于时间的维修框架下探讨了寿命分布未知(不确定)的情形。文献[14]研究了寿命分布参数不确定时基于役龄的*优维修策略。文献[15]在假设存在海量数据集的前提下,分析了寿命分布参数不确定时的三种基于时间的维修策略。文献[16]运用完美信息期望值概念探究了参数不确定性对维修优化问题的影响,并以役龄更换和分组更换策略为例进行了说明。文献[17]采用非参数方法,研究了数据增加时*优维修役龄的调整机制,以长期成本率作为*优性准则,结合数值分析与仿真评估方法效果。文献[18]同样采用仿真方法,但以单周期成本率为*优性准则构建相应的决策模型。文献[19]研究了多重竞争风险场景下的模型不确定性,证明了使用错误模型优化成本可能导致显著误差。文献[20]考虑了不同运行环境,假设寿命分布依赖环境条件,通过核估计法对未知寿命分布进行估计并调整基于役龄的维修策略。
1.2.2基于状态的预防维修策略
基于时间的预防维修策略不考虑个体系统之间因为原材料、制造装配工艺、运行环境等差异导致的退化差异,采用一刀切的方式,容易导致“过维修”或者“欠维修”。基于状态的预防维修策略则根据系统个体的实际状态决策是否应该维修,理论上能够获得更好的结果。基于状态的预防维修主要是针对多状态退化失效系统以及连续状态退化失效系统。基于退化失效模型构建维修决策模型,面向可以刻画健康状态的系统,以及可以对其健康状态进行间断性检测或者在线实时监测的系统。主要的决策变量是执行维修的状态阈值,即当系统的状态阈值达到设定的值时,执行维修动作。当涉及间断性检测时,检测的周期可能是策略优化的变量或者给定的值。
文献[21]研究了一个执行等时长任务的系统。每次任务结束后对系统进行检测,根据揭示的退化程度决定是否进行非完美维修。文献[22]考虑了非完美预防维修以及完美的预防性与修复性更换,维修行为会影响系统的退化速率,构建了相应的决策模型。文献[23]假设退化过程会因环境突变而加速劣化,真实环境不可直接观测,需通过检测数据进行推断。文献[24]研究了一个具有两个阶段(对应延迟时间模型中的正常与缺陷状态)的连续退化过程,执行非完美检测:若检测结果显示超过**阈值,则进行完美检测并在确认单元缺陷后实施预防维修;若超过第二阈值,则立即执行预防维修。文献[25]同样考虑了进入缺陷状态后退化速度的提升,并将其与超过特定阈值的环境冲击载荷引发的故障相结合,当观测到缺陷状态时缩短检测间隔。文献[26]研究了一个具有稳态、磨损状态或故障状态的系统,进入磨损状态后退化过程加速。当系统处于磨损状态、退化程度达到阈值或达到寿命限制时(以先发生者为准),执行预防维修。文献[27]在给定预防维修阈值的前提下,优化检测间隔及每次非完美预防维修的程度(维修成本取决于其程度)。文献[28]假设退化遵循参数化随机模型,模型参数具有不确定性并通过贝叶斯方法更新,基于马尔可夫决策过程确定*优策略(*优预防维修阈值随时间递增)。文献[29]研究了同时存在老化与累积损伤的系统,采用比例风险模型刻画二者共同效应,若检测时退化程度或役龄超过阈值则执行预防维修,其模型应用于桥梁接缝维修决策。文献[30]通过仿真模拟在三状态连续时间马尔可夫链描述的环境中运行的系统,瞬时退化速率取决于环境状态,当检测到的退化程度超过阈值时实施预防维修,并考虑了检测误差的影响。文献[31]采用马尔可夫决策过程,考虑随系统役龄和退化程度增加的运行成本,检测后根据役龄与退化程度决定是否更换系统,并改进了非完美维修模型。
1.2.3预测性维修策略
预测性维修技术综合利用人工智能、大数据、工业互联网、云边计算等技术,其主要流程包括:基于设备监测的传感器数据,利用人工智能方法训练分类和预测模型,一旦设备异常,及时检测其异常并进行溯源,识别设备的健康等级并预测剩余使用寿命,根据工厂的人、财、物等资源和供应链情况以及工厂的实际情况,利用智能优化算法做出*优的维修决策。为了实现预测性维修的功能,需要数据采集装置和数据处理芯片等硬件。因此,相对于其他应用场景,预测性维修技术用到了建模、诊断、预测、优化、决策、人工智能芯片以及众多的高新技术和人工智能新理论,体现了当前科技的发展水平,反映了工业人工智能的显著优势[32]。
预测性维修属于基于状态的预防维修范畴,传统的基于状态的预防维修是基于优化的维修阈值,根据相应的检测区间进行检测或者实时监测,当相应的状态量达到设定阈值时执行相应的维修动作。这里每个系统执行维修动作的状态量是一致的。预测性维修主要是根据个体系统检测/监测的历史退化量,预测个体系统未来的退化量,继而建立维修决策模型,决策出对应执行维修的契机。基于个体系统历史的




















