内容简介
本书主要介绍了基于深度学习的图像处理技术在钢铁行业中的应用及相关研究成果,列举了小样本、元学习、轻量化、知识蒸馏、半监督学习等前沿技术在钢铁缺陷分类、在线表面检测、钢材微观组织量化分析等典型场景中的具体应用案例,具有较高的实用价值和借鉴意义。本书适合人工智能、自动化以及钢铁冶金行业的工程技术人员和研究人员阅读,也可作为相关专业的本科和研究生教材,并为致力于钢铁智能化生产的学者提供参考。此外,相关领域的管理者和高校师生也能从中深入了解基于深度学习的图像处理研究的*新进展与应用前景。
目录
绪论(1)
0.1深度学习图像处理方法的发展历程(1)
0.2核心技术架构与典型方法(2)
0.3技术特性分析(3)
0.4钢铁行业应用现状(4)
0.5当前挑战(5)
0.6未来研究方向(6)
0.7本章小结(6)
第1卷基于深度学习的图像分类方法及应用
第1章深度学习理论基础(11)
1.1卷积和深度可分离卷积(11)
1.1.1卷积操作(11)
1.1.2深度可分离卷积(13)
1.1.3算力对比(13)
1.2自注意力机制(14)
1.3激活函数(15)
1.3.1Sigmoid函数(15)
1.3.2Tanh函数(15)
1.3.3ReLU激活函数(16)
1.4反向传播(17)
1.5正则化(约束)(18)
1.5.1Dropout(18)
1.5.2提前终止(19)
1.5.3范数惩罚(19)
1.6正则化(数据增强)(19)
1.6.1Cutout(20)
1.6.2Mixup(20)
1.6.3Manifold Mixup(21)
1.6.4CutMix(22)
1.6.5PatchUp(23)
1.7本章小结(24)
第2章数据集及标注方法(26)
2.1热轧带钢表面图像数据集(26)
2.1.1数据规模及缺陷分布(27)
2.1.2智能算法及数据标注(28)
2.2NEUDET数据集(30)
2.2.1数据规模及缺陷分布(30)
2.2.2数据增强处理(31)
2.3本章小结(32)
第3章特征提取(33)
3.1基于CNN框架的模型:ResNet(33)
3.1.1残差理论(33)
3.1.2模型架构(34)
3.2基于Transformer框架的模型(40)
3.2.1ViT:视觉Transformer(40)
3.2.2Swin Transformer(41)
3.2.3Poolformer模型结构(42)
3.3本章小结(43)
第4章模型压缩(45)
4.1轻量化(45)
4.1.1基于ResNet模型的轻量化(45)
4.1.2基于Poolformer模型的轻量化(46)
4.2知识蒸馏(48)
4.2.1基于教师学生的蒸馏框架(48)
4.2.2自蒸馏框架(50)
4.3本章小结(52)
第5章小样本学习(53)
5.1结合正则化的元伪标签方法(53)
5.2正则化方法(54)
5.3元伪标签(54)
5.4元学习(59)
5.5传导性微调(60)
5.6基于支持集样本的初始化(61)
5.7分类器微调(62)
5.8本章小结(64)
第6章提升鲁棒性的网络训练策略(65)
6.1鲁棒性训练方法(65)
6.1.1噪声选择(65)
6.1.2噪声数据集(67)
6.1.3鲁棒性优化算法(69)
6.2鲁棒性实验验证(70)
6.2.1轻量化残差网络在不同噪声下的网络性能对比(70)
6.2.2基于知识蒸馏的鲁棒性优化网络性能对比(71)
6.2.3不同等级噪声下的鲁棒性评估(74)
6.3本章小结(76)
第7章钢铁图像分类任务的应用实践(77)
7.1实战1:基于深度学习的带钢表面缺陷分类(77)
7.1.1实验配置(77)
7.1.2对比实验(77)
7.2实战2:基于模型压缩的带钢表面缺陷分类(79)
7.2.1实验配置(79)
7.2.2对比实验(80)
7.2.3消融实验(80)
7.3实战3:基于元伪标签的带钢表面缺陷分类(81)
7.3.1实验配置(81)
7.3.2对比实验(81)
7.3.3消融实验(83)
7.4实战4:基于元学习的带钢表面缺陷分类(84)
7.4.1实验配置(84)
7.4.2对比实验(84)
第1卷参考文献(86)
第2卷基于深度学习的图像目标检测方法及应用
第8章带钢表面缺陷检测与目标检测网络概述(91)
8.1带钢表面缺陷检测发展简史(91)
8.2基于深度学习的目标检测网络框架概述(93)
8.2.1两阶段目标检测算法(94)
8.2.2一阶段目标检测算法(98)
8.3YOLO系列算法在缺陷检测中的适用性分析(100)
8.4目标检测网络框架浅析(100)
8.4.1主干网络(101)
8.4.2颈部网络(101)
8.4.3检测头(102)
8.5本章小结(102)
第9章YOLO目标检测算法原理(103)
9.1YOLO系列算法的发展历程(103)
9.2YOLO系列算法的工作流程(104)
9.2.1YOLO V1算法(104)
9.2.2YOLO V2算法(107)
9.2.3YOLO V3算法(109)
9.2.4YOLO V4算法(112)
9.2.5YOLO V5算法(114)
9.2.6其他YOLO算法(117)
9.3YOLO算法的优缺点(118)
9.3.1YOLO算法的优点(119)
9.3.2YOLO算法的缺点(119)
9.4本章小结(119)
第10章YOLO目标检测算法改进方法(120)
10.1改进的思路与方向(120)
10.2加权Kmeans聚类理论(120)
10.3网络结构的改进(122)
10.3.1主干网络(122)
10.3.2多尺度特征融合(129)
10.3.3注意力机制(134)
10.3.4检测头(140)
10.4训练模型的改进(144)
10.4.1训练策略(144)
10.4.2推理加速(146)
10.4.3后处理方法(148)
10.5本章小结(149)第11章钢铁图像目标检测的应用实践(150)
11.1实验评价指标(150)
11.2实战1:基于改进YOLO V3的带钢表面缺陷检测(151)
11.2.1模型结构(151)
11.2.2实验环境与设置(153)
11.2.3消融实验(153)
11.2.4对比实验(156)
11.3实战2:基于改进YOLO V4的带钢表面缺陷检测(156)
11.3.1模型结构(156)
11.3.2实验环境与设置(157)
11.3.3消融实验(157)
11.3.4对比实验(161)
11.4实战3:基于改进YOLO V5的带钢表面缺陷检测(162)
11.4.1模型结构(162)
11.4.2实验环境与设置(163)
11.4.3消融实验(164)
11.4.4对比实验(165)
11.5本章小结(167)
第2卷参考文献(168)
第3卷基于深度学习的图像语义分割方法及应用
第12章钢材显微组织语义分割概述(175)
12.1研究背景和意义(175)
12.2钢材显微组织语义分割研究现状(177)
12.3钢材显微组织语义分割面临的挑战(179)
12.4本章小结(180)
第13章全监督语义分割(181)
13.1经典语义分割网络(181)
13.1.1FCN(181)
13.1.2UNet(182)
13.1.3DeepLab(183)
13.2基于神经崩溃的困难样本学习方法(184)
13.2.1空洞空间金字塔池化全卷积网络(184)
13.2.2等角紧坐标系分类器(186)
13.2.3困难样本加权损失(187)
13.3本章小结(188)
第14章半监督语义分割(189)
14.1半监督语义分割方法(189)
14.2原型循环一致性学习方法(191)
14.2.1基于注意力机制的特征提取器(193)
14.2.2基于超像素的图卷积网络(195)
14.2.3原型循环一致性损失(196)
14.2.4交叉伪监督损失(197)
14.3本章小结(197)
第15章弱监督语义分割(198)
15.1弱监督语义分割方法(198)
15.2像素对自监督和超像素原型对比方法(200)
15.2.1生成类激活图(201)
15.2.2像素对自监督损失(203)
15.2.3超像素原型对比损失(205)
15.3本章小结(206)
第16章钢铁图像语义分割的应用实践(207)
16.1钢材显微组织数据集(207)
16.1.1公共数据集(208)
16.1.2自制数据集(209)
16.2实验评价指标(211)
16.3实战1:基于神经崩溃困难样本学习的显微组织全监督语义分割(212)
16.3.1实验配置(212)
16.3.2实验(212)
16.4实战2:基于原型循环一致性和交叉伪监督的显微组织半监督语义分割
(218)
16.4.1实验配置(218)
16.4.2实验(218)
16.5实战3:基于像素对自监督和超像素原型对比的显微组织弱监督语义分割
(221)
16.5.1实验配置(221)
16.5.2实验(222)
16.6本章小结(224)
第3卷参考文献(225)
前言/序言
序一
在全球制造业加速向智能化转型的当下,以机器视觉为核心的图像处理技术,正通过实现自动化检测、升级质量控制、优化制造工艺,成为推动工业自动化与智能化发展的关键支撑。近年来,随着人工智能等前沿技术与传统冶金工艺深度融合,金属材料工业迎来了前所未有的技术创新与产业升级契机。在此背景下,李维刚教授所著《深度学习驱动的钢铁图像处理技术与实践》一书,系统梳理了深度学习在钢铁图像处理领域的前沿技术与典型应用,为该领域研究者、工程师及行业管理者提供了极具价值的参考。冶金工业的自动化与智能化发展,始终以多学科交叉融合为基础。李维刚教授团队深耕冶金自动化领域多年,这部专著正是其成果的凝练总结,内容贯穿深度学习、计算机视觉与冶金工程等多个学科。全书围绕图像分类、目标检测、语义分割三大核心技术,构建了从*新理论、关键技术到工程实践的全链条知识体系。同时,本书还聚焦小样本学习、元学习、半监督与弱监督方法等新兴研究方向,以解决工业场景中标注数据匮乏、样本不平衡、环境干扰强等实际问题,具有重要启示意义。尤为难得的是,本书摒弃抽象空洞的理论堆砌,通过深度剖析热轧带钢表面缺陷分类与检测、钢材显微组织分割等典型应用场景的实际案例,将复杂的深度学习模型转化为可落地、可复用、可推广的工程方案。这种 “理论-实践” 紧密结合的写作范式,不仅为钢铁行业智能化发展提供了直接参考,也为其他流程工业的技术创新提供了有益借鉴。本书提出的图像处理技术,其价值超越钢铁领域,对其他流程工业同样具备参考意义。书中阐述的基于注意力机制的特征提取、多尺度特征融合、轻量化模型设计、噪声鲁棒性优化等方法,可直接迁移至其他流程工业的同类应用场景。例如,书中详述的目标检测算法,可直接应用于铝板带表面缺陷检测,有效提升检测效率与准确率;语义分割技术则能助力铜箔、锌板等材料的显微组织分析,实现晶界与相组成的自动识别和定量统计,为工艺优化提供数据支撑。综上,《深度学习驱动的钢铁图像处理技术与实践》是一部内容翔实、结构清晰、理论与实践深度融合的专著。它既适用于人工智能、计算机视觉、图像处理等领域的研究人员,也对其他流程工业的工程技术人员具有重要参考价值。本书的出版,必将推动图像处理技术在更广泛的工业场景中的应用,助力质量控制与生产管理向智能化方向持续迈进。衷心希望读者能从中获取知识与启发,结合自身行业特点,勇于探索、积极创新,共同推动中国制造业实现高质量智能化转型。
中国工程院院士
中南大学教授
桂卫华
2025年9月
序二
智能制造是新一轮工业革命的核心驱动力,其本质是基于数据感知、分析决策与精准执行的智能化变革。图像作为工业生产中*重要、*丰富的信息载体之一,其处理与分析技术的创新,已成为推动制造业智能化升级的关键支撑。在钢铁冶金这一代表国家工业基础的重要领域,实现高质量、高效率与高稳定性的生产,尤其依赖先进图像处理和分析技术的深度赋能。近年来,深度学习(CNN、Transformer、YOLO、语义分割等)的快速发展,突破了传统方法在特征表达、泛化与鲁棒性上的局限,在缺陷检测、组织分析、工艺监控、故障诊断等复杂场景展现出广阔应用前景。本书系统梳理了深度学习在图像处理与分析中的*新进展,涵盖从图像分类、目标检测到语义分割的主要方向,既有理论深度,也有应用广度。书中不仅详细阐述了网络结构、损失函数、训练策略与轻量化设计等关键技术,还通过丰富的行业案例,如热轧带钢表面缺陷分类与检测、钢材微观组织量化分析,突出呈现了“问题—数据—模型—评价”的完整闭环,展现了深度学习技术在工程应用中的落地过程与实践经验。本书在内容上强调产学研结合与多学科交叉,整合了计算机科学、自动化与冶金工程等多领域知识,既能为高校和科研人员提供理论参考,也能为一线工程师提供可操作的技术路径和方法指引。当前全球工业智能正处在快速发展的战略机遇期,期待本书能成为推动深度学习技术在钢铁冶金领域广泛应用的重要参考,为中国制造业的数字化转型与高质量发展注入新的技术动力。
加拿大工程院院士
加拿大圭尔夫大学教授
杨先一
2025年9月




















