内容简介
本书是在落实国家教育数字化战略行动,全面提高本科生和研究生数字素养,促进人工智能与学科专业交叉融合背景下组织编写的,旨在打造一本体系完整、算法突出和教学资源丰富的人工智能教材,可帮助读者系统掌握人工智能的知识体系以及与实际应用紧密相关的实战技能。全书分为6章,具体内容包括人工智能概述、机器学习基础、深度学习、数字图像处理、自然语言处理和生成式人工智能。本书基于面向科学发现的人工智能平台,坚持任务驱动和应用牵引的原则,深入讲解机器学习、深度学习以及生成式人工智能等关键技术,并配有实战案例。
本书适合作为高等院校人工智能专业以及计算机类、电子信息类、自动化类相关专业本科生和研究生教材,也可供从事人工智能交叉学科研究的科研人员及技术爱好者参考使用。
目录
第1章
人工智能概述
1.1 初识人工智能 1
1.1.1 人工智能的定义 1
1.1.2 人工智能的发展历程 2
1.1.3 人工智能的发展现状 4
1.2 人工智能的主要应用领域 5
1.2.1 机器学习与自然语言处理 5
1.2.2 计算机视觉与图像识别 5
1.2.3 机器人技术 6
1.2.4 智能推荐与个性化服务 6
1.2.5 智能交通与自动驾驶 7
1.3 人工智能的伦理与安全问题 7
1.3.1 人工智能伦理原则 7
1.3.2 人工智能的安全挑战 8
1.3.3 应对策略与未来展望 9
本章小结 10
思考题 10
第2章
机器学习基础
2.1 机器学习的定义 11
2.2 监督学习、无监督学习与半监督学习 12
2.2.1 监督学习 12
2.2.2 无监督学习 21
2.2.3 半监督学习 30
2.3 机器学习算法评估与优化 33
2.3.1 机器学习评估指标 33
2.3.2 常见模型评估方法介绍 41
2.3.3 模型优化方法 44
2.4 案例解析与实战:鸢尾花鉴别 47
2.4.1 监督学习实例 47
2.4.2 无监督学习实例 57
2.4.3 半监督学习实例 59
本章小结 61
思考题 62
第3章
深度学习
3.1 深度学习的概念与特点 64
3.1.1 深度学习发展历程 64
3.1.2 深度学习的基本概念 66
3.1.3 深度学习的主要应用 69
3.2 神经网络的基本原理 70
3.2.1 神经网络概述 71
3.2.2 神经元的激活规则 73
3.2.3 神经网络结构 75
3.2.4 神经网络的学习和优化 77
3.3 卷积神经网络 81
3.3.1 CNN概述 81
3.3.2 卷积概述 83
3.3.3 CNN的构成 85
3.4 循环神经网络 88
3.4.1 RNN出现的背景 88
3.4.2 RNN的网络结构 91
3.4.3 用于不同任务的RNN架构 92
3.4.4 RNN训练算法——BPTT 95
3.4.5 RNN的梯度消失问题 96
3.4.6 LSTM网络 97
3.5 深度学习框架 99
3.5.1 通过Caffe了解深度学习框架的构成要素 100
3.5.2 计算图机制 101
3.5.3 自动微分机制 102
3.5.4 深度学习编译器 104
3.6 案例解析与实战:训练评估卷积神经网络模型 105
3.6.1 数据集概述 105
3.6.2 数据加载与预处理 106
3.6.3 模型构建 108
3.6.4 设置模型训练流程 109
3.6.5 模型训练与评估 110
3.6.6 改进与优化 110
本章小结 111
思考题 111
第4章
数字图像处理
4.1 数字图像基础 113
4.1.1 图像感知与获取 113
4.1.2 图像采样与量化 115
4.1.3 图像评价与处理 119
4.2 目标检测 121
4.2.1 目标检测的基本定义 121
4.2.2 目标检测的应用场景 121
4.2.3 目标检测要解决的核心问题 124
4.2.4 基于深度学习的代表性目标检测的算法 125
4.3 图像分割与语义理解 130
4.3.1 图像分割背景介绍 130
4.3.2 语义分割相关技术 132
4.3.3 实例分割相关技术 135
4.4 案例解析与实战:基于视觉转换器的豆叶识别 141
本章小结 146
思考题 147
第5章
自然语言处理
5.1 自然语言处理基础 148
5.1.1 NLP基本概念 148
5.1.2 NLP的发展历史 150
5.1.3 NLP的主要任务 151
5.2 文本表示与嵌入 156
5.2.1 独热编码 157
5.2.2 词袋模型 158
5.2.3 TF-IDF 158
5.2.4 Word2Vec 161
5.2.5 GloVe 164
5.2.6 Seq2Seq 165
5.3 注意力机制 167
5.3.1 注意力机制的基本思想 167
5.3.2 自注意力 171
5.3.3 多头自注意力 173
5.3.4 掩码自注意力 174
5.4 Transformer架构 176
5.4.1 编码器-解码器结构 176
5.4.2 位置编码 179
5.5 预训练语言模型 183
5.5.1 BERT 183
5.5.2 GPT 187
5.6 案例解析与实战:GPT模型的构建和使用 191
5.6.1 使用Hugging Face完成GPT文本生成任务 191
5.6.2 直接使用预训练模型参数 191
5.6.3 利用数据对预训练模型进行微调后生成内容 194
本章小结 196
思考题 196
第6章
生成式人工智能
6.1 生成式人工智能基础理论 198
6.1.1 生成式人工智能的基本概念 199
6.1.2 生成式人工智能的范式 201
6.1.3 生成式模型算法 203
6.1.4 扩散模型 206
6.2 大语言模型训练及应用 208
6.2.1 大语言模型概念与原理 208
6.2.2 大语言模型数据预处理管道 210
6.2.3 大语言模型预训练 224
6.2.4 大模型微调 238
6.3 案例解析与实战:大模型预训练及微调 251
6.3.1 构建大语言模型预训练数据集 252
6.3.2 大语言模型预训练 253
6.3.3 微调预训练完成的模型 259
本章小结 265
思考题 266
参考文献 268
前言/序言
人工智能作为引领未来的战略性技术,已成为新一轮科技革命和产业变革的核心驱动力,是全球科技竞争的制高点。我国高度重视人工智能的发展,将其视为推动经济转型升级、提升国家竞争力的重要战略举措。近年来,人工智能技术在医疗、教育、交通、制造等领域广泛应用,不仅深刻改变了人们的生活方式,也为经济社会发展注入了新的活力。
发展人工智能,关键在于持续加强相关学科专业和平台载体建设,培养一大批具有创新能力和合作精神的高端人才。科研院所作为人才培养和科技创新的主阵地,肩负着为人工智能领域输送高素质专业人才的重要使命。
中国科学院计算机网络信息中心(以下简称“中心”)是中国互联网的诞生地,也是信息化技术创新与应用的示范基地。为深入贯彻落实教育、科技、人才一体化发展战略,高质量培养信息科技领域的卓越拔尖人才,中心面向全体职工和研究生开设了“人工智能关键技术与应用实战”课程。基于课程实践的丰富经验,中心组织编写了本书,旨在为学习者提供一本体系完整、内容前沿、理论与实践并重的人工智能教材。
本书的编写以培养学习者的跨学科思维和综合能力为目标,注重拓宽学术视野,提升实战水平。通过系统化的知识讲解和丰富的实践案例,学习者能够掌握与实际应用紧密相关的知识和技能,并快速将所学知识应用于实际场景中。本书不仅适合人工智能领域的学生和研究人员使用,也可为从事相关技术开发的工程师提供参考,助力他们在人工智能领域取得更大突破,为实现科技强国战略目标贡献力量。
本书内容共分6章,分别为人工智能概述、机器学习基础、深度学习、数字图像处理、自然语言处理和生成式人工智能。本书基于面向科学发现的人工智能平台,坚持任务驱动和应用牵引的原则,深入讲解机器学习、深度学习以及生成式人工智能等关键技术,并配有实战案例。机器学习相关章节,从基础到进阶,探索监督学习、无监督学习及强化学习的各种算法与应用场景;深度学习相关章节,深入讲解神经网络的内部机制,便于学习者掌握卷积神经网络、循环神经网络和生成对抗网络等核心技术;数字图像相关章节,介绍数字图像基础、目标检测及图像分割与语义理解;自然语言处理相关章节,介绍自然语言处理基础、文本表示与嵌入、注意力机制、Transformer架构及预训练语言模型;生成式人工智能相关章节,探讨了大语言模型的训练与应用,从数据清洗、模型训练到模型微调,结合案例详细讲解大语言模型的工作原理与实际应用。
本书编写人员均来自科研一线,具有深厚的理论知识和丰富的实践经验。本书具体编写分工如下:孙德刚负责全书的编写大纲设计和内容审定工作;魏金侠、杜冠瑶、宫良一、卢毓海编写第1章和第2章;荣晓慧、祁阁阁、常文静、王子鉴、杨沁蒙、邓力铭、王硕、牛亚平、陈紫蘅编写第3章和第5章;杜一、王露笛、龙晴晴、肖濛编写第4章;王婧、梁智强、孙正烈、苟甜、张博尧、杨沁蒙编写第6章。
本书案例实战部分的源代码可联系作者邮箱(edu@cnic.cn)获取。
本书在编写过程中,参考查阅了大量国内外文献资料,对相关作者表示感谢。在编写过程中,乔建伟、孙芙宁、吴响做了大量的组织协调与沟通联络工作,在此一并表示感谢。
由于人工智能技术发展迅速,且编者水平有限,不足和疏漏之处在所难免,在此希望广大读者批评指正,以使本书不断充实、巩固、提高,以达到精品教材的建设目标。
本书编写组
2025年3月