内容简介
随着数字信号处理、3D图像处理、人工智能处理、智能手机等新型技术和应用的出现,传统芯片领域的霸主——CPU面临更多的挑战。本书从应用需求和发展历程出发,以多个名人典故为引导介绍不同形式的可编程芯片,如CPU、GPU、NPU、XPU、SoC、DSA等。通过这些具备编程能力的芯片及相关的开源项目,深入介绍不同类型芯片的架构及编程方式。本书通过开源项目深入介绍这些芯片的细节,通过芯片追求内功的“可编程性”以及外功的“高性能”这条主线,将目前的高性能芯片形式串联起来,从而引出CPU到DSA的演进。随书附赠源码、案例素材等,获取方式见封底。
本书适合从事芯片研发的人员及相关专业的在校大学生阅读,也适合关注我国芯片技术发展的读者阅读。
精彩书评
智能算力呈现多样化特征,不同场景产生不同的算力需求,以RISC-V为代表的开源芯片新浪潮在满足这些算力需求上提供了革命性方案。《芯术:算力驱动架构变革》从科普的角度介绍了基于RISC-V领域专用架构(DSA)的优势,体现了算力驱动芯片架构不断变革的趋势。
--中国科学院计算技术研究所副所长 包云岗
《芯术:算力驱动架构变革》以算力演进为轴,串联个人计算、光影计算、移动计算到智能计算的技术群像与产业激变,承载架构从CPU、GPU、NPU到DSA的不断创新,算力需求无限,架构变革不止。
--中国科学院自动化研究所研究员 边桂彬
李申博士深耕行业十余年,以“歪睿老哥”的笔触讲述了芯片架构在算力变迁中的演进,将深奥的专业知识写成工程师的枕边书、学生的入门课。
--北京邮电大学教授、博/硕士生导师,《人工智能安全原理与实践》主编 李剑
当芯片进入后摩尔时代,架构创新就是智算未来的“炼金术”。《芯术:算力驱动架构变革》以生动的产业叙事为引子,插入架构变革的主题,娓娓道来CPU的冯诺依曼枷锁、GPU的并行计算、TPU的脉动阵列,还有DSA的领域架构创新。
--广东省大湾区集成电路与系统应用研究院常务副院长 王云
无论是SOC在移动端的集成革命、XPU在云计算的异构突破,还是DSA在智能算力的定制浪潮,《芯术:算力驱动架构变革》以“算力驱动架构变革”为主线,全景式呈现了从计算机诞生到智能时代跃迁的算力进化史。
--中国科学院物理研究所副研究员 方少波
目录
前言
第1章 芯片——算力的基座/
1.1算力之争——原子弹背后的功臣/
1.2从二进制到集成电路/
1.2.1莱布尼茨:二进制和“八卦”/
1.2.2布尔:运算的真和假/
1.2.3香农:硕士论文和开关电路/
1.2.4基尔比:从晶体管到集成电路/
1.3芯片进步的力量/
1.3.1肖克利与八叛徒/
1.3.2摩尔与摩尔定律/
1.3.3后摩尔时代:鱼鳍和GAA/
1.4芯片是怎样炼成的/
1.4.1芯片设计——如何从零开始设计一款芯片/
1.4.2芯片验证——保证芯片成功的七种武器/
1.4.3芯片制造——究竟难在什么地方/
1.4.4芯片封装——先进封装怎么成为超越摩尔定律的利器/
1.4.5芯片测试——工艺挖坑测试来填/
1.5芯片的大格局/
1.5.1分工明确——从IDM与Fabless说起/
1.5.2周期漫长——芯片设计与生产的耐心之旅/
1.5.3灵活可变——形态各异的处理器争奇斗艳/
第2章 CPU与个人计算/
2.1计算机的诞生/
2.1.1艾达·洛芙莱斯——维多利亚时代的程序媛/
2.1.2艾伦·图灵——可判定性问题悖论/
2.1.3冯·诺依曼——可编程的机器打开计算机的世界/
2.2硅芯片与计算机时代/
2.2.1白雪公主和七个小矮人——大型机时代/
2.2.2单芯片的可编程计算机——微处理器的诞生/
2.2.3飞入寻常百姓家——苹果开启了个人计算机时代/
2.2.4开放还是封闭——IBM兼容机/
2.2.5放弃意味着前进——Intel在PC时代的崛起/
2.3处理器发展的烦恼/
2.3.1频率——摩尔定律的灵魂/
2.3.2流水线——提升频率的利器/
2.3.3超线程——装有多个大脑的躯体/
2.3.4内存墙——冯·诺依曼架构的缺陷/
2.3.5多核技术——情非所愿的选择/
2.4处理器的编程/
2.4.1指令集——CISC还是RISC/
2.4.2编译器——软件和硬件的翻译官/
2.4.3操作系统——从命令行到图形界面/
第3章 GPU与光影计算/
3.1GPU的诞生/
3.1.1洪荒时代——从显示到绘图/
3.1.2青铜时代——从OEM开始/
3.1.3白银时代——打开3D之门的雷神之锤/
3.1.4黄金时代——列王的纷争/
3.1.5钻石时代——棋逢对手的较量/
3.2色彩世界的计算方式/
3.2.1色彩的显示——RGB/
3.2.22D的计算——点、线、面/
3.2.33D的计算——光影魔术师/
3.3GPU的编程/
3.3.1OpenGL/
3.3.2DirectX/
3.3.3OpenCL/
3.4CUDA——并行计算大师/
3.4.1生而逢时——CUDA/
3.4.2CUDA成就了GPU的灵魂/
3.4.3SIMT/
3.4.4CUDA编程实例/
3.5开源GPU实例—— MIAOW/
3.5.1阳春白雪:难得一见的开源GPU/
3.5.2MIAOW的简介和目标/
3.5.3MIAOW的架构/
3.5.4MIAOW的设计实现/
3.5.5功耗、性能和面积/
3.5.6线程块压缩/
3.5.7MIAOW的总结/
第4章 NPU与人工智能/
4.1人工智能的兴起/
4.1.1巅峰之战/
4.1.2从源起到低潮/
4.1.3起死回生/
4.1.4卷积神经网络/
4.1.5机器学习的革命/
4.2GPGPU的AI计算/
4.2.1GPGPU在人工智能时代崛起/
4.2.2从图像处理到AI计算/
4.2.3张量加速计算——Tensor Core/
4.3人工智能的计算范式/
4.3.1标量、向量、矩阵和张量/
4.3.2CPU的落寞/
4.3.3GPU的崛起 /
4.3.4专用AI处理器的诞生/
4.4TPU——专用人工智能处理器/
4.4.1TPU的简介/
4.4.2TPU 的架构设计/
4.4.3TPU 的编程/
4.4.4TPU 的演进/
4.5人工智能编程与测试/
4.5.1人工智能的编程——TensorFlow/
4.5.2人工智能测试基准——不服跑个分/
4.6开源AI处理器的实例—— NVDLA/
4.6.1NVDLA的简介/
4.6.2NVDLA的架构/
4.6.3卷积核心/
4.6.4单点数据处理器/
4.6.5二维数据处理器/
4.6.6跨通道数据处理器/
4.6.7数据重塑引擎/
4.6.8NVDLA的编程/
第5章 XPU与云计算/
5.1云计算的兴起与CPU的影响/
5.1.1算力的共享——当计算成为基础设施/
5.1.2权力的游戏——新王的诞生/
5.1.3从芯到云——谁主沉浮/
5.1.4卷土重来未可知——ARM服务器芯片/
5.2云计算CPU的技术演进/
5.2.1盗梦空间/
5.2.2虚拟化支持/
5.2.3多核与高性能/
5.2.4绿色和节能/
5.2.5可扩展性/
5.3智能云与AI计算/
5.3.1智能云对芯片需求的变化/
5.3.2智能云与GPGPU/
5.3.3AI算力的虚拟化/
5.3.4AI算力的扩展/
5.3.5GPU的存储/
5.4云计算与FPGA加速器/
5.4.1FPGA是什么/
5.4.2EDA工具/
5.4.3FPGA的作用/
5.4.4FPGA在Azure的用例/
5.5超级AI计算实例/
5.5.1TPU POD——谷歌的创新/
5.5.2Ascend 910——华为的登峰/
第6章 SoC与移动计算/
6.1手机处理器/
6.1.1从麒麟9000S开始说起/
6.1.2手机SoC的历史/
6.1.3手机SoC的未来/
6.2SoC设计的组件/
6.2.1嵌入式CPU的王者——ARM/
6.2.2百花齐放的嵌入式GPU/
6.2.3嵌入式NPU/
6.3边缘AI算力/
6.3.1智能座舱SoC/
6.3.2智能驾驶SoC/
第7章 DSA与专属领域算力/
7.1RISCV的开启/
7.1.1图灵奖得主/
7.1.2开源指令集/
7.1.3开源生态/
7.2RISCV与DSA/
7.2.1开源处理器/
7.2.2DSA:领域定制架构/
7.2.3DSL:领域定制语言/
7.3Jim Keller的DSA实践/
7.3.1Tensix:从RISCV到AI处理器/
7.3.2Jim Keller的芯片研发之道/
7.4DOJO——特斯拉的“训练场”/
7.4.1大模型训练的挑战/
7.4.2DOJO解决问题的方法/
7.4.3D1的架构/
7.4.4训练场的搭建/
第8章 那些年我们追过的算力/
8.1比特币和区块链/
8.2元宇宙与扩展现实/
8.3ChatGPT和大模型/
参考文献/
前言/序言
在人类文明发展历程中,计算能力不断进步,从古代的手指计数到后来的机械化计算工具,再到查尔斯·巴贝奇设计的差分机和分析机,这一系列进步体现了人类对算力的不懈追求。但直到第二次世界大战后,算力仍然相对原始。
随着芯片的诞生,人类算力形态发生了转变。芯片以其强大的计算能力成为现代科技的核心。如今,算力已渗透到我们生活的方方面面,而芯片是算力的核心,满足着不断增长的算力需求,并推动着科技的进步。展望未来,随着新技术的不断发展,算力需求将激增,芯片的重要性也将日益凸显。
在个人计算机时代,CPU因其强大的计算和可编程能力成为核心处理器,成为算力的底座。随着摩尔定律的发展,CPU的频率从不到1MHz到5GHz左右,从单核到多核,从单线程到多线程,一直发展至今,成为通用算力的代表。
随着计算机技术的发展,图像处理和游戏的需求增加,在光影计算时代,CPU处理此类算力捉襟见肘。一种专注于图像处理的处理器——GPU的诞生,让图像处理能力有了突飞猛进的增长。而CUDA的诞生,让GPU从专注于图形处理,进化到通用并行计算处理器的GPGPU。最终使其在图像处理和人工智能领域逐渐取代CPU,成为新的算力之王。
人工智能时代,NPU作为专为深度学习和神经网络设计的硬件加速器,高效执行神经网络算法,为AI应用提供强大的计算能力。未来的人工智能算力是专用AI处理器还是GPGPU,这个问题仍然没有答案。
在云计算领域,为了让用户像使用自来水一样方便地使用不同形态的算力,云服务商的策略是“我都要”。于是在云端,CPU、GPU、NPU等处理器并存,共同构成了云端算力的表现形式。而在移动计算领域,SoC将CPU、GPU、NPU集成在一块芯片之中,强调在有限功耗下的高算力,包括通用计算、图形计算、AI计算等混合计算形态,为手机——今天每个人都离不开的设备提供了强大的移动算力,共同奏响了移动计算的协奏曲。
在摩尔定律越来越放缓的今天,算力仍然是人类的极致追求。DSA架构作为可编程芯片的另一种趋势,通过软硬件协同优化,特定任务处理速度大幅提升。而RISCV开放指令集架构的出现,为DSA设计提供了可自由定制的底层基础,使基于RISCV的DSA架构获得持续创新的源头活水,继续将算力提升到一个新的水平。
新的场景带来新的算力需求,人类对算力的需求永无止境,芯片的架构也不断进化,这场算力架构的演进,从未停息。
本书聚集于算力核心载体的迭代升级,系统解构从通用处理器到专用加速器的架构革新,全景展现CPU、GPU、NPU、XPU、SoC及DSA等芯片推动算力跃迁的演进历程。
由于作者水平有限,书中难免有不妥之处,诚挚期盼读者们给予批评和指正。
作者