内容简介
我们正在进入语音科技时代,我们的衣食住行都将发生巨变,对着智能音箱说,我想买一件T恤,它就会为你推荐甚至帮你下单;在餐厅,服务员已经变成了机器人助手,想约一顿火锅直接打电话给它就行;在家里,电视、音箱等声控中心可以听懂你的指令,在你起床之前为你打开窗帘,煮上一杯咖啡……
你我生活常见的,用键盘或在面板上写信息、在网上搜寻资料、用遥控器换台……这些都已成为历史。未来是语音操控的时代,所有的科技大腕如谷歌、 苹果、脸书、微软、科大讯飞等都已经初步展示这一新科技平台。未来的连结不再是空间,而是语音!本书诉说这一重大改变的过去与未来。
《智能语音时代:商业竞争、技术创新与虚拟永生》分四个部分来讲述:第一部分“竞争”,讲述智能语音时代的竞争之战和范式转换,解密苹果、谷歌、脸书、微软等科技巨头的智能语音布局与商业角逐;第二部分“创新”,讲述智能语音的技术探索和创新之路,探索了语音人工智能的技术突破、个性设计和交谈能力;第三部分“革命”,讲述智能语音的革命之路,探索了语音人工智能的情感陪伴、超级智能、隐私风险和虚拟永生。第四部分“zui后的计算机”,预测了智能语音的未来,并探讨了它将如何最终改变世界。
在本书中,你会了解到 :
科幻电影中出现的场景,贝佐斯和扎克伯格等科技大佬们如何把它们变成现实的?
乔布斯为什么要收购Siri公司?乔布斯为何从来没有这样执着地每天都给某个人打电话?
贝佐斯是个科幻迷,亚马*布局智能语音领域竟然与《星际迷航》有关?
贝佐斯团队是如何秘密研发虚拟语音助理的?
Siri之父是何许人也?作为智能语音领域的“吃螃蟹者”,Siri是如何进行商业化的?
人工智能可以让人们跟逝者“对话”?
为什么说电子商务可能是在智能语音领域*佳的盈利模式?
机器计算、神经网络技术、深度学习技术等*新技术的突破口在哪里?
智能语音行业的商业模式是怎样的?
语音助理的个性是如何设计的?
智能语音的核心技术是什么?
智能语音行业的未来盈利模式是怎样的?
智能语音将如何改变世界和未来?
……
精彩书评
随着人工智能、5G技术的日渐普及,人类正在步入智能语音时代,包括智能语音在内的新技术将会切实改变了人们的生活。本书深入探讨了全球智能语音领域的现状和未来,通俗易懂,是一部难得的扎实的科普作品。他山之石,可以攻玉。相信本书能为我国的智能语音产业的发展提供更多的启迪。
——工业和信息化部信息化和软件服务业司副司长 董大健
语音可以说是人机交互*重要的方式。《智能语音时代》娓娓道来现在与未来智能语音将会给人们带来的改变,值得一提的是本书对产业的观察鞭辟入里、又拥有极高的可读性。
——科大讯飞轮值总裁、消费者BG总裁 胡郁
语音技术重塑了人机关系,《智能语音时代》对此展开了令人激动的描述。弗拉霍斯对语音技术如何改变世界进行了精彩呈现,他是一位非常优秀的作者。书中的每一页都会给你新的视角和观点,你会忍不住翻阅下去。相信本书会引爆世界!
——《连线》杂志主编 尼古拉斯·汤普森( Nicholas Thompson)
语音人工智能是一次技术的范式转移。从全景宏观世界到对我们每个人生活的直接影响,弗拉霍斯把所有这一切展现得十分生动。这是一本有深度的、有趣的巨作。
——Siri联合创造者 汤姆·格鲁伯 (Tom Gruber)
弗拉霍斯的这本书把我们日常生活越来越离不开的语音技术讲得很透彻。在本书中,他为读者呈现了智能语音的未来。
——《奇点临近》作者、科学家、未来学家 雷·库兹韦尔(Ray Kurzwell)
裂变的“接力棒”已经从智能手机传给了智能语音,弗拉霍斯把这次平台转换精彩地呈现出来。
——畅销书作家 斯高特·加罗威(Scott Galloway)
目录
第一部分 竞争
CHAPTER01 范式转移 / 002
CHAPTER02 语音助理 / 019
CHAPTER03 科技巨头 / 052
第二部分 创新
CHAPTER04 探索之旅 / 086
CHAPTER05 技术突破 / 116
CHAPTER06 个性设计 / 156
CHAPTER07 交谈能力 / 188
第三部分 革命
CHAPTER08 陪伴功能 / 226
CHAPTER09 超级智能 / 268
CHAPTER10 隐私风险 / 302
CHAPTER11 虚拟永生 / 342
后记 最后的计算机 / 379
试读
每十年左右,人与技术的互动方式就会有一个根本性的转变。数十亿美元的财富会“恭候”那些定义了新的时代范式的公司,而落伍者将破产倒闭。在计算机的大型机时代,IBM是主宰者;微软公司是桌面时代的王者;谷歌公司靠搜索引领了互联网时代;苹果公司和脸书公司则在移动互联网时代一飞冲天。
最近的一次范式转移正在进行中。
最新的平台之战已经打响。
最新的技术颠覆正在发生,无论是其规模还是其重要性,都可能是世人前所未见的。
我们正在迈入智能语音时代。
语音正在变成影响现实的通用遥控器,成为几乎能控制任何一种技术装置的手段。语音能够让我们指挥各种数字产品助理——“行政助理”“门房”“主妇”“管家”“顾问”“保姆”“图书管理员”“演艺人员”等。语音打破了世界上一些最有价值的公司的商业模式,为新的应用创造了机会。语音把对人工智能的控制权交给了用户。很久之前科幻作品就预言过这样的关系模式,在这样的关系模式中,拟人化的人工智能成为我们的“助手”“看门人”“预言者”“朋友”。
智能语音时代的到来是人类历史的转折,因为运用语音是我们人类这个物种的特质——这一能力把我们和其他物种区分开来。人类的内部意识的中心不在肺部的空气里,也不在血管里的血液中,而是在大脑的语言区里。语言调整着我们的关系,它能塑造思想、表达感受、沟通需求;它能发起变革、挽救生命、激起爱恨情仇;它把我们所知道的一切记录下来。
得益于最近出现的一系列突破,教计算机用自然语言说话的浪漫构想在现实世界中有了市场——这个领域被称为智能语音领域。随着按照摩尔定律能够预测到的计算能力以指数级提升,一系列进展开始出现。手机崛起——事实上我们随时携带着的是一台强大的袖珍计算机,它是语音技术发展的重要推动者。
机器学习使得计算机能通过分析数据就能获得能力——这非常关键,能够让开发者一举克服那些已经纠缠了几十年的问题。而云计算是一个决定性的(但经常被忽略的)因素。语音技术需要巨大的算力支撑。尝试把所有的算力都在手机上实现十分困难,并且其代价极高。在如今的云时代,只要简单地加上一个麦克风和一个Wi-Fi芯片,任何装置都能实现语音驱动。从浴室的水龙头到孩子玩的布娃娃,任何装置都能利用分布在全球的几千台计算机所提供的计算能力。
以上述所有这些进展为后盾,语音正在引领着“环境智能”的实现,它最终可能会让我们现在手中的这些智能手机过时。到目前为止,计算机还是计算机,是我们能放在案头或拿在手里的一件独立性装置。但是当大部分技术设备都能放在很远的地方而不需要放在现场,可以用声音而不是笨重的外围设备来实现控制时,那么这些设备的重要性就降低了。正如谷歌公司的首席执行官桑德尔·皮蔡在致股东的一封信中所言:“未来将要迈出的一大步是,‘装置’这个概念本身就要消亡。”有了语音助力,计算机将变成一个无处不在的‘存在’。数字智能也将无处不在,正如我们呼吸的空气一样。
语音也解决了一个已经困扰人类几千年的大问题。人类的发明总是要求我们去适应它们。无论是飞机、吉他、割草机还是电子游戏,我们都不得不去学习那些不够自然的命令和动作,以便让这些装置听我们指挥——我们来决定按哪个按钮,滑动哪根操纵杆,转动哪个轮子,踩哪块踏板。
在计算机上,我们需要弯着手指在键盘上的一堆字母键、数字键和符号键之间游走——当标准的计算机键盘在1867年获得专利时,这可是一项高科技,当然现在已经不是了。当手持鼠标滑来滑去时,我们可以通过点击进行操作。在智能手机上,我们的操作是敲击、滑动、缩放。于是,我们坐着或者站着不动,脊梁弯曲、眼睛发涩,成了屏幕的“俘虏”。
然而运用语音,计算机最终能以我们的方式工作。它们正在学习人类偏爱的沟通方式:运用语言进行沟通。当运用得好时,语音的优势非常明显,以至于你几乎难以感觉到它也是一层介质。人类知道如何说话,因为我们终其一生都在说话。
在智能语音时代,台式计算机和智能手机不会消失,这就像喷气式飞机没有把汽车淘汰一样。语音技术会和其他新兴技术整合到一起,例如增强现实技术。但是在使用很多应用程序时,人们会抛弃键盘和触摸屏,而选择更自然、更让人自在的语音界面。计算机将随我们起舞,而不是让我们趋奉它们。
这只是时间问题。
前言/序言
作为一个见证者,我非常庆幸自己亲历了波澜壮阔的互联网时代、大数据时代、人工智能时代,深切感受到了接踵而至的技术浪潮是如何快捷地改变我们的工作和生活的,如果未来有闲暇时间追根溯源,那一定是一件非常美好的事情。
作为一个出版人,我也非常高兴能够遇到今天正式呈献给各位读者的这样一部优秀的科技人文作品,对于这本深入浅出、充满趣味又可能引领一个新的时代到来的科普著作,能够先睹为快,实在是一件令人赏心悦目的事情。
关于智能语音时代,我们大部分人已经多多少少有了一些直接或间接的感受。比如我们手机上的Siri或者其他语音软件,这曾是苹果手机最令人瞩目的新功能之一;又比如我们经常在用的语音导航软件里传出的林志玲的“娃娃音”,还有微软小冰展现自己诗歌“别才”的诗集《阳光失了玻璃窗》;当然,还有电子鸡、旅行青蛙这样风行一时的电子宠物。
对我来说最新的例子是,我在2019年春节期间购买了一台小米智能音箱(“小爱同学”)作为礼物送给父母。“小爱同学”的乖巧能干,可着实把他们惊呆了。“小爱同学”为他们做的第一件事是播放花鼓戏《浏阳河》,这是现代技术与古老文化碰撞出的新奇体验。
与我们直接的生活经验不同,被称为美国鬼才科普作家的本书作者詹姆斯·弗拉霍斯(James Vlahos),给我们带来了对语音技术这样一个蔚为大观的科技发展趋势的深入洞察。作为智能语音领域的开山之作,作者确实出手不凡,他把语音技术、应用与产业的讨论引向了难得的高度,非常清晰地给我们展现了智能语音时代的新场景。
詹姆斯·弗拉霍斯是一位长期追踪研究语音技术和语音人工智能领域的专题记者,30多年来,他零距离地见证和细致地观察了这一领域的研究进展,曾与这一领域中的许多杰出人物直接对话,本书中的许多观点就是来自他对第一手访谈资料的提炼。
更难能可贵的是,本书作者还是这一领域的深度涉猎者和亲身参与者。他从十几岁起就对人与机器的对话产生浓厚兴趣,并曾尝试用BASIC语言开发了自己的文本对话游戏(虽然只能运行寥寥几步),他还开发出了以自己父亲为蓝本的聊天机器人,让自己的父亲实现了“虚拟永生”。
因此,本书不管是观察与思考的深度和广度,还是研究资料的广泛和翔实等,各个方面都令人钦佩,也让人感到“解渴”和过瘾。读这样一本书,从实用的角度说,花费的时间有更高的性价比,它能让我们真切地感受到一个新的产业生态的发展趋势,启发我们从经济、社会和文化等角度来思考语音技术和语音人工智能已经或即将带来的影响。
翻开这本书,你首先就会被作者这样的话语所吸引:每十年左右,人与技术的互动方式就会有一个根本性的转变。数十亿美元的财富会“恭候”那些定义了新的时代范式的公司,而落伍者将破产倒闭。在计算机的大型机时代,IBM是主宰者;微软公司是桌面时代的王者;谷歌公司靠搜索引领了互联网时代;苹果公司和脸书公司则在移动互联网时代一飞冲天。
最近的一次范式转移正在进行中。
最新的平台之战已经打响。
最新的技术颠覆正在发生,无论是其规模还是其重要性,都可能是世人前所未见的。
我们正在迈入智能语音时代。
语音正在变成影响现实的通用遥控器,成为几乎能控制任何一种技术装置的手段。语音能够让我们指挥各种数字产品助理——“行政助理”“门房”“主妇”“管家”“顾问”“保姆”“图书管理员”“演艺人员”等。语音打破了世界上一些最有价值的公司的商业模式,为新的应用创造了机会。语音把对人工智能的控制权交给了用户。很久之前科幻作品就预言过这样的关系模式,在这样的关系模式中,拟人化的人工智能成为我们的“助手”“看门人”“预言者”“朋友”。
作者这样言之凿凿,显然并非空穴来风。了解作者的思考逻辑,把握这样一个大趋势,并以此指导我们的工作和生活,必然有利于我们做出更多正确的选择。书中提到,当Siri 在2010年刚刚被开发出来时,先知先觉的苹果公司前CEO乔布斯曾经连续17天每天给开发者之一的吉特劳斯打电话,有时甚至深更半夜也打,终于把Siri收入苹果公司囊中。
远见从来都是人类最宝贵的品质之一,作为智能语音领域的第一本书,这也可以视为一本“远见之书”。
除了具有经济性含义的远见,本书还非常重视这项新技术对人类精神和感性世界的影响,甚至作者也把自己和自己的家庭带入了与语音人工智能的互动过程中,这大大增强了本书的故事性。本书有文采、有温度、有趣味,展卷在手,没有同类书的枯燥和沉重,反而有一种引人入胜、不忍释卷之感。
正如作者在书中所言:智能语音时代的到来是人类历史的转折,因为运用语音是我们人类这个物种的特质——这一能力把我们和其他物种区分开来。人类的内部意识的中心不在肺部的空气里,也不在血管里的血液中,




















