内容简介
《大数据与网络安全治理》以大数据时代网络空间安全治理的相关案例、应用、工具的*新趋势及动向为指导思想,共四篇11章,包括基础篇2章、战略篇2章、技术篇4章、应用篇3章。《大数据与网络安全治理》特色如下:一是任务驱动,即以理论为指导,以实践为目的;二是案例导向,每章都配有大量案例,方便学生进行分析和讨论;三是实验指导,增加网络爬虫、大数据舆情监测平台、网络空间监测平台的实验操作指导;四是课程思政,每章都配有学习目标和思政目标,培养学生运用大数据与网络安全治理方法和工具解决实际问题的能力、责任感及使命感。
目录
目录
**篇 基础篇
第1章 大数据与网络空间安全概述 3
1.1 大数据的基本认识 3
1.2 网络安全治理的基本认识 7
1.3 大数据与网络安全治理的方针与原则 10
本章综合案例 13
本章复习题 14
第2章 大数据与网络安全治理的指导思想 15
2.1 总体国家安全观 15
2.2 网络强国战略 19
2.3 国家大数据战略 26
本章综合案例 33
本章复习题 38
第二篇 战 略 篇
第3章 大数据与网络安全治理战略 41
3.1 大数据与网络安全治理战略概述 41
3.2 大数据与网络安全治理战略内容 43
3.3 大数据与网络安全国家立法 52
本章综合案例 58
本章复习题 60
第4章 大数据与网络安全治理个人信息保护 61
4.1 大数据与网络安全治理个人信息保护概述 61
4.2 国内个人信息保护的现状 64
4.3 国外个人信息保护的主要经验 67
本章综合案例 72
本章复习题 74
第三篇 技术篇
第5章 网络安全行为分析大数据采集技术 77
5.1 基于网络爬虫的网络数据采集 77
5.2 网络爬虫的应用过程 84
本章综合案例 88
本章复习题 89
第6章 人工智能与数据挖掘 90
6.1 人工智能 90
6.2 机器学习 93
6.3 人工神经网络 99
6.4 深度学习 103
6.5 数据挖掘 105
本章综合案例 108
本章复习题 109
第7章 区块链技术 110
7.1 区块链的定义 110
7.2 区块链的原理 112
本章综合案例 115
本章复习题 117
第8章 数据安全治理技术 118
8.1 数据安全治理概述 118
8.2 数据加密 123
8.3 数据存储 133
8.4 数据备份 138
8.5 数据恢复 146
本章综合案例 150
本章复习题 152
第四篇 应 用 篇
第9章 网络舆情治理 155
9.1 网络舆情概述 155
9.2 数智时代的网络舆情治理 161
9.3 网络舆情的分析方法 169
本章综合案例 171
本章复习题 173
第10章 大数据下的网络空间监测平台 174
10.1 知微平台 174
10.2 清博舆情平台 181
本章综合案例 185
本章复习题 186
第11章 网络空间智慧治理 187
11.1 柔性治理技术 188
11.2 刚性治理技术 195
本章综合案例 197
本章复习题 198
参考文献 200
试读
**篇 基础篇
第1章 大数据与网络空间安全概述
【学习目标】
掌握大数据的基本概念、特征与应用情况。
理解网络安全、网络空间安全和网络安全治理的基本概念。
了解大数据与网络安全治理的方针与原则。
【思政目标】
引导学生树立数据安全与网络安全意识,提高国家安全素养。
将维护国家安全理念融入课程教育教学实践,有利于贯彻落实总体国家安全观。
1.1 大数据的基本认识
1.1.1 大数据的概念
人类是数据的创造者和使用者,自结绳记事起,数据就已慢慢产生。随着计算机和互联网的广泛应用,人类产生、创造的数据量呈爆炸式增长。巨量的数据信息正以空前的规模和速度在世界范围内流动并形成连接,云端提供了前所未有的计算能力和数据存储能力,这表明人类已身处大数据时代。
大数据(big data)这一概念自20世纪90年代提出,一直是一个热门词汇,但尚未达成共识。大数据是指在一定时间内无法用常规软件工具对其内容进行抓取、处理、分析和管理的数据集合[1]。大数据通常被认为是拍字节、艾字节或更高数量级的数据,包括结构化数据、半结构化数据和非结构化数据。大数据的规模或复杂程度超出了传统数据库和软件技术所能管理和处理的数据集范围[2]。
大数据包括交易和交互数据集在内的所有数据集,主要由海量交易数据、海量交互数据和海量数据处理三部分构成(图1-1)。①海量交易数据[如在线交易处理(online transaction processing,OLTP)],其应用特点是数据海量、读写操作比较简单、访问和更新频繁、一次交易的数据量大,但要求支持事务原子性(atomicity)、一致性(consistency)、隔离性(isolation)和持久性(durability)四大关键特性(简称ACID),数据对完整性及安全性要求高,必须保证强一致性;②海量交互数据(如社交网、传感器、全球定位系统、万维网信息),其应用特点是实时交互性强,但不要求支持事务特性,数据类型多样异构、不完备、噪声大、增长快,不要求具有强一致性;③海量数据处理[如在线分析处理(online analytical processing,OLAP)],其应用特点是面向海量数据分析,计算复杂,往往涉及多次迭代完成,追求数据分析的高效率,但不要求支持事务特性。
图1-1 大数据的构成
1.1.2 大数据的特征
大数据通常具有海量性(volume)、多样性(variety)、高速性(velocity)和价值性(value)等特征(简称4V特征),如图1-2所示。
1. 海量性
大数据的特征*先体现为数据量大。大数据的存储单位从过去的吉字节到太字节,直至拍字节、艾字节。随着网络及信息技术的高速发展,数据量呈现爆发性增长态势。科学研究、商业应用、社交媒体、移动网络、各种智能终端等都是大数据的来源。当前,全球大数据规模增长快速,2020年全球新增数据规模为64ZB,是2016年的400%,2035年全球新增数据规模将高达2140ZB。因此,如何组织和管理超大规模的数据要素已经成为一项难题。
2. 多样性
大数据的数据类型繁多。大数据广泛的数据来源决定了其形式的多样性。具体而言,大数据大体上可以分为三类(图1-3):一是结构化数据,其特点是数据间因果关系强,如财务系统数据、信息管理系统数据、医疗系统数据;二是非结
图1-2 大数据的4V特征[1]
图1-3 大数据的三种类型
构化数据,其特点是数据间没有因果关系,如视频、图像、音频;三是半结构化数据,其特点是数据间因果关系弱,如超文本标记语言(hypertext mark language,HTML)、可扩展置标语言(extensible markup language,XML)。如今数据的类型早已不是单一的文本形式,多类型数据对数据的处理能力提出了更高的要求。
3. 高速性
大数据的处理速度快,时效性要求高,这是大数据区分于传统数据*显著的特征。大数据的交换和传播是通过互联网、云计算等方式实现的,远比传统媒介的信息交换和传播速度快捷,同时大数据对处理数据的响应速度有更严格的要求。
4. 价值性
大数据的数据价值密度相对较低。虽然大数据中蕴含着丰富的信息,但有价值的信息往往分散在海量、繁杂的数据中,挖掘难度大,价值密度相对较低。如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。相较于传统的小数据,大数据*大的价值在于从大量不相关的各种类型数据中挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法进行深度分析,发现新规律和新知识,并运用于社会各个领域,*终取得改善社会治理、提高生产效率、推进科学研究的效果。
1.1.3 大数据的应用
1.医疗健康大数据
医疗健康问题是当前重要的公共服务问题和持续凸显的社会问题,这使得医疗健康大数据的有效挖掘与知识服务成为重大社会需求。当前在医疗领域,大数据有着广泛的应用空间,可以应用在医疗信息化、医疗资源管理、健康管理及医疗安全和预警等方面。
(1)医疗信息化。建立医院信息系统平台,采集患者门诊、住院等各环节的数据,以及收费、医疗人员等管理信息,为临床医疗决策提供实时的基础数据,实现医院信息的搜集、管理、统计分析、反馈等一系列功能。
(2)医疗资源管理。利用大数据技术对医疗资源进行管理,实现医生出诊、医生麻醉、手术室和病房使用等医疗资源的有效配置和利用,能够更加合理地安排医护人员工作,提高人员效率并降低人力成本和费用,提高医疗服务的效能。
(3)健康管理。健康大数据关注健康人的体检数据、心理数据、运动数据、营养数据及基因大数据。借助互联网、智能医疗器械、智能穿戴设备,实时收集居民的健康大数据,通过对体征数据的监控,实现健康管理。
(4)医疗安全和预警。当流行病发生时,可以对疾病已有的扩散趋势和感染人数进行建模,对每个时间节点的数据进行分析处理,从而对流行病进行统计研究,预测病情的扩散趋势,为疾病防治提供参考。
2.政务大数据
政务大数据涉及政府的管理与服务等众多分支机构的职能,数据量大、信息复杂。政务大数据的深度挖掘能够在提升政府治理决策的精细化与科学化、促进公共服务能力与水平的全面提升等方面发挥重要作用。
(1)政务精准营销。政府可以利用大数据技术,根据社会经济发展情况,结合社会民意调查结果,合理规划相关政策,准确分析营销策略,提高政务营销的效率。




















