内容简介
本书以城市物流大数据分析技术及应用为核心内容, 共分 9 章。 第 1 章介绍大数
据与大语言模型基础理论, 包括大数据概述、 云计算、 大数据分析技术、 大语言模型
概述等, 让读者了解大数据与大语言模型的基础概念; 第 2 章介绍大数据分析与大语
言模型常用工具及算法, 包括常用大数据分析软件简介、 分类分析、 关联分析、 聚类
分析、 回归分析、 大语言模型工具简介等, 让读者对大数据分析的实现工具及方法有
初步的认识; 第 3 章介绍关联规则、 推荐算法与大模型关键要素, 包括关联规则挖掘、
协同过滤推荐算法、 大语言模型关键要素以及大数据分析所需的方法及实践 (上下文
长度 “大” 模型 “小” 型化); 第 4 章介绍聚类算法及大语言模型应用, 包括聚类的
原理与实现、 层次聚类算法、 K-means 聚类算法、 K-medoids 聚类算法、 DBSCAN 聚类
算法等; 第 5 章介绍分类算法应用与大语言模型发展, 包括分类的基本原理、 K-近邻
分类算法、 朴素贝叶斯分类算法、 决策树分类算法、 随机森林分类算法等, 并运用上
述算法进行数据处理; 第 6 章介绍回归分析与大语言模型综合评价维度, 包括线性回
归、 逻辑回归、 大语言模型综合评价维度; 第 7 章介绍人工神经网络与大模型, 包括
神经元与感知机、 人工神经网络的核心要素、 深度学习与深度神经网络等; 第 8 章介
绍大语言模型训练与发展应用; 第 9 章介绍大数据分析与大语言模型促进城市物流可
持续发展, 包括城市物流、 大数据分析等。
目录
1 大数据与大语言模型基础理论
1.1大数据概述
1.2 云计算——大数据的处理架构
1.3 大数据分析技术
1.4 大语言模型概述
2 大数据与大语言模型分析常用工具及算法
2.1 常用数据分析软件简介
2.2 分类分析
2.3 关联分析
2.4 聚类分析
2.5 回归分析
2.6 大语言模型工具简介
3 关联规则、推荐算法与大模型关键要素
3.1 关联规则挖掘
3.2 协同过滤推荐算法
3.3 大语言模型关键要素
3.3 上下文长度:应用创新的关键靶点
3.4 “大”模型“小”型化:应用落地的降本之道
4 聚类算法及大语言模型应用
4.1 聚类的原理与实现
4.2 层次聚类算法
4.3 K-means 聚类算法
4.4 K-medoids聚类算法
4.5 DBSCAN聚类算法
4.6 大语言模型在人才和资本领域中的应用
4.7 大语言模型在量化金融中的应用
5 分类算法应用与大语言模型发展
5.1 分类的基本原理
5.2 K-近邻分类算法
5.3 朴素贝叶斯分类算法
5.4 决策树分类算法
5.5 随机森林分类算法
5.6 大模型赋能技术变革
6 回归分析与大语言模型综合评价维度
6.1 线性回归
6.2 逻辑回归
6.3 大语言模型综合评价维度
7 人工神经网络与大模型
7.1 神经元与感知机
7.2 人工神经网络的核心要素
7.3 深度学习与深度神经网络
7.4 人工神经网络应用于大模型
8 大语言模型训练与发展应用
8.1算法训练决定大模型表现
8.2大语言模型的发展和应用
9 大数据分析与大语言模型促进城市物流可持续发展
9.1 城市物流
9.2 大数据分析
9.3 大数据及大语言模型赋能“一带一路”倡议
9.3 全球城市可持续发展指数的框架和特点
9.4 全球城市可持续发展指数的创新探索讨论
9.5 结语
试读
1. 数据采集
数据采集是通过网络爬虫、 系统日志采集、 传感器等工具从互联网、 物联网、 交
互型社交网络及移动互联网获取多种类型海量数据的过程。
2. 数据预处理
数据预处理是数据分析和挖掘的基础, 是对接收数据进行清洗、 集成、 特征选择、
标准化等操作, 并最终作为数据分析的输入数据集的过程。
(1) 数据清洗。
从现实世界中采集到的数据一般是不完整、 有噪声且不一致的。 数据清洗过程主
要包括: 数据的缺失值处理、 噪声数据处理、 不一致数据的处理。
(2) 数据集成。
数据集成是将多个数据源中的数据合并存放在一起的过程, 其中数据源可包括:
关系型数据库、 非关系型 (NoSQL) 数据库、 网页及非结构化文本等。
(3) 特征选择。
在有限的样本数目下, 选择出重要的特征可以解决维数 (即特征的个数) 灾难问
题, 而去除不相关特征可以降低数据分析任务的难度, 通过特征选择可以达到降维、
提升模型效果和性能等目标。
前言/序言
前 言
本书可为各级政府和企业拓展 “城市与物流” 投资与建设空间提供大数据决策方
法与定量分析支撑。 本书由国家 “双一流” 建设计划新疆大学经济与管理学院物流学
科带头人、 中国—中亚经济与治理大数据研究中心负责人王海灵带领的团队编著。 王
海灵负责全书的编著、 统稿等工作, 王思成主要承担第 1 章的第 4 节、 第 2 章的第 6
节、 第 3 章的第 3 节、 第 4 章的第 6 节、 第 8 章及第 9 章内容的编写以及相关资料整理
工作, 许辉主要完成第 1 章至第 7 章的主要内容的编写等工作, 朱新杰负责本书中程
序的可视化呈现及实验设备的调试维护工作。
本书是国家 “双一流” 教学科研平台项目: “中国—中亚经济与治理大数据实验室
建设项目” (2020) 的主要成果之一。 本书在编写与出版过程中, 受到新疆维吾尔自治
区教育厅高教处、 新疆大学 “双一流” 规划处、 新疆大学教务处、 新疆大学社科处及
新疆大学经济与管理学院等相关单位的大力支持和帮助, 孙景兵院长、 马伟书记、 张
立杰教授、 郭庆然教授、 苏鹏副教授、 王珍讲师等对全书的修改与出版工作提出宝贵
建议, 李闯、 张玲富、 仝博、 韩娇娇、 王凤娟、 成美仪、 李淑娟、 王胜楠、 易梦瑶、
严杰、 姜浩等在资料整理及部分章节编写方面做了大量工作, 在此表示感谢! 中国财
富出版社有限公司的编辑们为本书出版付出了辛勤的劳动, 在此表示诚挚的谢意。
由于编写时间仓促, 难免有疏漏和不妥之处, 敬请读者批评与指正。
王海灵
2025 年 9 月 1 日




















