内容简介
对广大的业务分析师而言,业务分析(或者称为商业分析)应该从业务和问题出发,可视化是实现的方法,辅助决策是最终的目的。本书以业务分析为起点,介绍了“样本范围、问题描述和问题答案”的解析方法,以及聚合过程、连续与离散的字段分类,共同作为业务分析、可视化分析的理论基础。
本书借助敏捷BI工具Tableau,详细介绍了7种基本问题类型(排序、时序、占比、文本、分布、相关性、地理)及其对应的基本图形,并介绍了基于标记、坐标轴、参考线、计算的增强分析方法。本书的目的是让读者从“三图一表”的结果分析,经由分布和相关性的特征分析,走向业务分析中的关键领域——多个问题的结构化分析。
精彩书评
国际数据管理协会(DAMA)是一个全球性的专业组织,由数据管理和数字化相关的专业人士组成;协会自1980年成立以来,一直致力于数据管理和数字化的研究、实践及相关知识体系的建设,先后出版了《DAMA数据管理字典》和《DAMA数据管理知识体系指南》等。商业智能是数据管理的核心内容之一,它连接技术与业务、数据与决策、IT部门与业务部门,以辅助业务决策为最终目的。本书详细介绍了业务分析的方法,特别是问题分析的结构模型,并借助Tableau敏捷工具以图形的方式实现,对广大的数据和业务用户而言,具有很高的参考价值。
——汪广盛教授,国际数据管理协会中国区主席
数据可视化分析的根本目的是服务业务,而不仅仅为制作好看的图表,“业务、数据、可视化表达”三者应该融为一体,因此深刻理解图表的原理及其适用的业务场景是数据分析师的必修课。相反,只注重图表形式,却忽视业务洞察,则是数据分析师的大忌。本书中喜乐君用大量的实例,系统介绍了从问题到图形的Tableau方法,而通过可视化手段洞察业务也正是Tableau的精髓所在,这本书能够帮助“表哥/表姐”进阶成为真正的数据分析师!
目前市场上介绍Tableau软件操作的书籍比较多,而真正介绍可视化原理及业务分析的作品甚为难得,本书内容翔实丰富,融入了喜乐君大量的实践和思考,堪称是一部匠心之作!
——高云龙,Tableau顾问,《大话数据分析》作者
在我看过的国内外各类关于Tableau的书籍中,喜乐君的这本书独树一帜。喜乐君能够站在技术小白的角度,将其对Tableau可视化分析的理解,特别是底层逻辑的理解,和盘托出。它看起来是一本技术书,实际上是一本教会读者如何理解数据,理解Tableau,最终和数据做朋友的故事书。若读者能够像喜乐君一样有耐心,一定会茅塞顿开,打开数据新世界。
——张星辰,荣联科技集团数据服务业务总监
不论是统计分析、商业分析,还是当前流行的机器学习和深度学习等数据挖掘的分析技术,都离不开数据的可视化;在喜乐君的帮助下,中原消金顺利推广了业务分析中的Tableau方法。本书深入阐述业务分析和可视化分析的思路、方法与实践案例,虽然以Tableau作为示例,但其中的分析思路和可视化的方法却不限于Tableau,尤其有助于IT用户扩展分析思路,从而更好地赋能业务部门。
——李杨,中原消金大数据平台与应用架构师
喜乐君对大中华地区业务用户的影响是前所未有的,本书是他成为Tableau Zen Master后的全新力作。此作不仅体现了Tableau面向业务分析的价值精髓,而且为非IT用户指明了一条循序渐进、未来可期的成长之路。相信这本书能帮助更多业务用户看到并理解数据的价值,并培养面向问题、面向业务的数据分析思维。
——李霏菲, Tableau Customer Success Manager
作为一家跨境互联网企业,天然拥有大量的数据,同时面临如何把大量数据转化为经营决策的挑战。很多人推荐使用Tableau,起初走了很多弯路,直到遇到喜乐君,他对工具与方法的深刻理解令人钦佩。在作为咨询顾问的一年时间里,喜乐君不仅帮助我们深刻理解了敏捷业务分析工具,更提供了完整的业务思考方式,帮助企业建立了客户特征分析、迁徙分析等的模型思路。
——黄踵青,广州市卡贝路贸易有限公司总经理
本书精彩地讲述了如何从业务问题出发,将业务洞见以可视化语言呈现,最终用以指导业务决策。喜乐君对看似简单却极为重要的概念进行深入分析,形成了富有逻辑的系统分析方法论,为各领域的业务人员连接数据资产和业务价值铺平了最后一公里——Tableau则是最后一公里敏捷、高效的工具。喜乐君根据自己多年的思考和经验将两者有机结合,内容既有深度又形象易读,精心绘制的插图反映了满满的诚意。本书可以帮助业务人员快速参与大数据分析,从而赋能企业决策。
——李朝振博士,世界500强企业Tableau用户
一直很喜欢喜乐君的书籍和文章,他可以把业务思维和IT思维结合起来,然后用直白、易懂、流畅的语言讲授给你。本书更是从业务视角出发,把一个个图形与合适的业务场景联系起来:逻辑清晰、案例丰富、思维结构性强,配图也是精心设计,能看出作者的用心之深。
——唐小强,百胜中国
Tableau易学、易上手,但从初级提高到中级或更高水平,殊为不易,这需要大量实际业务分析项目的实践和经验积累。Tableau网站的帮助文件和市面上大多数Tableau书籍、教程专注于软件功能介绍,而基于业务层面的书籍少之又少。喜乐君的这本磨刀之作汇集了他多年的Tableau项目和培训经验,从业务需求出发,细致透彻地讲解如何将Tableau各方面的知识点恰当地运用到实际工作中,如何用适合的
目录
第1 篇 从业务和问题出发的可视化体系
第1 章 我的故事:业务分析需要可视化 2
1.1 生活/工作面前,我们都一样 . 2
1.2 带着问题启程 6
第2 章 奠基:业务可视化分析的价值 . 7
2.1 古往今来,分析的终极目的是辅助决策 7
2.2 决策:获得信息、做出判断 10
2.3 简单可视化:帮助领导更快地获得信息 11
2.4 交互可视化:可视化是假设验证的工具 14
2.5 高级可视化:分布、相关性分析与结构化分析 16
2.6 Tableau:敏捷BI 助力决策分析 18
第3 章 地平线:问题分析的方法与数据基础 . 20
3.1 问题的结构化分析与“第一字段分类” 21
3.2 分析的动态过程:聚合是本质 23
3.2.1 Excel 数据透视表:拖曳即聚合 23
3.2.2 SQL 的聚合查询:窗口式查询 24
3.2.3 Tableau VizQL 可视化聚合查询 . 26
3.3 行级别明细数据是聚合的起点,是分析的原料 27
3.3.1 数据表中包含的数据常识:数据类型与分类 . 27
3.3.2 理解数据表行级别的业务逻辑及其唯一性 . 34
3.3.3 聚合度是以数据表行级别为基准点的、衡量问题层次高低的尺度 . 37
3.4 直接聚合:基于行级别的直接聚合类型 40
3.4.1 描述规模:总和、平均值、计数 . 40
3.4.2 描述数据的波动程度:方差和标准差 . 41
3.4.3 关注个体、走向分布:百分位函数及最大值、最小值、中位数 . 44
3.5 从数据到问题的关键:“第三字段分类” 47
3.5.1 第三字段分类:行级别计算与聚合计算 . 47
3.5.2 理解聚合计算中的典型代表:“比值聚合” . 49
3.6 间接聚合:基于视图聚合的二次聚合 50
3.6.1 “复杂问题”的两个方向特征 . 50
3.6.2 基于直接聚合的二次聚合:大数据的OLAP 分析 51
3.7 从问题分析视角看数据分析的发展阶段 57
3.7.1 小数据时代的多角度明细展示 . 57
3.7.2 数据统计时代的聚合汇总 57
3.7.3 大数据时代的结构化分析 58
第4 章 启程:可视化构建方法与扩展路径 60
4.1 从聚合到图形:第二字段分类与图形构成要素 60
4.1.1 可视化坐标空间:坐标系与坐标轴 . 62
4.1.2 “第二字段分类”与坐标轴. 63
4.1.3 可视化视觉模式与图形类型. 70
4.1.4 可视化的意义描述 74
4.2 7 种主要的问题类型及其主要图形 . 75
4.2.1 传统三大图及其局限性 76
4.2.2 文本表:侧重度量指标的高密度展现 . 78
4.2.3 分布分析的三大典型图形 78
4.2.4 相关性:散点图与双轴折线图 . 82
4.2.5 地理位置可视化 83
4.3 从基本问题类型到复杂图形的延伸方法综述 85
4.3.1 从问题分析到图形增强分析的完整路径 . 85
4.3.2 基于行列的空间扩展:分区与矩阵 . 86
4.3.3 基于标记的增强分析:分层绘制方法 . 89
4.3.4 基于坐标轴的扩展:双轴、同步与多轴的合并处理 . 96
4.3.5 基于参考线的扩展:增加视图聚合的二次聚合 . 97
第2 篇 问题的7 种基本类型与可视化方法
第5 章 从问题到图形的可视化逻辑 . 102
5.1 从问题到图形的启蒙与进化 102
5.1.1 《用图表说话》中的三步走方法 . 102
5.1.2 “问题的字段解析方法”与基本问题类型 . 103
5.2 可视化图形分类方法与可视化过程 105
5.2.1 FT 可视化词典 . 105
5.2.2 Data Points 中的数据可视化过程 107
5.2.3 Abela 的“图形推荐”逻辑 108
5.2.4 面向IT 的Echarts 分类与Tableau . 109
第6 章 排序与对比(部分与部分) . 111
6.1 基本条形图与多个离散维度条形图 111
6.1.1 并排条形图(side-by-side bar):离散字段并排构成分区 . 112
6.1.2 条形图矩阵:离散字段交叉构成矩阵 . 113
6.1.3 矩阵实例:日历矩阵条形图. 114
6.1.4 堆叠条形图:你喜欢喝什么咖啡 . 116
6.1.5 比例条形图:把堆叠条形图转化为占比分析 . 118
6.2 包含多个度量坐标轴的条形图 119
6.2.1 字段重要性递减的多种布局方式 . 119
6.2.2 考虑字段关系的双轴布局方式 . 120
6.2.3 并排条形图:多个绝对值度量字段的对比 . 122
6.2.4 重叠条形图:多个绝对值度量字段的包含关系 . 124
6.3 字段类型和属性对可视化的影响 125
6.3.1 字段类型和属性对颜色的影响 . 125
6.3.
前言/序言
自序
赋予可视化灵魂:
基于业务分析的新思考
与笔者的上一本书《数据可视化分析:Tableau 原理与实践》(以下简称《数据可视化分析》)的出版相隔整一年,我们又见面了。感谢每位读者的热心支持,笔者也将付出真诚与所有。这本书不仅仅是过去一年的新知识点,更包括了笔者在数据分析领域挣扎多年后对思考体系的重新梳理和突破。作为《数据可视化分析》的姊妹篇,本书在某些体系上更加基础、完整,在一些知识上又更加深入和进阶。
在这里,笔者简单介绍一下本书的缘起、阐述方法、知识结构等内容。
1.缘起
在《数据可视化分析》一书中,笔者总结多年学习、培训和实施服务的经验,介绍了Tableau的完整知识体系,以及基于Tableau 知识框架的问题分析方法、数据准备的多层模型,特别是基于“层次”(LOD)的计算体系。该书上市后,多谢各位读者的口口相传,在Tableau 的小圈子里流传尚好,而笔者也借加印穿插补充了一些知识要点,并勘误校订。不过,该书的可视化阐述过于简单,这与笔者的艺术感欠缺、知识积累不够有直接关系。
综观各种可视化图形,不管是Tableau Public 上的,还是借助Python 可视化库实现的,在笔者看来,绚烂的形式背后大多远离了数据的土壤——业务环境。可视化的目的是业务与决策,应以业务为背景、从问题出发、以可视化方法辅助决策(见本书第2 章)。
同时,作为Tableau 重要的代理商和服务提供商之一,笔者在过去一年中有幸认识了很多客户,笔者惊奇地发现,原来大公司面临的困境和中小公司其实并无二致,甚至“组织惯性”更大、更难以改变。借助于自己多年前的业务背景,笔者极力向客户推广可视化表象之上的业务探索与结构化分析。在客户服务过程中,寥寥几个“结构化分析”案例总能打动业务人员的心——他们都曾有类似的想法,但是受限于工具,从来没有实现过。
在2020 年下半年给红塔集团、平安普惠等客户提供培训和咨询服务时,笔者就开始酝酿本书的框架。笔者有几个非常明确的期望,希望借助本书实现:
(1)专注业务分析方法,阐述更加完整的逻辑体系,特别是基于“第一字段分类”的问题分析方法、基于层次的结构化分析方法(见第3 章)。
(2)基于“第二字段分类”的可视化逻辑,“可视化是由点线面构成的图形”,但更重要的是图形类型及其对应的业务意义;业务分析是自问题到图形的过程,而非自数据到图形的过程(见第4章)。
(3)从业务场景出发,分门别类介绍问题的类型与图形逻辑,同时引导更多的业务用户从“三图一表”的基本图形,借分布分析和相关性分析的特位分析走向“结构化分析”。结构化分析是本书最重要的归宿,是笔者热切希望每一位读者、用户都能深入理解的内容,借助相关的简单案例,在你的用户中获得“哇喔”的惊喜。
2021 年上半年,在为长隆集团提供咨询服务的过程中,笔者在分享“数据准备与性能优化”时,获得了“第三字段分类”的关键灵感。本书付梓前夕,笔者特意突出了这个内容(见3.4 节),虽然内容简单,但这将是之后新书的主题“数据准备与分析模型”的逻辑起点。
为此,本书尽可能站在业务用户的角度,延续“原理性思考”的底色,阐述如何从问题出发,从业务经验出发,沿着特定的逻辑,掌握业务分析的完整体系和方法。每个人都能经过刻意练习掌握这些方法,之后再与本行业的业务经验结合,成为高级业务分析师。
2.本书的阐述方法
本书的精彩,首先来自体系框架和阐述方式;其次才是工具带来的想象力。
大学毕业及之后多年,笔者跟随王思悦教授学习“发明创造与创新思维”差不多十年了。课程中有一个让笔者铭记一生的例子:带橡皮的铅笔与羊角锤。王教授精彩地阐述了如何通过“同中之异”“异中之同”的角度创造性地总结多个事物背后的特征,从而让笔者迈向创新之路。带橡皮的铅笔一端能写、一端能擦,羊角锤一端能敲、一端可拔,功能相克,这是二者的“异中之同”。而二者又有显著的差异,前者是“材料上的互克”,后者却是“结构上的互克”,此为“同中之异”。这个例子笔者反复听了很多年,每次都有新的收获,如今终于可以换一种方式表达出来。
在本书中,笔者将用上述思考方法,总结多年业务分析和客户服务经验中的“同中之异”和“异中之同”,构建整本书的逻辑体系,比如:
? Excel 透视图、SQL 聚合查询、Tableau 拖曳分析之间的相同点是什么(问题的结构和聚合过程是相同的,见第2 章)?不同点又是什么(展现方式不同,即可视化基础,见第3 章)?__
? 条形图、折线图、饼图作为简单图形背后的相同点是什么(结果分析为主)?分布分析和相关性分析的相同点又是什么(特征分析为主)?从结果分析、特征分析再往前,就是二者结合的结构化分析。
? 简单问题和复杂问题因何不同,又因何关联在一起?如何用逻辑方法构建复杂问题和高级问题的结构?




















