本书通过详细的示例、样本数据集、代码和图形教程,说明了如何:
为每个问题使用合适类型的图
快速、高效且正确地收集、清洗和组织数据
为高可读性设置可视化格式,而不损失精确性
掌握允许更深入地探索和解释数据的工具
使用少量轻量级编程创建自定义可视化
选择有效的图分析技术来从数据中提取出最多信息
使用高级的可视化技术,包括动态图、大数据工具和查询
封面图
目录
- 前言
- 作者简介
- 第I部分概述
- 第1章为什么使用图2
- 1.1商业中的可视化3
- 1.2商业中的图4
- 1.2.1找出反常现象5
- 1.2.2管理网络和供应链7
- 1.2.3辨别风险模式9
- 1.2.4优化资产组合11
- 1.2.5绘制社会等级分层图13
- 1.2.6发现社区15
- 1.3图的现状16
- 1.4小结17
- 第2章图的类型及其适用的问题18
- 2.1关系18
- 2.2分层21
- 2.3社区23
- 2.4流27
- 2.5空间网络30
- 2.6小结32
- 第Ⅱ部分过程和工具
- 第3章数据:收集、清洗和连接35
- 3.1了解目标35
- 3.2收集:识别数据35
- 3.2.1潜在的图数据源36
- 3.2.2潜在的分层数据源41
- 3.2.3获取数据43
- 3.3清洗:准备数据44
- 3.4连接:组织图数据45
- 3.4.1计算图46
- 3.4.2图数据的文件格式48
- 3.5集中回顾54
- 3.6小结54
- 第4章统计数据和布局55
- 4.1基本的图统计数据55
- 4.1.1大小(节点数和边数)55
- 4.1.2密度56
- 4.1.3成分数56
- 4.1.4度和路径56
- 4.1.5中心度58
- 4.1.6病毒式营销示例59
- 4.2布局60
- 4.2.1节点–连接布局60
- 4.2.2其他布局61
- 4.2.3力导向布局62
- 4.2.4仅节点布局66
- 4.2.5时间布局67
- 4.2.6自顶向下和其他正交分层68
- 4.2.7辐射状分层71
- 4.2.8地理布局和地图72
- 4.2.9弦图74
- 4.2.10邻接矩阵74
- 4.2.11树图76
- 4.2.12分层饼图76
- 4.2.13平行坐标77
- 4.3集中回顾79
- 4.4小结79
- 第5章视觉特性80
- 5.1基本视觉特性81
- 5.2关键的节点特性82
- 5.2.1节点大小82
- 5.2.2节点颜色84
- 5.2.3标签87
- 5.3关键的边特性91
- 5.3.1边的权重91
- 5.3.2边的颜色91
- 5.3.3边的类型92
- 5.4组合基本特性93
- 5.5捆绑、形状、图片及更多94
- 5.5.1捆绑边94
- 5.5.2形状95
- 5.5.3节点图片95
- 5.5.4节点边框96
- 5.5.5更多特性97
- 5.5.6干扰与分隔97
- 5.6集中回顾101
- 5.7小结101
- 第6章探索和解释102
- 6.1探索、解释和导出102
- 6.2必要的探索性交互104
- 6.2.1缩放和摇动(以及比例缩放和旋转)105
- 6.2.2识别106
- 6.2.3过滤器107
- 6.2.4隔离和重做布局109
- 6.3更多交互式探索110
- 6.3.1识别邻近节点111
- 6.3.2路径111
- 6.3.3删除112
- 6.3.4分组112
- 6.3.5迭代分析114
- 6.4解释114
- 6.4.1数据故事的顺序115
- 6.4.2图例116
- 6.4.3注释116
- 6.4.4导出数据子集、图和图片118
- 6.5集中回顾119
- 6.6小结120
- 第7章鼠标点击类图工具121
- 7.1Excel121
- 7.1.1汇总连接122
- 7.1.2提取节点122
- 7.1.3Excel中的邻接矩阵可视化123
- 7.2NodeXL125
- 7.2.1NodeXL基础125
- 7.2.2社交网络功能127
- 7.3Gephi129
- 7.3.1Gephi基础129
- 7.3.2注意事项131
- 7.4Cytoscape133
- 7.4.1Cytoscape基础133
- 7.4.2将数据导入Cytoscape134
- 7.4.3视觉特性135
- 7.4.4Apps菜单139
- 7.5yEd139
- 7.6小结141
- 第8章轻量级编程143
- 8.1Python143
- 8.1.1上手143
- 8.1.2清洗数据144
- 8.1.3从连接数据集中提取节点集合145
- 8.1.4将电子邮件数据转换为图149
- 8.1.5图数据库154
- 8.2JavaScript与图的可视化155
- 8.2.1D3基础155
- 8.2.2D3和图160
- 8.2.3D3弹簧图169
- 8.3小结174
- 第Ⅲ部分图的可视化分析
- 第9章关系176
- 9.1连接和关系176
- 9.1.1诈骗索赔中的相似性177
- 9.1.2网络安全179
- 9.2电子邮件关系181
- 空间分隔181
- 9.3演员与电影184
- 9.4将连接转换为节点186
- 9.5小结188
- 第10章分层189
- 10.1组织结构图189
- 10.2树与图191
- 10.3绘制分层193
- 10.4决策树198
- 10.5网站树及有效性200
- 10.6小结203
- 第11章社区204
- 11.1社区的定义特征205
- 11.2图聚类205
- 11.2.1社交网络案例分析206
- 11.2.2使用NodeXL和Gephi分析社交媒体206
- 11.2.3可聚类的布局208
- 11.2.4使用颜色描述簇的特征210
- 11.2.5社区发现211
- 11.2.6使用颜色来区分簇212
- 11.2.7社区话题分析214
- 11.2.8社区情感216
- 11.3团伙和其他组219
- 11.3.1社交媒体中的团伙220
- 11.3.2使用凸包的社区组220
- 11.4小结223
- 第12章流224
- 12.1桑基图225
- 12.2构造一个桑基图229
- 12.2.1创建页面结构229
- 12.2.2处理和建模数据230
- 12.2.3可视化数据231
- 12.2.4高亮显示通过节点的流233
- 12.3使用流的社区布局235
- 12.4弦图237
- 12.5构造一个弦图238
- 12.5.1准备数据238
- 12.5.2创建页面结构239
- 12.5.3处理和建模数据240
- 12.5.4可视化数据243
- 12.5.5根据需要显示交互细节247
- 12.6行为因子树248
- 12.7小结249
- 第13章 空间网络250
- 13.1示意图布局250
- 13.2小世界分组255
- 13.3连接玫瑰汇总255
- 13.4路线模式263
- 13.4.1可视化路线段264
- 13.4.2轨迹聚合267
- 13.5小结268
- 第IV部分高级技术
- 第14章大数据270
- 14.1图数据库271
- 14.1.1产品营销示例271
- 14.1.2创建和填充一个图数据库273
- 14.2图查询语言275
- 14.2.1使用Gremlin进行图查询276
- 14.2.2使用图查询来提取邻域278
- 14.3分析邻域281
- 14.4绘制网络活动287
- 14.5社区可视化289
- 14.6小结290
- 第15章动态图291
- 15.1图的变化291
- 15.1.1有机动画292
- 15.1.2完整时间跨度布局293
- 15.1.3重影295
- 15.1.4淡出296
- 15.1.5社区演化297
- 15.2交易图298
- 15.2.1聚类交易分析299
- 15.2.2空间交易分析304
- 15.3小结305
- 第16章设计307
- 16.1节点307
- 16.1.1节点的形状308
- 16.1.2节点大小313
- 16.1.3节点标签314
- 16.2连接314
- 16.3颜色318
- 16.4小结320
- 图论术语表322