可视化分析:瀑布图的使用场景及实现原理
瀑布图确在表现数据变化因素或过程上有着得天独厚的优势。在实际的应用场景中,瀑布图常用于经营情况分析,解释从一个数字到另一个数字的变化过程。比如评估公司利润、比较产品收益、突出显示项目的预算变更、分析一段时间内的库存或销售情况 、显示一段时间内产品价值变化等。本篇文章,来聊聊瀑布图的使用场景及实现原理。
做数据可视化分析时,会出现两个极端,一是不管什么需求,用表格干就完了。再者就是追求炫酷的可视化效果,堆叠各种“高端”的可视化图表,用户看不懂,华而不实。基于实际的分析需求以及要表达的信息内容,选择最匹配的图表形式,才能可视化得恰到好处。
每种图表能够承载的数据格式以及反映的数据信息各不相同,这一次主要想分享瀑布图的用法,不管以后是做定制化的可视化页面开发,还是做自助BI图表类型的扩展,都会有所帮助。
一、瀑布图的使用场景
瀑布图适用于表达数个特定数值之间的数量变化关系,或者用来直观地呈现出现出影响总体值的关键维度,在企业经营分析、财务分析领域中应用广泛。
Office2016之前版本的excel在绘制瀑布图时,是在柱形图的基础上进行加工得到的,所以瀑布图看起来有点像隐藏了部分柱身的柱图,但两者在信息呈现方式上还是有较大差异的。瀑布图中数据的排列形状(称为浮动列)看似瀑布悬空,从而反映数据在不同时期或不同因素对总体值影响的程度,还可以直观反映出数据的增减变化。财务分析企业利润构成、预算变更,以及产品库存或销售情况等场景下,经常会用到。
二、瀑布图的分类
瀑布图按照信息呈现的形态,可以分为结构瀑布图、变化瀑布图、堆叠瀑布图等不同的图表类型。
1.结构瀑布图最常用来展示总分结构或序列变化,通过柱图垂直高度展示数据,直观地展示指标的构成,相比较饼图或常归的柱形图,可以将总体值与细分维度值同时展示出来,并且可以快速的反映出影响总体值的关键因子。主要用来反映目标指标的构成关系,例如每月支出费用构成项目细分,公司成本分摊等。
现在基本上很少用现金付钱了,都是移动支付,对钱的概念就非常淡化了,加上信用卡的提前预付,到月底发现工资所剩无几。可以利用瀑布图来分析每月支出费用的去向,下图中,可以清晰的看出,总支出费用,以及在各项支出类型中,餐饮和子女教育占大头。
2.变化瀑布图变化瀑布图可以清晰地反映某项数据经过一系列增减变化后,最终成为另一项数据的过程。
例如,从营业额扣除各种费用、成本、税费等变成纯利润的过程,又如某个项目经费扣减各方面支出得出余额的过程,或者从年初预算,经过半年度、到年底的预算消耗使用情况,使用瀑布图均可以直观呈现数据变化的细节,方便及时调整和管控成本。
最基础的是起点加终点的2阶瀑布图,对于周期比较长的项目,可以在中间的里程碑,再细分成更多阶的瀑布图,例如年初、年中及年末。
举个栗子,公司的发薪日是上班族最期待的时候了,虽然说多数时候发多少钱也不太会有太多惊喜或意外,但还是会想去看看钱到底是怎么发的。
实发工资等于基本工资+各种绩效奖金-五险一金-各种扣款。按照基本工资、应发工资、实发工资三个阶段,看哪些是主要增项,哪些是重点减项,一目了然。
3.堆叠瀑布图变化瀑布图的基础上增加子项在细分维度上的分布及变化趋势。例如,年初预算1000万,年中600万,年末剩余200W,第一个层级是1-12月各个月份的预算使用,同时,需要查看每个月份,各个成本项目(人力、服务器、采购等)的构成情况,此时就可以使用堆叠瀑布图来呈现。
三、瀑布图的数据格式要求
1.利用Excel绘制瀑布图Excel2016及以上的版本自带瀑布图的功能,不管是结构瀑布图还是变化瀑布图都可以非常快速的配置出来。
第一步按照瀑布图的数据格式要求,将数据整理准备好,插入瀑布图后,即可得到一个基础的图表。
其次是,对瀑布图进行优化调整,例如设定汇总后,增加或减少时的系列颜色。在需要汇总的柱子上单击两次,即可调出瀑布图配置参数。
2.自助式BI分析设计时的参数要求自助BI产品是让业务人员基于数据集,灵活的选择维度、度量字段,进行可视化分析。结构瀑布图支持1个维度、1个指标,或者0个维度多个指标,相比较Excel个性化的数据处理的方便性,数据集模型的数据则是通用的字段结构,例如选择了某一个维度,SQL拼接的逻辑是按照该字段进行Groupby操作,因此需要在可视化展示时,还需做汇总行的计算处理,另外,需要对维度枚举值的数量、图表展示样式等参数进行设置。
变化瀑布图支持1个维度、1个指标,或者0个维度多个指标,除了基础的维度度量过滤条件选择外,还需要选择按照哪一个子维度进行细分,例如,以年度作为汇总值,再按照地区进行细分,查看两个年度之间,各个地区的变化情况。
图片来源:火山引擎官方帮助文档
四、瀑布图制作的其他建议
由于瀑布图会同时包括汇总值和各个子维度的变化值,经常会出现汇总值量级过大,但子维度量级非常小的情况,会出现量级小的维度值区分度过低的问题,所以在图表处理时,可以采用截断的方式。示例如下:
五、总结
结合业务分析场景以及数据格式,选择最准确表达数据信息的可视化图表类型,才能把可视化做到恰到好处。
专栏作家
数据干饭人,微信号公众号:数据干饭人,人人都是产品经理专栏作家。专注数据中台产品领域,覆盖开发套件,数据资产与数据治理,BI与数据可视化,精准营销平台等数据产品。擅长大数据解决方案规划与产品方案设计。
本文原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
随便看看:
相关推荐:
网友评论:
推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件