如何成为数据分析师系列(一):可视化图表初阶
副标题[/!--empirenews.page--]
简述 数据可视化-通过图表形式展现数据,帮助用户快速、准确理解信息。准确、快速是可视化的关键,好的可视化会“讲故事”,能向我们揭示数据背后的规律。对于可视化,有一个常见误区:分析师追求过于复杂的图表,反而使得业务人员难以理解。其实越简单的图表,越容易被理解,而快速易懂地理解数据,正是可视化最重要的目标。 大多数人对于基础的数据图表都有一定的认知,但却未必清楚,在哪一种场景使用何种图表,本文主要给大家介绍基础图表的特性,让大家知道在何种场景使用该类型图表。 图表的基本组成元素 一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色表达特定的信息。当然这些元素并不是必须具备的,当信息足够清晰时,你可以精简部分元素,使得图表更加简洁。 正确理解维度与指标 维度(Dimension)
度量/指标(Measure)
下面是4种常见、常用基础图表 1. 折线图“家族” 折线图的核心思想是 趋势变化。 作为信息最明了的图表,是各种图表中最容易解读的图表,以下是它的几种变种: 基础折线图
堆积面积图 面积大小对应该类别数值大小,反映不同类别占比关系及其时间趋势变化。以下图为例,你可看出AppStore和360下载量Top1、2的渠道。 缺点:由色块面积来表示数值大小有时候不直观。以下图为例,需仔细看图才能知道AppStore和360手机助手是有做过投放的 折线图小结
2. 柱形图“家族” 柱形图的核心思想是 对比 累加柱形图 适合少量类别的对比,且对比信息特别清晰 与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。 多指标柱形图 主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表 技巧:当各对比指标大小相差10倍甚至更大时,可采用标准化,如:对数值取自然对数,既能有效缩小指标量度差距,也能保留同指标的大小关系 条形图 当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度 条形图,必须按照数值大小降序排列,这是提升条形图阅读体验的重要手段 瀑布图 核心是按维度/指标下钻分解,如:公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解; 对比饼图的优势在于,拆解项较多时,瀑布图通过数字的标记仍可清洗辨别,而饼图在分解项>5时就不易辨别。 柱形图结合折线图 对比多个指标,尤其是对比指标与指标的增长率上非常适用,使得一个图表可以表现两个层次的信息。(当然要尽可能避免信息的重复。如下图,折线图含义如果换成团队签约数占公司总签约数比例,则意义不大) 使用双坐标轴,要表明清晰 直方图 当横坐标变成连续的分组,就可以制作直方图(与柱形图主要差别在于,直方图一般不同数据系列没有间距) 当组别划分无限细化,我们就可以绘制概率分布曲线或者称为密度曲线,最常见的就是正态分布,这里不举例。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |