×
支撑199IT开展可参加常识沟通群(4000+用户),最有价值数据同享和评论!
点击即可参加!
封闭

《经济学人》数据可视化修改:过错的图表,咱们也画了许多

经济学人杂志除了色彩显着的文章之外,其在数据可视化方面也自成一派。绝妙的色彩调配,风格显着的图表总能让读者过目不忘。

据图表修改修改Sarah Leo在一篇博客中介绍到:尽管关于每一张图表,他们都尽量精确地以最能支撑故事表达的方法来可视化数字,但有时分也会犯错。

为了能够做的更好,他们在从过错中不断总结经验,不断的自我改善。为此Sarah Leo还把经济学人的过错总结为3点,并写成一篇博客,供咱们参阅,大数据文摘对文章编译如下☟

深化了解咱们的记载后,我找到了几个有用的比方。我将针对数据可视化的问题分为三类:

  • 误导性图表
  • 含糊的图表
  • 未能阐明问题的图表

免责声明:大多数“原始”图表是在咱们的图表从头规划之前发布的。改善的图表是为了契合咱们的新标准而制作的。它们的数据彻底一致。

误导性的图表

以误导的方法出现数据是数据可视化中最严峻的问题,尽管咱们从不成心这样做,但它的确时不时发作。咱们来看看三个比方。

过错:切断标尺

这图就很左翼分子对不对

此图表显现了政治左翼Facebook页面上帖子的点赞均匀数量。这张图表的要点是显现Corbyn先生与其他帖子之间的差异。

原始图表不只轻视了Corbyn先生的数量,还夸张了其他帖子的数量。在从头规划的版别中,咱们完整地展现了Corbyn先生的数据并确保一切其他数据长条依然可见。

另一个奇怪的是色彩的挑选。为了仿照工党的配色计划,原图运用了三种橙色/赤色色调来差异Jeremy Corbyn与其他国会议员和政党。尽管色彩背面的逻辑对许多读者来说或许是清楚明了的,但关于那些不太了解英国政治的人来说,这或许没什么含义。

过错:通过成心操作坐标轴来伪装存在相相联络

可贵的完美相关?并不是的。

上面的图表附有一个关于狗分量下降的故事。乍一看,好像狗的体重和颈部巨细彻底相关。但这是真的吗?其实并不是很相关哦。

在原始图表中,两个坐标轴的跨度均为三个单位(左面是21到18;右边是45到42)。按百分比核算,左面的份额下降了14%而右边则下降了7%。在从头规划的图表中,我保存了双坐标轴的规划,但调整了它们的规模以反映可比较的份额改变。

考虑到这个图表的休闲主题,这个过错或许看起来并没有那么重要。究竟,图表的信息在两个版别中都是相同的。但咱们从中学到的作业很重要:假如两个变量过于严密相关,那么再仔细观察一下坐标轴标准或许是一个好主意。

过错:挑选过错的可视化方法

对脱欧的观点简直和商洽成果相同不稳定

咱们在每日新闻运用Espresso中发布了此投票图表。它显现了民众对欧盟公投成果的情绪,并以折线图制作。从数据来看,好像受访者对公投成果的观点适当不稳定——每周都会添加或减少几个百分点。

咱们并未运用滑润曲线制作单个民意调查来显现趋势,而是衔接每个民意调查的实践值。这首要是因为咱们的内部图表东西没有制作滑润线条的功用。咱们直到最近才逐步开端了解更杂乱的可视化计算软件(如R)。今天,咱们团队一切人都能够制作一个相似上面从头规划的投票图表了。

此图表中需求留意的另一件事是坐标轴怎么起点的方法。原始图表将数据扩展到悉数空间。而在从头规划的版别中,我在坐标轴开端的部位和最小数据点之间留下了更多空间。弗朗西斯·加农(Francis Gagnon)为此拟定了一个很好的规矩:咱们应当试着在一个不从零开端的折线图下留出至少33%的空白区域。

含糊的图表

这没有误导性图表那么过火,可是一份难以阅览的图表仍是标明可视化作业做得很糟糕。

过错:“发散性思想”过于发散了

…这啥玩意?

在“经济学人”杂志上,咱们被鼓舞发明“发散性思想”的新闻报道。可是有时分,咱们会以为这有点过分火了。上图显现了美国的产品贸易逆差和制作业工作人数。

该图表十分难以阅览。它有两个首要问题。首要,一个变量(贸易逆差)的值彻底是负数,而另一变量(制作业工作)都是正数。将这些差异结合在一个图表中而不平坦化任一变量十分不合理。有一个清楚明了的处理计划,但这却会导致第二个问题:两个变量不同享一同基线。贸易赤字的基线坐落图表的顶部(通过图表左半边那截红线杰出显现),而右半部分的基线则坐落底部。

从头规划的图表显现其实并没有必要组合这两个数据系列。贸易逆差与制作业工作之间的联络依然很显着,而这一图表并没有额定占有多少空间。

过错:不可思议的色彩运用

该图表将政府在养老金福利方面的开销与国家65岁以上人口份额进行了比较,并特别重视了巴西的状况。为了使图表占有较小版面,可视化东西仅标记了部分国家/区域,并以电蓝色杰出显现。经合安排的均匀值则以淡蓝色杰出显现。

可视化者疏忽了这样一个现实,即不同色彩一般意味着不同分类。乍一看,这个图表好像也是如此——一切电蓝色好像归于与深蓝色不同的组合。但其实压根不是这样的,差异仅仅一个有打上国家标签,一个没有罢了。

在从头规划的版别中,一切国家/区域的圆圈色彩坚持不变。我将没有标签的数据点的透明度调高了。剩余的就靠排版了:巴西是要点国家所以用字体加粗;而经合安排则用斜体字表明。

未能阐明问题的图表

最终一类的过错不太显着。像这样的图表不会误导读者,也不会让人感到困惑。他们仅仅没有证明他们存在的合理性 – 一般是因为可视化不合理,或许因为咱们非要在小版面内塞进过多信息。

过错:包含太多细节

“色彩越多越好!”——好的可视化才不会这样

这彩虹真漂亮!咱们在德国预算盈利的专栏中发布了这张图表。它显现了10个欧元区国家的预算余额和活期账户余额。

有这么多色彩,并且其间一些很难被差异。别的,因为对应的值太小了,压根没有方法得到任何图表信息。它只会让你眼前一愣然后赶忙转移视线。并且更重要的是,因为咱们没有制作一切欧元区国家,因而堆叠数据没有任何含义。

我回过头看看有没有方法简化这个图表。该专栏说到德国、希腊、荷兰、西班牙以及欧元区总数。在从头规划的图表版别中,我决议只着重这些。为了处理仅堆叠部分国家的问题,我添加了另一个类别(“其他”),其间包含一切其他欧元区国家。(因为欧盟计算局进行了数据修订,从头规划的图表中的活动账户余额总额低于原始图表。)

过错:很多数据,空间缺乏

我抛弃。

遭到有限版面空间的约束,咱们常常企图将一切数据一股脑儿塞进图表中。尽管这能够节约页面上的名贵空间,但它仍是会有负面影响。比方这张2017年三月的图表,它是关于科学界的论文宣布是怎么由男性主导的。一切数据点都相同风趣且与宗旨严密相关。可是,一会儿供给如此多的数据(四个研讨范畴类别以及宣布人的份额)这些信息很难一同被承受。

通过深思熟虑之后,我决议不从头规划这个图表。假如我要保存一切数据,那么图表就会变得过于杂乱而不简练。在这种状况下,减少一些内容会更好。或许,咱们能够展现某种均匀化的衡量标准,例如一切范畴的女人宣布著作的均匀份额。

感谢支撑199IT
咱们努力为我国互联网研讨和咨询及IT职业数据专业人员和决策者供给一个数据同享渠道。

要继续拜访咱们的网站,只需封闭您的广告拦截器并改写页面。
翻滚到顶部