首页 > 新闻 > 专家观点 >

天睿:数据分析的艺术

2015-05-26 09:26:48   作者:   来源:CTI论坛   评论:0  点击:


  摘要:数据不再是死板的表格或是长条、圆饼图,大数据多维度的特性需要用更多元的呈现方式,不仅更容易直觉地检视数据隐藏的现象,数据视觉化把信息变成了一道可用眼睛来探索的风景线,一种信息地图。一起探索数据可视化的艺术魅力吧。

  最近在Teradata的大数据峰会上看到一组画,是由多个可视化数据组成的各种图案,什么是可视化数据?

  可视化数据,是通过对海量的复杂数据进行分析,并以非常直观的视觉手段进行表达。数据可视化的主要目的是通过图形化手段进行清晰,有效的信息传递。

  那可视化数据都体现在哪些应用领域?

  领域很多,涉及金融、网络安全、医药、基因科学、轨道交通、社会问题、等多个行业…

  数据的艺术:

  本次"数据分析的艺术"展览,使用了20个精妙绝伦的分析洞察,将它们用艺术的形式展现,并附有关于该洞察及其分析师或艺术家的信息供您查阅。通过这种艺术展览的形式,人们可以用一种全新的方式与分析技术互动。 这些令人惊奇的图画同时也是美丽的艺术作品, 人们被它吸引、进一步探索它们的真正含义及背后的洞察。

  分析的创造性:

  那些在分析方法上取得的重大突破能够帮助我们形成竞争优势、研发新产品、改善流程并促进社会经济结构的优化,而它们是艺术和数据科学进步的共同成果。

  这些重大突破的取得需要以科学和事实为支撑的创造力。正是那些依靠直觉感知到的联系、充满想象力的洞察和富有激情的讨论使伟大的数据科学转化成了绝妙的成果。

  全球多元化

  大数据技术现在已经变得国际化,覆盖了新兴市场和发展中市场。从新西兰到加利福尼亚和中国、穿过东南亚国家再到印度、继续跨越西欧来到苏格兰,本次展览中参展的艺术家和展出的洞察遍布世界各地。

  下面就为大家介绍一组在Teradata大数据峰会上展示的可视化数据组图。

  欺诈入侵者

  这幅画的名称为欺诈入侵者,此分析是一种检测潜在保险索赔诈骗的快速方法。可疑的索赔就像外星人侵略一个星球,或虫子细菌感染一个纯细胞。

  骗子通常会在索赔细节中留下微小的数据痕迹。呼叫中心指出的像一个共同的地址、电话号码、电子邮件、银行账户、注册信息、医生或律师等。这个数据可视化显示了所有正当保险索赔和欺诈保险索赔之间的联系。图像中每个点(或节点)代表一个单个的保险索赔,因此整个圈就代表每个索赔。大的节点是那些已经过调查并被发现是欺诈的索赔。较小的节点是正当索赔和那些没有被调查过的索赔,因此它们可真可假。节点间的线(或边界)显示出各索赔之间的联系。它可能是重复使用同样的电话号码、地址、银行账号信息、电子邮箱地址和注册信息等。节点间的线越粗,意味着节点之间联系越紧密,像电子邮箱、地址和电话等信息重复越多,进而索赔则越可疑。从分析中我们现在可以很容易的找出潜在的索赔诈骗。

  风暴之眼

  而这一张可视化图表则记录了英国前首相玛格丽特·撒切尔夫人离世时的"推特风暴"。 拥护者与反对者在Twitter上发表正反言论的状况。图中每个点都是Twitter的一个用户,凡是提及或是转推的行为,便会在点与点间产生连线,图的中心则是柴契尔夫人,很明显的这个图分出了上下两群立场不同的人。而这个图的前身始于另一个在Twitter上的大事件,一个数位媒体IAC通讯部的全球主管Justine Sacco,在搭上前往非洲的飞机之前,发了一篇带有种族歧视的短文给他的朋友,在她下飞机后,发现这篇短文在全球被疯狂转载并加以谴责,而Justine Sacco原本幸福的人生就这么被摧毁了,此为有名的推特风暴事件由来。而风暴之眼就是由推特风暴发想而来。

  Stars and Stripes

  我们把在美国执行的临床药物试验收集到的结果资料视觉化成图表。药物试验通常非常复杂且牵涉了在长时间累积的资料。

  图表上的四个星星呈现出同一个药物试验资料利用不同视觉化方式所得的结果。每五个形成星星的点都表示一种药物或药物变种在试验中施用在队伍中每个病人。在中间的点代表病人体验到的一种不希望有的副作用。不同药物及副作用间的连结用线条来表示。
 

分享到: 收藏

专题