数据可视化报告

  • 格式:doc
  • 大小:4.14 MB
  • 文档页数:20

下载文档原格式

  / 20
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2018年6 月7 日

目录

一、题目 (1)

二、数据 (1)

三、可视化工具(哪一种,选择原因) (1)

四、可视化方案或可视化实现过程 (2)

1、导入数据并进行规范化 (2)

2、数据连接与整理 (2)

3、将地理信息与地图进行结合 (3)

4、设置相关参数 (3)

5、可视化方案 (3)

五、可视化结果 (4)

1、交战阵营可视化 (4)

2、人口统计可视化 (7)

3、死亡人数可视化 (9)

4、时间顺序可视化 (11)

5、人口损失情况可视化 (14)

六、体会 (16)

一、题目

在的可视化课程结束的同时中,本人也开始了数据可视化的大作业的工作。大作业是对前面学过的数据可视化技术的一个总结、回顾和实践。在开始设计前,本人回顾以前所学的内容,明确了本次作业设计所要用到的技术点,成功完成了可视化期末大作业。

大作业要求从网络上下载一组数据(自行获取),选择一种可视化工具(Excel、Tableau、Matlab、Echarts等),设计一种可视化方案实现该数据的可视化,并做适当的数据分析(或挖掘)。

二、数据

本次实验中,我设计的是关于第二次世界大战的数据可视化。原数据为两张表,分别存储了各个国家的人口牺牲情况与各个国家相互之间的战争具体时间、阵营、以及事件。

其中国家数据来源于维基百科中World War II casualties词条下的表格,具体网址为:https:///wiki/World_War_II_casualties#cite_note-187。

而关于时间、阵营与事件的数据来源于维基百科的World War II词条下方的信息,具体网址为:https:///wiki/World_War_II。

两张表之间都以excel形式存在,在导入Tableau数据库的时候,建立两表的关系并对表进行说明。本人在建立过程前引入了一些编号变量,可以进行无视。下面是部分数据截图,具体数据见随文档上交的excel文件。

三、可视化工具(哪一种,选择原因)

在这次的作业中本人选择的可视化工具为Tableau,选择该工具主要有以下原

因:

1、快速创建交互式绘图。使用Tableau的拖拽式界面,可以在几分钟内创建许多漂亮的可视化。这个界面可以操作无穷尽的变化,可以轻松解决项目。

2、交互式仪表盘。得到结果后可以简单的与结果进行交互,得到更加直观的结果。

3、实时的连接,在对原数据进行修改后,简单的刷新数据库就可以对全部的可视化结果进行修改。

4、提供多种的可视化方法,不仅限于Excel的简单图,Tableau可以容易的与地图进行连接,构建更加直观的图像。也可以直接选择不同的可视化方法,观察其中的优劣。

5、Tableau简单易学,可以快速掌握,简单的得出还算漂亮的图像。

四、可视化方案或可视化实现过程

1、导入数据并进行规范化

选择导入excel文件,然后整理文件的格式,让系统可以正常识别。

2、数据连接与整理

把excel表中的表和详细描述进行连接,然后清除掉多余或者无用的项,整理后的数据见下图:

图4-1:交战情况表

图4-2:国家状况表

3、将地理信息与地图进行结合

把地理信息同具体的地图进行结合,在地图上解释原来数据中的地理信息。

4、设置相关参数

设置相关的参数,通过参数来确认相关的阈值,以及形成数据桶,更好的进行分类操作。

5、可视化方案

1)对交战国战前、战时、战后的情况进行可视化,使用颜色区别阵营。

2)对交战国的人口与人口死亡率进行可视化,同时用不同的颜色标识死亡率大小。

3)对交战国具体的死亡人数进行可视化,用颜色深浅标识人数多寡。

4)对交战国总人口死亡情况进行可视化,设置阈值识别牺牲多寡,同时使用不同颜色标示不同阵营与状态的牺牲人数。

5)对交战国具体事件与开战事件进行可视化,要求可以清楚的分辨开战时间的长短与具体事件的先后。

6)对以上可视化内容,要求可以突出显示每一个交战国的具体情况。也可以根据阵营或其他分类方法进行突出显示。

五、可视化结果

1、交战阵营可视化

使用了地图的模式,把每一个国家与对应的版图进行连接,其中比较麻烦的是有部分国家政治环境发生了一些变化,导致国家的消失(如苏联、英联邦和南斯拉夫)因此要使用其他的方法重现。下面是本人的阵营图界面:

下面是具体的操作演示与分析:

战前,1939年前的世界秩序,可以看到,一战中利益受损国从一战中走出,开始积极向周围小国开战,各大利益集团利益开始冲突。

在欧洲,爆发了意识形态冲突,一战中失去了领土的战败国积极的对外扩张,法西斯注意在战败国中间传播。十月革命后成立的苏联也积极对外进行意思形态的输出,同时希望夺取原来属于沙皇俄国的遗产。西班牙意识形态斗争异常剧烈,从而爆发了内战。

非洲,意大利积极对外扩张,希望一雪二十年前惨败与埃塞俄比亚的耻辱,而亚洲大部分利益都掌握在欧洲国家手中,对此不满的日本企图夺取东亚的利益,一场大战一触即发。

战时,1939年到1943年的世界秩序,可以看到,轴心国势力达到顶峰,世

界笼罩在黑暗之中,同时中立的美洲国家加入了世界大战。

欧洲大陆几乎被法西斯占据,只有苏联仍然坚持,西班牙内战中右翼政府上台,欧洲形势到了最危急的时候。然而苏联力挽狂澜,在1943年完成了攻守互换。

日本在东亚如入无人之境,横扫东南亚的英美荷殖民地,剑锋直至印度。然而日本低估了美国的工业能力,最后丧失了制海权。于此同时中国也加入了同盟国,正式加入了第二次世界大战。

战后,1945年以后的世界秩序,可以看到轴心国势力完全磨平,剩余两大阵营瓜分了轴心的势力范围,并且在东亚开始了新一轮的意识形态竞争。同时因为