正确答案:B
22秋学期(高起本1709-2103、全层次2109-2103)《大数据导论》在线作业-00003
正确答案:B
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 30 分)
1.PaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:C
2.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
正确答案:D
3.DAS代表的意思是()
正确答案:C
A.两个异步存储
B.数据归档软件
C.连接一个可选的存储
D.直连存储
正确答案:D
4.()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
正确答案:D
D.EXCEL
正确答案:C
5.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确答案:B
6.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:A
正确答案:B
7.医疗健康数据的基本情况不包括以下哪项?
A.诊疗数据
B.个人健康管理数据
C.公共安全数据
D.健康档案数据
正确答案:D
8.基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
9.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
正确答案:C
10.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
正确答案:A
11.下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
正确答案:A
12.SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
正确答案:D
13.大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
正确答案:C
14.下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
15.用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
正确答案:D
正确答案:D
二、多选题 (共 15 道试题,共 30 分)16.大数据在医疗中的应用有()
A.流行性疾病预防
B.慢性病健康管理
C.临床决策支持
D.医疗器械研发
正确答案:B
17.常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
正确答案:B
21.交通数据处理包括以下几个步骤()
A.数据清洗
B.数据映射
C.数据组织
D.数据聚类
正确答案:D
19.大数据采集主要包括()四种。
A.系统日志采集
B.网络数据采集
C.数据库采集
D.其他数据采集
正确答案:D
20.数据归约(Data Reduction)主要有()
正确答案:B
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
正确答案:A
21.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A.网络爬虫
B.网站公开API
C.手动获取
22.常见的分类方法有
A.决策树
B.贝叶斯网络
C.遗传算法
D.FP算法
正确答案:A
23.层次方法可以分为()
A.K均值算法
B.K中心点算法
C.凝聚法
D.分裂法
正确答案:B
24.下列正确的是()
A.D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
正确答案:C
B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
正确答案:B
C.D3采用的是Selectors API的第一级标准
正确答案:A
D.基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案:C
25.云计算的特点是()
A.大规模
B.高扩展性
C.虚拟化
D.按需分配
正确答案:C
26.数据变换的常用方法有##,##,##,##
A.中心化变换
B.极差规格化变换
C.标准化变换
D.对数变换
正确答案:B
27.大数据在教育中的应用
A.网上公开课
B.慕课
C.智慧校园
D.翻转课堂
正确答案:D
28.关于R语言扩展包下列正确的是()
A.network可创建带有点和边的网络图
B.animation可制作一系列的图像并将它们串联起来做成动画
C.ggmaps通过树图来可视化层次型数据
D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案:A
29.数据处理的两种方法是##,##
A.批处理
B.流处理
C.单个处理
D.交叉处理
正确答案:B
30.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
正确答案:B
A.多态性
B.时效性
C.不完整性
D.冗余性
正确答案:C
三、判断题 (共 20 道试题,共 40 分)