南开22秋学期《大数据导论》在线作业[答案]

作者:奥鹏作业答案 字体:[增加 减小] 来源:南开在线 时间:2022-11-08 11:35

22秋学期(高起本1709-2103、全层次2109-2103)《大数据导论》在线作业-00003 试卷总分:100 得分:100 一、单选题 (共 15 道试题,共 30 分) 1.PaaS是()的简称 A.软件即服务 B.平台即服务 C.基础设施即服务 D.硬

南开22秋学期《大数据导论》在线作业[答案]

南开22秋学期大数据导论在线作业[答案]

正确答案:B

22秋学期(高起本1709-2103、全层次2109-2103)《大数据导论在线作业-00003

正确答案:B

试卷总分:100  得分:100

一、单选题 (共 15 道试题,共 30 分)

1.PaaS是()的简称

A.软件即服务

B.平台即服务

C.基础设施即服务

D.硬件即服务

正确答案:C

 

2.GFS中的文件切分成()的块进行存储

A.32MB

B.64MB

C.128MB

D.1G

正确答案:D

 

3.DAS代表的意思是()

正确答案:C

A.两个异步存储

B.数据归档软件

C.连接一个可选的存储

D.直连存储

正确答案:D

 

4.()是Microsoft Office的核心组件

A.SQL

B.WORD

C.PPT

正确答案:D

D.EXCEL

正确答案:C

 

5.大数据的最显著特征是() 。

A.数据规模大

B.数据类型多样

C.数据处理速度快

D.数据价值密度高

正确答案:B

 

6.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()

A.ggplot2

B.network

C.ggmaps

D.animation

正确答案:A

正确答案:B

 

7.医疗健康数据的基本情况不包括以下哪项?

A.诊疗数据

B.个人健康管理数据

C.公共安全数据

D.健康档案数据

正确答案:D

 

8.基础设施即服务的英文简称是

A.IaaS

B.PaaS

C.SaaS

 

9.数据清洗的方法不包括

A.缺失值处理

B.噪声数据清除

C.一致性检查

D.重复数据记录处理

正确答案:C

 

10.以下不是数据仓库基本特征的是()

A.数据仓库是面向主题的

B.数据仓库是面向事务的

C.数据仓库的数据是相对稳定的

D.数据仓库的数据是反映历史变化的

正确答案:A

 

11.下列哪个工具常用来开发移动友好地交互地图()

A.Leaflet

B.Visual.ly

C.BPizza Pie Charts

D.Gephi

正确答案:A

 

12.SAN是一种()

A.存储设备

B.专为数据存储而设计构建的网络

C.光纤交换机

D.HBA

正确答案:D

 

13.大数据的特点不包含

A.数据体量大

B.价值密度高

C.处理速度快

D.数据不统一

正确答案:C

 

14.下列哪个R语言扩展包可以创建带有点和边的网络图()

A.ggplot2

B.network

C.ggmaps

D.animation

 

15.用于描述相等时间间隔下连续数据随时间变化趋势的是()

A.折线图

B.散点图

C.条形图

D.饼图

正确答案:D

 

南开22秋学期《大数据导论》在线作业[答案]多选题答案

正确答案:D

二、多选题 (共 15 道试题,共 30 分)

16.大数据在医疗中的应用有()

A.流行性疾病预防

B.慢性病健康管理

C.临床决策支持

D.医疗器械研发

正确答案:B

 

17.常见的非结构化数据有()

A.web网页

B.即时消息

C.富文本文档

D.实时多媒体数据

正确答案:B

 

21.交通数据处理包括以下几个步骤()

A.数据清洗

B.数据映射

C.数据组织

D.数据聚类

正确答案:D

 

19.大数据采集主要包括()四种。

A.系统日志采集

B.网络数据采集

C.数据库采集

D.其他数据采集

正确答案:D

 

20.数据归约(Data Reduction)主要有()

正确答案:B

A.维度规约

B.样本规约

C.数据聚集

D.离散化概念分层

正确答案:A

 

21.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。

A.网络爬虫

B.网站公开API

C.手动获取

 

22.常见的分类方法有

A.决策树

B.贝叶斯网络

C.遗传算法

D.FP算法

正确答案:A

 

23.层次方法可以分为()

A.K均值算法

B.K中心点算法

C.凝聚法

D.分裂法

正确答案:B

 

24.下列正确的是()

A.D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用

正确答案:C

B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行

正确答案:B

C.D3采用的是Selectors API的第一级标准

正确答案:A

D.基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。

正确答案:C

 

25.云计算的特点是()

A.大规模

B.高扩展性

C.虚拟化

D.按需分配

正确答案:C

 

26.数据变换的常用方法有##,##,##,##

A.中心化变换

B.极差规格化变换

C.标准化变换

D.对数变换

正确答案:B

 

27.大数据在教育中的应用

A.网上公开课

B.慕课

C.智慧校园

D.翻转课堂

正确答案:D

 

28.关于R语言扩展包下列正确的是()

A.network可创建带有点和边的网络图

B.animation可制作一系列的图像并将它们串联起来做成动画

C.ggmaps通过树图来可视化层次型数据

D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具

正确答案:A

 

29.数据处理的两种方法是##,##

A.批处理

B.流处理

C.单个处理

D.交叉处理

正确答案:B

 

30.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()

正确答案:B

A.多态性

B.时效性

C.不完整性

D.冗余性

正确答案:C

 

三、判断题 (共 20 道试题,共 40 分)

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)

Baidu
map