东财21秋《数据挖掘概论》单元作业三[答案]

作者:奥鹏作业答案 字体:[增加减小] 来源:东财在线 时间:2021-11-27 07:27

东财《数据挖掘概论》单元作业三 试卷总分:100 得分:100 一、单选题 (共 10 道试题,共 50 分) 1.线性回归通常通过( )方法进行参数估计。 A.最小二乘法 B.牛顿法 C.聚类 D.拉格朗日法 2.简单地将数

东财21秋《数据挖掘概论》单元作业三[答案]

东财21秋《数据挖掘概论》单元作业三[答案]答案

东财《数据挖掘概论》单元作业三

试卷总分:100 得分:100

一、单选题 (共 10 道试题,共 50 分)

1.线性回归通常通过( )方法进行参数估计。

A.最小二乘法

B.牛顿法

C.聚类

D.拉格朗日法

正确答案:-----

2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。

A.层次聚类

B.划分聚类

C.非互斥聚类

D.模糊聚类

正确答案:-----

3.ID3、C4.5和CART都采用的是( )方法。

正确答案:-----

A.贪心

B.回溯

C.动态规划

D.递归

正确答案:-----

4.表示簇内距离与簇间距离之比的指标为( )。

A.DBI指数

正确答案:-----

B.Jaccard系数

正确答案:-----

C.rand指数

正确答案:-----

D.轮廓系数

正确答案:-----

5.存在噪声和离群点时,( )是更鲁棒的划分聚类方法。

A.k-中心点方法

B.AGNES

C.k-均值方法

D.BIRCH

正确答案:-----

6.在决策树中,树的最顶层结点是( )。

A.内部结点

B.树叶结点

C.分支

D.根结点

正确答案:-----

7.垃圾邮件检测通常通过( )方法实现。

A.线性回归

B.岭回归

C.Lasso

D.逻辑回归

正确答案:-----

8.对于有n个数据点的数据集,经验上通常设置簇数为( )。

A.√(2n)

正确答案:-----

B.√n

正确答案:-----

C.√2

正确答案:-----

D.√(n/2)

正确答案:-----

9.在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。

A.曼哈顿距离

B.平方欧几里德距离

C.余弦距离

D.Bregman散度

正确答案:-----

10.事件的优势比(odds)的取值范围是( )。

正确答案:-----

A.(0,+∞)

B.(0,1)

C.(-∞,+∞)

D.(-1,1)

正确答案:-----

东财21秋《数据挖掘概论》单元作业三[答案]多选题答案

二、多选题 (共 5 道试题,共 25 分)

11.( )可能成为k-均值的终止条件。

A.对固定数量的迭代

B.在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化

C.在连续迭代中质心不发生变化

D.RRS下降到阈值以下

正确答案:-----

12.以下属于分类器评价或比较尺度的有( )。

A.预测准确度

B.召回率

C.模型描述的简洁度

D.计算复杂度

正确答案:-----

13.k-均值聚类分析在( )情况下无法得出好的结果。

A.具有异常值的数据点

B.具有不同密度的数据点

C.具有非凹形的数据点

D.具有非环形的数据点

正确答案:-----

14.具有相同的时间复杂度的聚类算法有( )。

A.BIRCH

B.k-均值

C.DBSCAN

正确答案:-----

D.OPTICS

正确答案:-----

15.回归方法主要分为( )。

A.线性回归

B.非线性回归

C.岭回归

D.Lasso

正确答案:-----

三、判断题 (共 5 道试题,共 25 分)

16.分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )

17.精准率是分类器正确分类的检验元组所占的百分比。( )

21.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。( )

19.在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )

正确答案:-----

20.轮廓系数的数值越小说明模型的聚类效果越好。( )

东财21秋《数据挖掘概论》单元作业三[答案]历年参考题目如下:

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)

Baidu
map