正确答案:B
正确答案:B
试卷总分:100 得分:100
一、单选题 (共 5 道试题,共 25 分)
1.( )是后续的数据转化、模型计算的必要前提。
A.变量大小
B.变量转换
C.变量类别
D.变量类型
正确答案:A
2.如果同为无偏估计的两个统计量,一个比另外一个的估计量的方差小,就可以将方差( )的估计量称为有效估计量。
A.大
B.小
C.相同
D.随机
正确答案:D
3.根据数据分析的目的,需要确定每一行都是( )的实体。
A.异质
B.同质
C.随意
D.有结构
正确答案:B
4.交叉变量规则除了包括名称外,还包括( )。
A.表达式
B.函数
C.公式
D.代数式
正确答案:C
5.在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。
A.正态分布
B.卡方分布
C.t分布
D.F分布
正确答案:D
东财22秋《数据分析与决策》单元作业一[答案]多选题答案
正确答案:C
二、多选题 (共 5 道试题,共 25 分)
6.一般来讲,统计量的标准有( )。
正确答案:C
A.无偏性
B.有偏性
C.一致性
D.有效性
正确答案:B
7.下列关于决策表的说法错误的有( )。
A.决策表是指尝试从模型训练中发现一些规则
B.决策树和决策表是完全不相同的,也完全不相似
C.决策表的规则和记录是一一对应的
D.决策表按照规则的顺序来决定规则的优先级
正确答案:B
8.下列关于差异的说法正确的有( )。
A.偶然因素引起的差异往往是比较显著的
B.差异的绝对值大于给定的标准的概率分布区间称为拒绝区间
正确答案:C
C.事件属于接受区间则判断总体无显著差异
D.事件属于拒绝区间,则认为总体有显著差异
正确答案:C
9.假设检验的步骤是( )。
A.提出假设
B.规定显著性水平
C.构造检验统计量
D.做出拒绝或接受零建设的决策
正确答案:B
10.神经元网络的拓扑结构可以分为( )。
A.前向型
B.反馈型
C.自组织竞争型
D.随机型网络
正确答案:A
三、判断题 (共 10 道试题,共 50 分)
11.常用的数据调整方法有最大/最小转换和Z得分转换。( )
12.最近相邻算法中的邻居的远近是按照距离函数计算的。( )
13.卡方分布是通用的变量间是相互关联的统计模型。( )
14.一般来说,如果样本容量越大,估计量会更接近总体参数。( )
15.在数据挖掘中的一个预测算法中,输入数据太少,会大大影响数据挖掘的准确度。( )
16.在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )
17.对于每次抽样,所决定的统计量取值和总体参数的误差只能是正的。( )
21.构建贝叶斯网络过程需要经过构建有向无环图和计算图中有向边的条件概率表两个步骤。( )
19.数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
20.最大间隔分类器是通过计算空间的离散点距超平面的距离,找到一个合适的超平面。( )
东财22秋《数据分析与决策》单元作业一[答案]历年参考题目如下:
东财《数据分析与决策》单元作业一
试卷总分:100 得分:100
一、单选题 (共 5 道试题,共 25 分)
1.( )是后续的数据转化、模型计算的必要前提。
A.变量大小
B.变量转换
C.变量类别
D.变量类型
2.根据数据分析的目的,需要确定每一行都是( )的实体。
A.异质
B.同质
C.随意
D.有结构
3.下列关于回归分析说法不正确的是( )。
A.回归分析试图找出变量间确定的函数关系
B.回归分析是用函数关系描述变量间关系的
C.相关关系和回归分析不可以相互转化
D.回归分析在数据挖掘中被广泛应用,可作为预测的方法
4.在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。
A.正态分布
B.卡方分布
C.t分布
D.F分布
5.业务分析应该为明确的( )服务。
A.企业目标
B.计划
C.组织目标
D.战略目标
二、多选题 (共 5 道试题,共 25 分)
6.下列关于决策表的说法错误的有( )。
A.决策表是指尝试从模型训练中发现一些规则
B.决策树和决策表是完全不相同的,也完全不相似
C.决策表的规则和记录是一一对应的
D.决策表按照规则的顺序来决定规则的优先级
7.贝叶斯网络的价值主要有( )。
A.分类
B.预测
C.帮助了解因果关系
D.有效避免数据过度拟合
8.下列关于差异的说法正确的有( )。
A.偶然因素引起的差异往往是比较显著的
B.差异的绝对值大于给定的标准的概率分布区间称为拒绝区间
C.事件属于接受区间则判断总体无显著差异
D.事件属于拒绝区间,则认为总体有显著差异
9.下列关于支持向量机的理论正确的是( )。
A.支持向量机的理论基础就是统计学习理论。
B.根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成
C.支持向量机在解决大样本、非线性机高维模式识别问题中表现出许多特有的优势
D.线性分类器是支持向量机的基础
10.数据挖掘是从大量数据中寻找其规律的技术,是( )的综合。
A.统计学
B.计算机网络技术
C.数据库技术
D.人工智能技术
三、判断题 (共 10 道试题,共 50 分)
11.最近相邻算法中的邻居的远近是按照距离函数计算的。( )
12.一般来讲,训练集要包含所有可能的分类,这些分类的数目没有任何要求。( )
13.一般来说,如果样本容量越大,估计量会更接近总体参数。( )
14.业务分析主要特征是利用各种统计分析、优化等工具实现决策职能化。( )
15.数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构。( )
16.在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )
17.数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
21.数据可视化技术可以将所有数据的特性通过表的方式展示出来。( )
19.方差分析主要探讨给定量的变量与给定因素之间的关系。( )
20.截尾均值的好处就是能减少极端值的影响,较平均值更能反映实际情况。( )
东财22秋《数据分析与决策》单元作业一[答案]相关练习题:
唐宫仕女图并不是一幅画作,它是几幅作品的系列统称,包括( )以及晚唐的《宫乐图》。
权力是根据组织的规范而具有正当性,因此是与组织的正式角色密切相关的概念
大工19春《复变函数与积分变换》在线作业1-0001
计算机中,运算器的主要功能是完成:
幼儿期第一反抗期的到来在6岁左右。()
《说文解字》首创部首编字法,按所收字的字形,分为( )部。
MIS是DSS的一种逻辑推广,在模型化与决策制定过程中起到辅助作用。
马克思劳动价值论揭示了商品经济的一般规律,为社会主义市场经济发展提供了理论指导。
“三定”制度具有阶段性,不是一成不变的“三定”下去
选择变压器容量和台数时,对于3类用电负荷,宜选单台变压器,变压器运行时的负荷率应在70%左右。
自恃过高比自视过低更容易造成人际关系的紧张。
一人公司:也叫独资公司、独股公司,系指仅有一个股东持有公司全部出资的有限公司或仅有一个股东持有全部股份的股份有限公司()。
下列属于行政法调整对象的是( )
春秋战国时代( )家不在四大显学之列
随机变量X表示某种电子元件的使用寿命,则一般认为X服从()。
在定量分析中,精密度与准确度之间的关系是()
以下哪些属于黄酮类化合物的生物活性( )
如果生产者要求严格控制产品的零售价格或产品的新鲜程度,宜采用( )。
对于下列的两个剪应力计算公式:①τ=T/2πR2t 和 ②τ=Tρ/IP,下列结论中是正确的是()。
下列不属于友爱同学的一项是()
应缴预算款是指行政单位按规定代收的应上缴财政专户的预算外资金收入。
分是手段,合是目的。运用分中求合要注意:不能抱着害人的心态,但是也不能一点都不提防。()