正确答案:-----
22春《大数据技术与应用》作业4题目
正确答案:-----
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 60 分)
1.用训练好的随机森林对样本进行类别预测的语句是
A.from sklearn.tree import DecisionTreetClassifier
正确答案:-----
B.clf=DecisionTreetClassifier()
正确答案:-----
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
正确答案:-----
2.以下不是数据可视化工具库的是()
A.pandas
正确答案:-----
B.matplotlib
C.matlab
D.seaborn
正确答案:-----
3.数据集{1,2,3,5,7,8,9}的中位数是
A.3
B.5
C.7
D.4
正确答案:-----
正确答案:-----
正确答案:-----
4.下面代码能够提取模糊C均值聚类算法类簇中心特征的语句是
A.from fcmeans import FCM
B.fcm=FCM(n_clusters=4)
C.fcm.fit(X)
D.fcm_centers=fcm.cednters
正确答案:-----
5.局部异常因子(LOF)算法属于
A.基于统计的异常值检测方法
B.基于密度的异常检测方法
C.基于聚类的异常值检测
D.基于决策树的异常检测
正确答案:-----
6.逻辑回归中的“逻辑”是指
正确答案:-----
A.规则
B.Sigmoid函数
正确答案:-----
C.学者名字
D.以上都不对
正确答案:-----
正确答案:-----
正确答案:-----
正确答案:-----
正确答案:-----
7.数据集{1,2,2,2,3,4}的众数是
A.1
B.2
C.3
D.4
8.利用pandas处理数据缺失值时,用于发现缺失值的函数为
正确答案:-----
A.isnull
B.head
C.tail
正确答案:-----
D.info
正确答案:-----
9.利用pandas处理数据缺失值时,用于填充缺失值的函数为
正确答案:-----
A.isnull
B.head
C.fillna
正确答案:-----
D.dropna
正确答案:-----
10.关联规则最基础的元素是
A.项
B.项集
C.超项集
D.子项集
正确答案:-----
11.from sklearn.neighbors import KNeighborsClassifiernknn = KNeighborsClassifier(n_neighbors=3) n上面代码中可以看出,KNN分类器的k值设置为
A.1
B.2
C.3
D.4
12.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A.ID3
正确答案:-----
B.C4.5
C.CART
D.以上都不对
13.决策树生成过程的停止条件
A.当前结点包含的样本全属于同一类别,无需划分
B.当前属性集为空,或是所有样本在所有属性上取值相同,无法划分
C.当前结点包含的样本集合为空,不能划分
D.以上都不对
14.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
正确答案:-----
D.X_scores = clf.negative_outlier_factor_
正确答案:-----
15.处理缺失值的方法有删除和()
A.替换
B.复制
C.修改
D.屏蔽
正确答案:-----
北语22春《大数据技术与应用》作业4[答案]多选题答案
正确答案:-----
二、多选题 (共 5 道试题,共 20 分)
16.常用的分类方法包括
A.朴素贝叶斯分类器
B.决策树
C.KNN
D.以上都不对
17.定性数据包括
A.有序数据
B.无序数据
C.定类等级数据
D.定性等级数据
正确答案:-----
21.数据挖掘(Data Mining)则是知识发现(KDD)的核心部分,它指的是从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为
正确答案:-----
A.规则
B.概念
C.规律
D.模式
正确答案:-----
19.异常检测的难点
A.不能明确定义何为正常,何为异常,在某些领域正常和异常并没有明确的界限
B.数据本身存在噪声,致使噪声和异常难以区分
C.正常行为并不是一成不变,也会随着时间演化,如正常用户被盗号之后,进行一系列的非法操作
D.难以获取标记数据,没有数据,再好的算法也是无用
正确答案:-----
20.分箱法包括
A.等深分箱
B.众数分箱
C.等宽分箱
D.以上都不对
三、判断题 (共 5 道试题,共 20 分)
21.众数在一组数据中只有一个
22.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础
23.下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
北语22春《大数据技术与应用》作业4[答案]历年参考题目如下:
扬子职业技术学院是经安徽省人民政府批准、教育部备案,纳入国家统一招生计划、颁发国家承认学历的全日制普通高等院校、国家人社部、教育部“全国教育系统先进集体”、教育部“中国民办教育协会理事单位”、省重点项目安徽省大新专项目、安徽省教学成果特等奖。
芜湖扬子学院能专升本的有哪些专业?
芜湖扬子学院即安徽扬子职业技术学院,该校专科专业均能专升本,专科专业有工业机器人技术、电气自动化技术、机电一体化技术、应用电子技术、汽车制造与装配技术、汽车检测与维修技术、新能源汽车技术、汽车营销与服务、数控技术、机械装备制造技术、高速铁路客运乘务、旅游管理、空中乘务、计算机网络技术、计算机技术应用、物联网应用技术、大数据技术与应用、会计学、财务管理、电子商务、市场营销、物流管理、工程造价、幼儿发展与健康管理、学前教育、艺术设计、数字媒体艺术设计等。立即联系学业顾问>>
[奥鹏]北语22春《大数据技术与应用》作业4[答案]相关练习题:
1949年6月,毛泽东发表的系统论述中国共产党建国主张的著作是( )
对于电话访问中的拒绝回答现象,应对的方法包括()
2001年,甲国新政府上台后,推行ABC经济政策和外交政策,在国内外引起强烈反应。乙国议会通过议案,谴责甲国的政策,并要求乙国政府采取措施,支持甲国的和平反政府运动;同时乙国记者兰摩也撰写了措辞严厉的批评甲国政策的文章在丙国报纸上发表;甲国的邻国丁国暗自支持甲国的反政府武装的活动。根据上述情况和 国际法的相关原则,下列哪一选项是正确的?
波士顿矩阵是解决( )的方法。
真理和谬误的根本区别在于真理是对事物的对反映,谬误是对事物的歪曲反映。
无限半群若满足消去律则一定是群。
信任可以提高一个人的影响力,因为一个值得信赖的人总是更受欢迎,并因此收获成功。
目前习惯采用可靠指标代替失效概率来度量结构的可靠性。
下列哪项不是失神的表现?( )
任何组织和团体,无论其规模大小,总会有领导者存在,以便于对内主持和领导整个群体,对外代表群体的全体。
公文的标题一般由哪些要素组成?( )
南唐词的成就比花间派更高,其代表作者有( )
家庭的金融决策受()影响。
计算机系统通过接口与外围设备通信。
药品标准的检查项下包括:纯度、外观、有效性、安全性和物理常数等内容