[奥鹏]北语22春《大数据技术与应用》作业2[答案]

作者:奥鹏作业答案 字体:[增加 减小] 来源:北京语言大学 时间:2022-04-29 08:08

22春《大数据技术与应用》作业2题目 试卷总分:100 得分:100 一、单选题 (共 15 道试题,共 60 分) 1.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句 A.from sklean.neigh

[奥鹏]北语22春《大数据技术与应用》作业2[答案]

北语22春《大数据技术与应用》作业2[答案]答案

正确答案:-----

22春《大数据技术与应用》作业2题目

正确答案:-----

试卷总分:100  得分:100

一、单选题 (共 15 道试题,共 60 分)

1.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句

A.from sklean.neighbors import LocalOutlierFactor

B.clf=LocalOutlierFactor(n_neighbors=20)

C.y_pred=clf.fit_predict(X)

正确答案:-----

正确答案:-----

D.X_scores = clf.negative_outlier_factor_

正确答案:-----

 

2.利用pandas处理数据缺失值时,用于填充缺失值的函数为

正确答案:-----

A.isnull

B.head

C.fillna

正确答案:-----

D.dropna

正确答案:-----

 

3.决策树生成过程中,以信息增益作为特征选择准则生成决策树的算法是

A.ID3

正确答案:-----

B.C4.5

C.CART

D.以上都不对

正确答案:-----

正确答案:-----

正确答案:-----

正确答案:-----

正确答案:-----

正确答案:-----

 

4.决策树的生成是一个递归过程,在决策树基本算法中,满足哪种情形,会导致递归过程返回停止

A.特征选择次数超过一定限制

B.当前属性集为空,或所有样本在所有属性上取值相同

C.决策树深度超过2

D.以上都不对

 

5.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示

正确答案:-----

A.训练数据集

B.测试数据集

C.训练数据的类别标签数组

D.测试数据的类别标签数组

正确答案:-----

 

6.以下不属于大数据分析方法的是()

A.统计分析

B.数学模型

C.机器学习

D.人工智能

正确答案:-----

 

7.用训练好的孤立森林isolation forest实例对数据进行异常值检测的语句是

A.from sklean.ensemble import IsolationForest

B.LocalOutlierFactor

C.clf= IsolationForest(max_samples=100,random_state=0)

正确答案:-----

D.clf.fit(X_train)

正确答案:-----

E.y_pred=clf.fit_predict(X)

F.y_pred_test = clf.predict(X_test)

正确答案:-----

 

8.用训练好的模糊C均值聚类实例对数据进行聚类操作的语句是

A.from fcmeans import FCM

B.fcm=FCM(n_clusters=3)

C.fcm.fit(X)

D.fcm_labels=fcm.u.argmax(axis=1)

正确答案:-----

正确答案:-----

 

9.数据集{1,2,2,2,3,4}的众数是

A.1

B.2

C.3

D.4

正确答案:-----

 

10.不包含任何项的项集是指

A.项

B.空集

C.超项集

D.子项集

正确答案:-----

 

11.利用Sklearn构建KNN分类器,用于KNN分类器训练的程序为

A.knn.fit(X_train,y_train)

B.y_pred=knn.predict(X_test)

正确答案:-----

C.knn=KNeighborsClassifier(n_neighbors=k)

D.以上都不对

 

12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为

A.2

B.4

C.6

D.8

正确答案:-----

 

13.关联规则 X→Y 表示中X称为

A.前件

B.后件

C.中间件

D.以上都不对

 

14.从软件库中导入模糊C均值聚类算法类的语句是

A.from fcmeans import FCM

B.fcm=FCM(n_clusters=3)

C.fcm.fit(X)

D.fcm_labels=fcm.u.argmax(axis=1)

 

15.如果一个项集包含K个项,则该项集称为

A.项

B.空集

C.超项集

D.K项集

正确答案:-----

 

北语22春《大数据技术与应用》作业2[答案]多选题答案

正确答案:-----

二、多选题 (共 5 道试题,共 20 分)

16.数据集中趋势分析的常用指标包括

A.平均值

B.中位数

C.众数

D.四分位数

正确答案:-----

 

17.以下哪些是数据可视化图表

A.柱状图

B.折线图

C.饼图

D.散点图

正确答案:-----

 

21.分箱法包括

A.等深分箱

B.众数分箱

C.等宽分箱

D.以上都不对

 

19.在数据清洗过程中,用于处理噪声值的方法包括

A.盖帽法

B.分箱法

C.聚类法

D.以上都不对

 

20.定性数据包括

A.有序数据

B.无序数据

C.定类等级数据

D.定性等级数据

正确答案:-----

 

三、判断题 (共 5 道试题,共 20 分)

21.回归算法的目的是寻找决策边界

 

22.描述性数据分析属于比较高级复杂的数据分析手段

 

23.盖帽法是将某连续变量均值上下三倍标准差范围外的数值全部删除

正确答案:-----

 

24.定性数据包括离散数据和连续数据

 

25.等宽分箱方法是指每个分箱中样本数量一致

 

北语22春《大数据技术与应用》作业2[答案]历年参考题目如下:




佛山电大本科专业有:标准化工程、法学、文化产业管理、信息安全、计算机科学与技术、土木工程、经济与金融、电子商务、学前教育、社会工作、机器人工程、数据科学与大数据技术、机械电子工程、行政管理、汉语言文学。

佛山电大专科专业有:电子商务、市场营销、会计、公共事务管理、商务英语 、计算机应用技术、公共文化服务与管理、动漫设计、表演艺术、文秘、建设工程管理、物业管理、建筑室内设计、应用英语、会展策划与管理、法律事务、数字展示技术、机械制造与自动化、汽车检测与维修技术、智能终端技术与应用、大数据技术与应用、工商企业管理。点击立即咨询,快速获取名校本科学历>>

佛山开放大学是由佛山市政府举办的、以现代信息技术为支撑的、服务全民终身学习的新型高等学校。下辖南海、顺德、高明、三水四所区级开放大学。学校前身为佛山广播电视大学,创办于1979年。学校通过整合集成教育资源,利用现代信息技术,面向职工开展专科、专升本科学历继续教育。

获得成人本科学历可以通过网络教育,网络教育学校选择较多,且多数为211重点大学。这种形式主要是比较方便学习,比较适合工作繁忙没有固定时间来上课的学员。只要有网络,便可在任意地方进行远程学习。另外报名入学时间比较宽松,分为春季3月和秋季9月进行入学。

网络教育学校主要有电子科技大学、东北财经大学、东北大学、东北农业大学、东北师范大学、对外经济贸易大学、福建师范大学、吉林大学、江南大学、北京大学(医学)、北京交通大学、北京师范大学、北京外国语大学、北京邮电大学、北京语言大学、北京中医药大学、大连理工大学、兰州大学、 、四川大学、四川农业大学、 、西安交通大学、西北工业大学、西南大学、中国传媒大学、中国地质大学(北京)、中国石油大学(北京)、中国石油大学(华东)、 等。点击立即咨询,快速获取名校本科学历>>




[奥鹏]北语22春《大数据技术与应用》作业2[答案]相关练习题:
福师《计算机辅助设计1(PS)》在线作业一-0005

无限大功率电源可以定义为:外电路发生短路引起的功率改变,对于电源来说是微不足道,因而电源的电压和频率不变,内阻抗为(      )

下列有关弗洛伊德的人格结构理论说法不正确的是()。

自我知觉的成分有()

下列选项不属于公文材料的选择和使用原则的是( )

我国旅游企业因相同或相似的文化背景,更为熟悉本国旅游者的消费特征和行为偏好,而旅游者出于追求安全感和归属感,也会倾向于选择本国旅游企业。这些因素都构成了()。

若X与Y线性不相关,则cov(X,Y)=0。

大多数经济学家所接受的失业类型包括什么()

  西晋败亡的原因有()。

(2.5分) The teacher told them ________ make so much noise.

细度模数越大,表示砂越粗。

( )可以防范汇率风险。

在借贷记账法下,“本年利润”科目的增加额登记在( )。

实体组织应该具备的条件有( )。

如果不考虑其他限制条件,在下列对完全成本法与变动成本法下各期损益的比较中,属于结论正确的有()。

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)

Baidu
map