注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
下列关于随机森林算法,说法正确的是( )。
【A.】建立决策树的过程中,需要注意采样和完全分裂两点;
【B.】建立决策树过程中需要两个随机采样,即行采样和列采样;
【C.】对于行采样,采样无放回的方式;
【D.】采用完全分裂的方式构建决策树,这样决策树的某个叶节点要么无法继续分裂,要么里面的所有样本都指向同一个分类。

随机森林算法建立决策树过程中,对于行采样,采样有放回的方式,也就是在采样得到的样本集合中,可能有重复的样本。
【A.】√
【B.】×

随机森林算法建立决策树过程中,对于行采样,采样无放回的方式。
【A.】√
【B.】×

随机森林的优势是( )。
【A.】能够处理高维度数据,并且不用做特征选择;
【B.】在训练过程中,能够检测到特征间的交互作用;
【C.】训练速度快;
【D.】容易做成并行化方法。

对于解决小样本、非线性及高维模式识别问题,( )表现出许多特有的优势。
【A.】支持向量机
【B.】最近邻分类
【C.】随机森林
【D.】线性判别

支持向量机算法中,超平面到所有两类数据点的距离之和称为分类器的边缘。
【A.】√
【B.】×

以寻找最大边缘超平面为目的,以及构建相应的分类决策函数来分类的算法是( )
【A.】决策树
【B.】线性判别分析
【C.】线性可分支持向量机
【D.】随机森林

构成随机森林的决策树越多,那么( )
【A.】随机森林的预测精度越高
【B.】随机森林的预测精度越低
【C.】随机森林的训练精度越低
【D.】随机森林的训练精度越高

常用的核函数有( )。
【A.】线性核
【B.】高斯核
【C.】神经网络核
【D.】多项式核

非线性支持向量机通过引进核函数解决线性不可分问题。
【A.】√
【B.】×

按照经济发展、教育水平、面积大小、人口等诸多方面对我国地市级以上城市进行分类。通常采用( )。
【A.】回归分析
【B.】分类
【C.】关联分析
【D.】聚类分析

当不知道哪些花是同一品种,哪些花不同品种时,考虑按照花瓣长宽与花萼长宽将不同品种的花分类。通常采用( )。
【A.】聚类分析
【B.】分类
【C.】回归分析
【D.】关联分析

不知道哪些客户有同样的购物习惯与特征等。考虑按照客户的个人资料、购物特征、购物习惯等将客户进行分类。通常采用( )。
【A.】回归分析
【B.】聚类分析
【C.】分类
【D.】关联分析

多元统计分析中的聚类分析方法可以对反映事物特征的指标或变量进行分类,记为( )。
【A.】S型分类
【B.】H型分类
【C.】Q型分类
【D.】R型分类

下列哪一项不属于聚类分析( )。
【A.】系统聚类
【B.】决策树
【C.】Kmeans
【D.】DBSCAN聚类