注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
不知道哪些学生有相同的某些特征。考虑按照学生的考试成绩、社会实践、思想品德等方面划分奖学金的等级。通常采用( )。
【A.】回归分析
【B.】分类
【C.】聚类分析
【D.】关联分析

多元统计分析中的聚类分析方法可以对样本进行分类,记为( )。
【A.】S型分类
【B.】H型分类
【C.】Q型分类
【D.】R型分类

多元统计分析中的聚类分析方法既可以对样本进行分类,记为R型分类,也可以对反映事物特征的指标或变量进行分类,记为Q型分类。
【A.】√
【B.】×

多元统计分析中的聚类分析方法既可以对样本进行分类,记为Q型分类,也可以对反映事物特征的指标或变量进行分类,记为R型分类。
【A.】√
【B.】×

Mahalanobis距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离

在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,通过计算两类重心之间的欧氏距离平方作为两类之间的距离的方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法

在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,取这些距离最小者作为两类的距离,该方法为( )。
【A.】重心法
【B.】离差平方和法
【C.】最短距离法
【D.】类平均法

在聚类过程中的类需要遵从的原则中,说明了每一个个体在同一次分类过程中只能分在一个类别当中的原则是( )。
【A.】同质性原则
【B.】互斥性原则
【C.】完备性原则
【D.】充分性原则

在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,取这些距离最大者作为两类的距离,该方法为( )。
【A.】重心法
【B.】离差平方和法
【C.】最长距离法
【D.】类平均法

首先考虑在没有进行聚类之前,所有参加聚类过程的个体没有归入任何类别,即对于每个个体而言,自成一类的方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类

在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,将公式作为两类的距离,按照最小距离原则吧类别之间距离最小的两类合并为一类,直至把所有样本归为一类,该方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法

Euclidean距离指的是:( )
【A.】明氏距离
【B.】车比雪夫距离
【C.】欧氏距离
【D.】马氏距离

下述谱系图使用的是类平均法,横轴表示类别之间的平均距离,纵轴为具体的每个样本。如在图中距离为1.75 处画一条竖线,该直线与谱系聚类图有2个交点,即可把所有样本分为两类。与第1个交点相连的样本是 ( ),它们形成第一类;而与第2个交点相连的样本是( ),它们形成另一类。

        【图片】







【A.】turtle、komodo、salamander、frog、penguin、eel;
salmon、leopard shark、whale、python、porcupine、bat、cat、human、pigeon
【B.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark;
whale、python、porcupine、bat、cat、human、pigeon
【C.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark、whale、python;
porcupine、bat、cat、human、pigeon
【D.】turtle、komodo、salamander、frog、penguin、eel、salmon、leopard shark、whale;
python、porcupine、bat、cat、human、pigeon

在聚类分析中,如果新类与其他类别之间存在多个点与点之间的距离,通过用不同类的样本点两两之间的平均距离作为类间距离的方法为( )。
【A.】中间距离法
【B.】离差平方和法
【C.】重心法
【D.】类平均法

下列关于类间距确定方法说法错误的是( )。
【A.】离差平方和法要求样本间距离可以采用欧式距离、马氏距离等;
【B.】重心法考虑了每一类中所包含的样本点数目;
【C.】类平均法充分利用各个样本的信息;
【D.】使用离差平方和作为类间距离时,如果聚类聚得恰当,类内样本点之间的离差平方和应该较小,类间离差平方和应该较大。