注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
聚类分析中,重心法没有考虑每一类中所包含的样本点数目。
【A.】√
【B.】×

系统聚类可以给出聚类过程,并且不用事先确定聚类个数。
【A.】√
【B.】×

请为名词选择①-④表示其含义的描述,将配好的A-D填写到括号中。设dij表示第i个样本与第j个样本之间的距离。
【A.】①绝对距离 -> ->
【B.】②切比雪夫距离 -> ->
【C.】③马氏距离 -> ->
【D.】④欧氏距离 -> ->

请为名词选择①-⑥表示其含义的描述,将配好的A-F填写到括号中。
【A.】①最小距离法 ->  ->
【B.】②最长距离法 -> ->
【C.】③中间距离法 -> ->
【D.】④重心法 -> ->
【E.】⑤类平均法 -> ->
【F.】⑥离差平方和法 -> ->

有些情况下,研究者对于研究的对象事先知道分为几类,即已知类别的个数,只是不知道这些类别当中的具体样本,该方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类

快速聚类中,要确定数据到底聚成几个类合适,我们可以设定K从1到K的变化,计算相应的( ),选择其最( )的类别个数。
【A.】SSE;大
【B.】SSE;小
【C.】SSR;大
【D.】SSR;小

快速聚类中,要确定数据到底聚成几个类合适,我们可以设定K从1到K的变化,计算相应的SSE,下图设定了K的取值为1,2,3,4,5,6。K选( )最为合适。
        【图片】

【A.】1
【B.】2
【C.】3
【D.】6

聚类分析中,快速聚类一般用于小样本情况下的样本聚类。
【A.】√
【B.】×

快速聚类要事先确定聚类个数,但是运算速度很快,适合少量数据的情况。
【A.】√
【B.】×

聚类分析中,快速聚类一般用于大样本情况下的样本聚类。
【A.】√
【B.】×

快速聚类要事先确定聚类个数,但是运算速度很快,适合大量数据的情况。
【A.】√
【B.】×

DBSCAN算法中的直接密度可达、密度可达与密度相连理解错误的是( )
【A.】只有核心对象之间相互密度可达
【B.】密度相连是对称关系
【C.】DBSCAN目的是找到密度相连对象的最大集合
【D.】密度可达也是对称关系

下列关于聚类方法说法正确的是( )
【A.】DBSCAN聚类可以用于数据分布不均匀,呈块状分布,并且聚集形态是任意形状的情况。
【B.】快速聚类要事先确定聚类个数,但是运算速度很快,适合少量数据的情况。
【C.】系统聚类可以给出聚类过程,但是要事先确定聚类个数。
【D.】聚类分析中,快速聚类一般用于小样本情况下的样本聚类

利用基于密度的聚类的概念,即要求聚类空间中的一定区域所包含对象的数目不小于某一给定的阈值,该方法是( )。
【A.】关联分析
【B.】系统聚类
【C.】快速聚类
【D.】DBSCAN聚类

DBSCAN 算法需要用户输入两个参数:一个参数是( ),表示以给定点P为中心的圆形邻域;另一个参数是以点P为中心的邻域内最( )点的数量(MinPts)。
【A.】半径;小
【B.】半径;大
【C.】直径;小
【D.】直径;大