注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
异常点通常是指处于数据边界和数据集中的其他点有着不同模式的点。
【A.】√
【B.】×

为了去除异常值,我们可以对每个变量计算Z-得分,然后去除那些Z-得分异常高或者异常低的个体。
【A.】√
【B.】×

缺失值是不受标准化过程影响的。
【A.】√
【B.】×

下列代码可以将数据集data中的重复个体检测出的是( )。
【A.】data.repeat()
【B.】data.repetition()
【C.】data.duplicated()
【D.】data.duplication()

下列关于函数duplicated()的说法不正确的是( )。
【A.】函数结果会返回数据中的所有重复值
【B.】函数结果会返回一个布尔数组
【C.】函数结果表明每一行是否与前面行有重复
【D.】函数结果会返回数据中的所有非重复值

下列关于函数duplicated()的说法正确的是( )。
【A.】函数结果会返回数据中的所有重复值
【B.】函数结果会返回一个布尔数组
【C.】函数结果表明每一行是否与前面行有重复
【D.】函数结果会返回数据中的所有非重复值

duplicated()函数会返回一个布尔数组,表明每一行是否与前面行有重复。
【A.】√
【B.】×

duplicated()函数可以将数据中的重复值直接筛选出来。
【A.】√
【B.】×

一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。
【A.】√
【B.】×

数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合不包括( )。
【A.】删除数据的异常值
【B.】减少接下来处理数据的大小
【C.】改变粒度分析(从精细到粗放尺度)
【D.】提高数据的解释能力

数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合包括( )。
【A.】删除数据的异常值
【B.】减少接下来处理数据的大小
【C.】改变粒度分析(从精细到粗放尺度)
【D.】提高数据的解释能力

数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作。
【A.】√
【B.】×

下列关于抽样的说法正确的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】有放回抽样则将抽出来的个体从抽样对象中去除
【C.】无放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体

下列关于抽样的说法错误的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】无放回抽样则将抽出来的个体从抽样对象中去除
【C.】有放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体

下列关于抽样的说法正确的是( )。
【A.】抽样有多种方法,如有放回抽样、无放回抽样等
【B.】无放回抽样则将抽出来的个体从抽样对象中去除
【C.】有放回抽样有可能对同一个个体抽中了多次
【D.】无放回抽样会有重复的个体