注意:此页面搜索的是所有试题
国家开放大学大数据预处理复习题
日期时间型数据不能进行任何计算
数据分析项目中,数据预处理环节不重要,可以忽略不做。
Pearson相关系数的值均在[0,1]之间分布
变量选择的目的是删除数据集的行,样本归约的目的是删除数据集的列。
出现在训练集中的异常值,会干扰模型的训练
低频分类数据的形成都是由于真实的分类结果确实存在低频类别。
Max-ABS缩放只可以将变量缩放至区间[0,1]。
一旦发现异常值,就应当将其删除
数据离散化是指将定性变量转换为连续性变量。
低频分类数据都是由于数据采集是的错误导致的
具有不同的数据特征的变量可以直接纳入到同一个分析体系中。
经过Max-ABS缩放后,数据的正负可能会发生改变。
Spearman相关系数为-1时,两个变量不相关。
使用客观法得到的是分类形式或顺序形式定性变量,依据的是研究者基于研究目的所确定的类别。
数据缺失使得数据集信息含量降低,还会使一些模型无法应用。
数据分析项目中,数据预处理环节不重要,可以忽略不做。
Pearson相关系数的值均在[0,1]之间分布
变量选择的目的是删除数据集的行,样本归约的目的是删除数据集的列。
出现在训练集中的异常值,会干扰模型的训练
低频分类数据的形成都是由于真实的分类结果确实存在低频类别。
Max-ABS缩放只可以将变量缩放至区间[0,1]。
一旦发现异常值,就应当将其删除
数据离散化是指将定性变量转换为连续性变量。
低频分类数据都是由于数据采集是的错误导致的
具有不同的数据特征的变量可以直接纳入到同一个分析体系中。
经过Max-ABS缩放后,数据的正负可能会发生改变。
Spearman相关系数为-1时,两个变量不相关。
使用客观法得到的是分类形式或顺序形式定性变量,依据的是研究者基于研究目的所确定的类别。
数据缺失使得数据集信息含量降低,还会使一些模型无法应用。