注意:此页面搜索的是所有试题
题目内容
(国家开放大学大数据预处理复习题)
下列表述中,错误的是( )。
A.低频分类数据都是真实的分类结果确实存在低频类别导致的。
B.可以通过绘制分类变量的各类别频数分布的箱线图来发现数据是否为低频分类数据。
C.过多的低频类别会严重影响建模的效率,在数据预处理阶段需要尽量进行处理。
D.低频分类数据通常呈现出类别众多,而且很多类别仅有几个甚至一个样本的情况。
A.低频分类数据都是真实的分类结果确实存在低频类别导致的。
B.可以通过绘制分类变量的各类别频数分布的箱线图来发现数据是否为低频分类数据。
C.过多的低频类别会严重影响建模的效率,在数据预处理阶段需要尽量进行处理。
D.低频分类数据通常呈现出类别众多,而且很多类别仅有几个甚至一个样本的情况。
参考答案