注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
数据预处理涉及数据整理和整合的各个方面,主要包括( )。
【A.】数据清洗
【B.】数据筛选
【C.】数据变换
【D.】数据可视化

缺失值的产生,有可能是因为( )。
【A.】数据本身为异常值
【B.】某些原因没有收集到信息
【C.】对于这些个体来说这些属性是不可用的
【D.】数据重复出现

缺失值的产生有可能是因为某些原因没有收集到信息,也有可能是对于这些个体来说这些属性是不可用的。
【A.】√
【B.】×

dropna()函数默认是删除列,要对行进行删除,则需要添加参数axis=1。
【A.】√
【B.】×

数据预处理是数据分析工作的实施阶段。
【A.】√
【B.】×

在某些情况下,有些时候并不一定会收集到数据,因而会造成观测值或变量的数据有缺失,这些缺失的数据就称为缺失值。
【A.】√
【B.】×

除了填补缺失值,另一个处理缺失值的常用方法就是删除缺失值。这可以通过函数dropna()作用于数据框来实现。
【A.】√
【B.】×

数据预处理是数据分析工作的准备阶段。
【A.】√
【B.】×

如果数据质量不高,则会影响数据挖掘的结果。
【A.】√
【B.】×

dropna()函数默认是删除行,要对列进行删除,则需要添加参数axis=1。
【A.】√
【B.】×

dropna()函数默认是删除行,要对列进行删除,则需要添加参数axis=0。
【A.】√
【B.】×

数据预处理涉及数据整理和整合的各个方面,包括数据清洗、筛选和数据变换,用于数据挖掘前的模型选择等,有助于提高数据挖掘的效率。
【A.】√
【B.】×

下面哪项代码是对数据data进行标准化的过程( )。
【A.】Z = (data - data.mean()) / data.std()
【B.】Z = (data.mean() - data) / data.std()
【C.】Z = (data - data.std()) / data.mean()
【D.】Z = (data.std() - data) / data.mean()

下列代码可以将数据data转换成数值型数据的是( )。
【A.】pd.to_numeric(data)
【B.】pd.to_num(data)
【C.】pd.to_number(data)
【D.】pd.to_string(data)

缺失值会受到标准化过程影响。
【A.】√
【B.】×