注意:此页面搜索的是所有试题
国家开放大学大数据技术导论复习题
特征约简是在保留、提高原有判别能力的前提下,从原有的特征中删除不重要或不相关的特征,或者通过对特征进行重组来减少特征的个数,同时减少特征向量的维度。()
【A.】√
【B.】 ×

确定样本子集大小的因素中不包括计算成本和存储要求。()
【A.】√
【B.】 ×

随机抽样方法的特点是要使总体中每个个体被抽取的可能性都相同。()
【A.】√
【B.】 ×

系统抽样又称为等距抽样,当总体中个体数少,且其分布没有明显的不均匀情况时,常采用系统抽样。()
【A.】√
【B.】 ×

分层抽样又称为类型抽样,是指先将总体单位按主要标志加以分类,分成互不重叠且有限的类型,使其成为层,然后从各层中独立地随机抽取单位。()
【A.】√
【B.】 ×

数据立方体是二维表格的多维扩展,将三维的数据立方体看作是一组类似的互相叠加起来的二维表格。()
【A.】√
【B.】 ×

在进行高维数据分析时,存在的两个主要困难分别是欧氏距离问题和维数膨胀问题。()
【A.】√
【B.】 ×

对于高维数据,通过降维的维数约简方法可以减少冗余数据。()
【A.】√
【B.】 ×

维数约简又称为降维,对于较高维空间的数据库X,通过特征提取或者特征选择的方法,将原空间的维数降至m维。()
【A.】√
【B.】 ×

基于数据时序的维数约简可以分为静态维数约简和时间相关维数约简,静态维数约简通常用于处理时间序列。()
【A.】√
【B.】 ×

数值约简是利用替代的方式,使用较小的数据表示替换或估计数据,进而可以减少数据量。()
【A.】√
【B.】 ×

数值约简技术分为有参数值约简技术和无参数值约简技术。()
【A.】√
【B.】 ×

无参数值约简技术主要用于存放约简数据的表示,其主要有线性回归模型、直方图、聚类和选择等。()
【A.】√
【B.】 ×

数据集成是应用、存储以及各组织之间传送的数据管理实践活动,其主要考虑合并规整数据问题。()
【A.】√
【B.】 ×

数据集成是指将不同来源、不同格式、不同特点与不同性质的数据在逻辑上或物理上有机地集中,存放在一个一致的数据存储 (如数据仓库)中。()
【A.】√
【B.】 ×