注意:此页面搜索的是所有试题
广东开放大学数据分析与挖掘(本专)
对于假设检验,下列说法正确的是:( )
选择一项:
a. 主要用于分类问题的归类等
b. 以结构风险最小为原则
c. 基于小概率事件原理
d. 知识和结果的不可解释性
下列对决策树ID3算法的描述不正确的选项是?( )
选择一项:
a. 利用卡方检验来选择对因变量最有影响的自变量
b. 根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性
c. 样本集的划分依据测试属性的取值进行
d. 基于信息熵来选择最佳测试属性
关于支持向量机,下列说法正确的选项是?( )
选择一项:
a. 大规模串行结构和信息的串行处理
b. 通过输入多个非线性模型以及不同模型之间的加权互联
c. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
d. 知识和结果的不可解释性
如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( )
选择一项:
a. 模型构建与评估
b. 应用部署
c. 数据收集与清洗
d. 明确数据挖掘目标
沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )
选择一项:
a. 关联规则
b. 决策树
c. 聚类分析
d. 神经网络
下列不是对决策树CHAID算法的描述的选项是?( )
选择一项:
a. 应用的前提是因变量为类别型变量(Category)
b. 依据局部最优原则
c. 利用卡方检验来选择对因变量最有影响的自变量
d. 检验标准是基尼系数(Gini)等不纯度的指标
不属于数据分析与数据挖掘工具的有:( )
选择一项:
a. R语言
b. SPSS
c. SQL
d. Python
2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )
选择一项:
a. 假设检验
b. 决策树
c. 支持向量机
d. 神经网络
Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )
选择一项:
a. 1989年
b. 1991年
c. 1993年
d. 1996年
下列选项中,不是对支持向量机的描述的是?( )
选择一项:
a. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面
b. 基于小概率事件原理
c. 训练数据较大
d. 以结构风险最小为原则
从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( )
选择一项:
a. 数据分析侧重于实际的业务知识
b. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能
c. 数据分析属于描述和探索性分析,评估现状和修正不足
d. 数据分析需要有过硬的数学功底和编程技术
2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )
选择一项:
a. 假设检验
b. 神经网络
c. 回归分析
d. 决策树
相对于数据挖掘来说,数据分析呈现的结果更多偏向于:( )
选择一项:
a. 统计描述结果的呈现
b. 通过模型或规则实现智能的商业决策,划分产品所属的群类
c. 通过模型或规则可对未知标签的数据进行预测判别用户是否响应某种营销活动
d. 模型或规则的输出
在回归分析中,不属于参数估计方法改进方向的选项是?( )
选择一项:
a. 岭回归
b. 非线性回归
c. 主成分回归
d. 偏最小二乘回归
关于神经网络,描述错误的选项是?( )
选择一项:
a. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联
b. 大规模串行结构和信息的串行处理
c. 主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习
d. 知识和结果的不可解释性
选择一项:
a. 主要用于分类问题的归类等
b. 以结构风险最小为原则
c. 基于小概率事件原理
d. 知识和结果的不可解释性
下列对决策树ID3算法的描述不正确的选项是?( )
选择一项:
a. 利用卡方检验来选择对因变量最有影响的自变量
b. 根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性
c. 样本集的划分依据测试属性的取值进行
d. 基于信息熵来选择最佳测试属性
关于支持向量机,下列说法正确的选项是?( )
选择一项:
a. 大规模串行结构和信息的串行处理
b. 通过输入多个非线性模型以及不同模型之间的加权互联
c. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
d. 知识和结果的不可解释性
如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( )
选择一项:
a. 模型构建与评估
b. 应用部署
c. 数据收集与清洗
d. 明确数据挖掘目标
沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )
选择一项:
a. 关联规则
b. 决策树
c. 聚类分析
d. 神经网络
下列不是对决策树CHAID算法的描述的选项是?( )
选择一项:
a. 应用的前提是因变量为类别型变量(Category)
b. 依据局部最优原则
c. 利用卡方检验来选择对因变量最有影响的自变量
d. 检验标准是基尼系数(Gini)等不纯度的指标
不属于数据分析与数据挖掘工具的有:( )
选择一项:
a. R语言
b. SPSS
c. SQL
d. Python
2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )
选择一项:
a. 假设检验
b. 决策树
c. 支持向量机
d. 神经网络
Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )
选择一项:
a. 1989年
b. 1991年
c. 1993年
d. 1996年
下列选项中,不是对支持向量机的描述的是?( )
选择一项:
a. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面
b. 基于小概率事件原理
c. 训练数据较大
d. 以结构风险最小为原则
从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( )
选择一项:
a. 数据分析侧重于实际的业务知识
b. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能
c. 数据分析属于描述和探索性分析,评估现状和修正不足
d. 数据分析需要有过硬的数学功底和编程技术
2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )
选择一项:
a. 假设检验
b. 神经网络
c. 回归分析
d. 决策树
相对于数据挖掘来说,数据分析呈现的结果更多偏向于:( )
选择一项:
a. 统计描述结果的呈现
b. 通过模型或规则实现智能的商业决策,划分产品所属的群类
c. 通过模型或规则可对未知标签的数据进行预测判别用户是否响应某种营销活动
d. 模型或规则的输出
在回归分析中,不属于参数估计方法改进方向的选项是?( )
选择一项:
a. 岭回归
b. 非线性回归
c. 主成分回归
d. 偏最小二乘回归
关于神经网络,描述错误的选项是?( )
选择一项:
a. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联
b. 大规模串行结构和信息的串行处理
c. 主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习
d. 知识和结果的不可解释性