注意:此页面搜索的是所有试题
国家开放大学大数据分析与挖掘技术
设定虚拟变量时应当遵循如下哪些原则( )。
【A.】对于有k个表现值的定性变量,只设定(k-1)个虚拟变量
【B.】虚拟变量的值通常用“0”或“1”来表示
【C.】对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1
【D.】设定虚拟变量时对其数量一般不做要求

设定虚拟变量时,虚拟变量的值通常用“0”或“1”来表示。
【A.】√
【B.】×

虚拟变量的设定即把对变量的定量描述转化成对定性数据的描述。
【A.】√
【B.】×

虚拟变量的设定即把对变量的定性描述转化成对定量数据的描述。
【A.】√
【B.】×

设定虚拟变量时,对于有k个表现值的定性变量,只设定(k-1)个虚拟变量。
【A.】√
【B.】×

设定虚拟变量时,对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1。
【A.】√
【B.】×

下列关于性能评估的指标说法错误的是( )。
【A.】对于预测任务的数据挖掘,性能评估的指标包括平均绝对误差和均方根误差等
【B.】对于分类任务的数据挖掘,评价指标一般可通过一个混淆矩阵计算得到
【C.】数据挖掘方法预测性能的评估是数据挖掘中的一个重要内容
【D.】ROC曲线不是常用的评价方法

下列关于期望预测误差的说法错误的是( )。
【A.】期望预测误差实际上是真实值与预测值在某种损失函数下的差值
【B.】期望预测误差实际上是真实值与预测值在某种损失函数下的平均值
【C.】通常我们使用期望预测误差作为寻优的目标函数
【D.】有监督学习模型的目的是寻找一个可以很好地描述自变量X与因变量Y之间关系的函数f

在回归学习中常用的损失函数是( )。
【A.】0-1损失函数
【B.】平方损失函数
【C.】指数损失函数
【D.】负二项损失函数

下列不属于期望预测误差的是( )。
【A.】模型假设失误带来的误差
【B.】采用某种方法估计最优值时,估计值的平均可能偏离了真实值
【C.】估计值自身由于数据的随机性产生一个波动部分
【D.】一些主观人为因素

下列关于偏差和方差的说法不正确的是( )。
【A.】偏差和方差受模型的复杂度影响
【B.】模型越复杂,偏差越小,方差越大
【C.】模型越复杂,偏差越大,方差越小
【D.】模型越简单,偏差越大,而方差越小

下列不属于通过样本估计期望预测误差的方式的是( )。
【A.】不重复抽样
【B.】重复抽样
【C.】非交叉验证
【D.】交叉验证

下列关于性能评估的指标说法正确的是( )。
【A.】对于预测任务的数据挖掘,性能评估的指标包括平均绝对误差和均方根误差等
【B.】对于分类任务的数据挖掘,评价指标一般可通过一个混淆矩阵计算得到
【C.】数据挖掘方法预测性能的评估是数据挖掘中的一个重要内容
【D.】ROC曲线不是常用的评价方法

下列属于通过样本估计期望预测误差的方式的是( )。
【A.】不重复抽样
【B.】重复抽样
【C.】非交叉验证
【D.】交叉验证

下列关于期望预测误差的说法正确的是( )。
【A.】期望预测误差实际上是真实值与预测值在某种损失函数下的差值
【B.】期望预测误差实际上是真实值与预测值在某种损失函数下的平均值
【C.】通常我们使用期望预测误差作为寻优的目标函数
【D.】有监督学习模型的目的是寻找一个可以很好地描述自变量X与因变量Y之间关系的函数f