注意:此页面搜索的是所有试题
国家开放大学大数据技术导论复习题
下列不属于文本数据的是()?
【A.】广告
【B.】音频
【C.】杂志
【D.】图书

下列不属于文本数据的获取特点的是()?
【A.】灵活度高
【B.】速度快
【C.】按需获取
【D.】易处理

下列属于意见建议类用户反馈的特点的是()?
【A.】反馈量大
【B.】反馈速度快
【C.】针对性强
【D.】传播快

下列不属于空间数据的特性的是()?
【A.】定位
【B.】定量
【C.】定性
【D.】时空关系

下列不属于网站内部数据库中的数据的是()?
【A.】用户信息数据
【B.】野外实测数据
【C.】网站产品数据
【D.】网站运营数据

下列不属于网站数据采集的数据的是()?
【A.】非结构化数据
【B.】半结构化数据
【C.】结构化数据
【D.】实验测试数据

下列不属于网络爬虫工作过程的是()?
【A.】获取网页
【B.】修改网页
【C.】解析网页
【D.】储存数据

下列不属于通用网络爬虫的特点及要求的是()?
【A.】数量巨大
【B.】范围较小
【C.】存储空间要大
【D.】爬行速度要快

下列不属于通用网络爬虫的结构的是()?
【A.】页面爬行模块
【B.】页面分析模块
【C.】页面数据库
【D.】页面修改模块

下列不属于网页的爬虫策略的是()?
【A.】深度优先搜索策略
【B.】精确选择搜索策略
【C.】广度优先搜索策略
【D.】最佳优先搜索策略

下列不属于通用网络爬虫的局限性的是()?
【A.】无用网页较多
【B.】对非结构化数据获取相对容易
【C.】难以支持基于语义信息的查询
【D.】有限的网络爬虫服务器资源与无限的网络数据资源之间的冲突

下列属于聚焦网络爬虫的特点的是()?
【A.】数量巨大
【B.】范围较大
【C.】精准筛选
【D.】爬行速度慢

下列属于浅聚焦网络爬虫的核心特点的是()?
【A.】数量巨大
【B.】范围较大
【C.】精准筛选
【D.】选定URL种子

下列不属于爬虫对抓取目标的定义原则的是()?
【A.】目标网页特征
【B.】目标数据量
【C.】目标数据模式
【D.】领域概念

下列不属于网络爬虫的数据抓取方式的是()?
【A.】预先给定的初始抓取种子样本
【B.】预先给定的网页分类目录和与分类目录对应的种子样本
【C.】通过用户行为确定的抓取目标样例
【D.】自行编写种子样本