注意:此页面搜索的是所有试题
国家开放大学大数据技术导论复习题
大数据的获取要避免重复数据。()
【A.】√
【B.】 ×

在互联网营销中,用户反馈承担的核心任务是为产品收集用户舆情信息。()
【A.】√
【B.】 ×

图像数字化是进行数字图像处理的前提。()
【A.】√
【B.】 ×

图像数字化是将连续色调的模拟图像经采样量化后转换成数字影像的过程。()
【A.】√
【B.】 ×

图像信息获取的方法只有扫描技术。()
【A.】√
【B.】 ×

图形数字化是将图形的连续模拟量转换成离散的数字量的过程。()
【A.】√
【B.】 ×

空间数据是一种用点、线、面以及实体等基本空间数据结构来表示自然世界的数据。()
【A.】√
【B.】 ×

空间数据的获取不包括对多媒体数据进行获取。()
【A.】√
【B.】 ×

网站内部数据是网站最容易获取的数据,其通常存放在网站的文件系统或数据库中,也是与网站自身最为密切相关的数据,是网站分析最常用的数据来源。()
【A.】√
【B.】 ×

网站数据采集只是将网站上的结构化数据从网页中提取出来,并将其存储到统一的本地数据文件中。()
【A.】√
【B.】 ×

网络爬虫的过程主要分为获取网页、解析网页和存储数据三部分,其是按照一定的获取网页规则,自动地抓取互联网数据的软件。()
【A.】√
【B.】 ×

网络爬虫可以分为通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫等。()
【A.】√
【B.】 ×

网络爬虫从一个或若干初始网页的 URL开始,获得初始网页上的 URL,在抓取网页的过程中,不断从当前页面上抽取新的 URL放入队列,直到满足系统的停止条件为止。()
【A.】√
【B.】 ×

通用网络爬虫又称为全网爬虫,其可将爬行对象从一些种子 URL扩充到整个 Web,主要为门户站点搜索引擎和大型 Web服务采集数据。()
【A.】√
【B.】 ×

网页的爬行策略可以分为深度优先搜索策略、广度优先搜索策略、最佳优先搜索策略和反向链接数搜索策略,其中深度优先搜索策略是最常使用的方法。()
【A.】√
【B.】 ×