注意:此页面搜索的是所有试题
国家开放大学大数据技术导论复习题
聚焦网络爬虫又称为主题爬虫,是面向特定主题的一种网络爬虫程序。()
【A.】√
【B.】 ×

聚焦网络爬虫与通用网络爬虫的区别之处在于聚焦网络爬虫在实施网页抓取时要进行主题筛选,尽量保证只抓取与主题相关的网页信息。()
【A.】√
【B.】 ×

网页分析算法可以归纳为基于网络拓扑、基于网页内容和基于用户访问行为三种类型。()
【A.】√
【B.】 ×

网络拓补分析算法是基于网页之间的链接,通过已知的网页或数据对与其有直接或间接链接关系的对象作出评价的算法,其又分为网页粒度、网站粒度两种算法。()
【A.】√
【B.】 ×

从应用的构建架构角度出发,我们可以将数据库归纳为 OldSQL数据库、NoSQL数据库和 NewSQL数据库。()
【A.】√
【B.】 ×

OldSQL数据库是指传统的关系数据库,NoSQL数据库是指非结构化数据库,而 NewSQL数据库是介于 OldSQL数据库和 NoSQL数据库两者之间的数据库。()
【A.】√
【B.】 ×

OldSQL数据库适用于数据分析应用,NewSQL数据库适用于事务处理应用,NoSQL数据库适用于互联网应用。()
【A.】√
【B.】 ×

大数据可视分析通过交互可视界面来进行分析、推理和决策,可视分析与各个领域的数据形态、大小及其应用密切相关。()
【A.】√
【B.】 ×

NoSQL主要指非关系型、分布式、不提供 ACID 特性的数据库设计模式。()
【A.】√
【B.】 ×

NoSQL数据库代表了一系列的、不同类型的相互关联的数据存储与处理的技术的集合。()
【A.】√
【B.】 ×

NoSQL数据库与 SQL数据库显著的区别是 NoSQL数据库不使用 SQL作为查询语言,其数据存储不使用固定的表格模式,具有横向可扩展性的特征。()
【A.】√
【B.】 ×

NewSQL数据库是指各种新型的可扩展/高性能数据库,这类数据库不仅具有 NoSQL数据库对海量数据的存储管理能力,还保持了传统数据库的 ACID和 SQL等特性。()
【A.】√
【B.】 ×

在大数据抽取之前,无需清楚数据源的类型和数据的类型,可直接抽取。()
【A.】√
【B.】 ×

增量数据抽取机制能够将业务系统中的变化数据按一定的频率准确地捕获到,同时不能对业务系统造成太大的压力,也不能影响现有业务。相对全量数据抽取,增量数据抽取的设计更简单。()
【A.】√
【B.】 ×

时间戳是能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的一个数据,其通常是一个字符序列,唯一标识某一刻的时间。()
【A.】√
【B.】 ×