注意:此页面搜索的是所有试题
国家开放大学大数据技术导论复习题
批量计算是一种在线计算,支持海量作业 并发规模,系统自动完成资源管理、作业调度和数据加载,并按实际使用量计费。()
【A.】√
【B.】 ×

静态数据是流式数据。()
【A.】√
【B.】 ×

流式计算适用于无须先存储,可以直接进行数据计算,实时性要求很严格,但对数据的精确度要求较宽松的应用场景。()
【A.】√
【B.】 ×

实时计算系统的设计需要考虑高延迟、高性能、分布式、可扩展、高容错。()
【A.】√
【B.】 ×

流式查询主要有两种方式,一种是指定查询,另一种是即席查询。()
【A.】√
【B.】 ×

流式数据的处理是批量处理。()
【A.】√
【B.】 ×

流式计算不宜用持久稳定关系建模,而适用瞬态数据流建模。()
【A.】√
【B.】 ×

为了更有效地处理数据,应该尽可能地限制静态数据。()
【A.】√
【B.】 ×

大数据的无序性是指各数据流之间无序,而同一数据流内部各数据元素之间是有序的。()
【A.】√
【B.】 ×

MapReduce由 Map和 Reduce两个阶段组成,用户只需要编写 Map和 Reduce两个函数就可以完成简单的分布式程序的设计。()
【A.】√
【B.】 ×

Map相对独立且并行运行,对存储系统中的文件按列处理,并产生键值对。()
【A.】√
【B.】 ×

在Hadoop中,将每一次计算请求称为一个作业。()
【A.】√
【B.】 ×

与分布式文件系统相比,MapReduce框架可定制性强。()
【A.】√
【B.】 ×

通常一个作业的输入都是基于分布式文件系统的文件,而对于一个 Map任务而言,它的输入是输入文件的一个数据块,或者是数据块的一部分,也可跨越数据块。()
【A.】√
【B.】 ×

Reduce任务与 Map任务的最大不同是 Map任务的文件都存储于本地,而 Reduce任务需要到多处采集。()
【A.】√
【B.】 ×