注意:此页面搜索的是所有试题
焦作师范高等专科学校Hadoop应用基础
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
A.利用SequenceFile、MapFile、Har等方式归档小文件
B.多Master设计
C.Block大小适当调小
D.调大namenode内存或将文件系统元数据存到硬盘里

HDFS是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高扩展性、高吞吐率等特征,适合的读写任务是
A.一次写入,少次读写
B.多次写入,少次读写
C.一次写入,多次读写
D.多次写入,多次读写

Clinet在HDFS上进行文件写入时,namenode根据文大小和配置情况,返回部分DataNode信息,谁负责将文件划分为多个block,根据DataNode的地址信息按顺序写入到每一个DataNode块
A.Clinte
B.NameNode
C.DataNode
D.Secondary namenode

出现在datanode的VERSION文件格式中但不出现在nomenode的VERSION文件格式中的是
A.namenodeID
B.storageID
C.storageType
D.layoutVersion

HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。
A.是byte[]数组
B.没有固定的结构
C.数据的大小是定长的
D.有固定的结构

下面对HBase的描述哪些是正确的? ()
A.不是开源的
B.是面向列的
C.是分布式的
D.是一种NoSQL数据库

Rowkey设计的原则,下列哪些选项的描述是正确的?
A.尽量保证越短越好
B.可以使用汉字
C.可以使用字符串
D.本身是无序的

HBase构建二级索引的实现方式有哪些?
A.MapReduce
B.Coprocessor
C.Bloom Filter
D.Filter

关于HBase二级索引的描述,哪些是正确的?
A.核心是倒排表
B.二级索引概念是对应Rowkey这个“一级”索引
C.二级索引使用平衡二叉树
D.二级索引使用LSM结构

下列关于Bloom Filter的描述正确的是?
A.是一个很长的二进制向量和一系列随机映射函数
B.
C.有一定的误算率
D.可以在Bloom Filter中删除元素

HBase官方版本可以安装在什么操作系统上?
A.CentOS
B.Ubuntu
C.RedHat
D.Windows

Hadoop2.0包含哪些核心组件?
Hadoop包含哪些优势?
Hadoop有哪些应用领域?
Hadoop有几种运行模式?