注意:此页面搜索的是所有试题
焦作师范高等专科学校Hadoop应用基础
HFile数据格式中的Magic字段用于()。
A.存储随机数,防止数据损坏
B.存储数据的起点
C.存储数据块的起点
D.指定字段的长度

HFile数据格式中的KeyValue数据格式中Value部分是()。
A.拥有复杂结构的字符串
B.字符串
C.二进制数据
D.压缩数据

HBase中的批量加载底层使用()实现。
A.MapReduce
B.Hive
C.Coprocessor
D.Bloom Filter

HBase虚拟分布式模式需要()个节点?
A.1
B.2
C.3
D.最少3个

HBase分布式模式最好需要()个节点?
A.1
B.2
C.3
D.最少

Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是
A.Hadoop
B.Nutch
C.Lucene
D.Solr

配置Hadoop时,JAVA_HOME包含在哪一个配置文件中
A.hadoop-default.xml
B.hadoop-env.sh
C.hadoop-site.xml
D.configuration.xsl

Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括
A.conf-site.xml
B.mapred-site.xml
C.core-site.xml
D.hdfs-site.xml

HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在哪个配置文件内说明
A.mapred-site.xml
B.core-site.xml
C.hdfs-site.xml
D.以上均不是

关于Hadoop单机模式和伪分布式模式的说法,正确的是
A.两者都起守护进程,且守护进程运行在一台机器上
B.单机模式不使用HDFS,但加载守护进程
C.两者都不与守护进程交互,避免复杂性
D.后者比前者增加了HDFS输入输出以及可检查内存使用情况

下列关于Hadoop API的说法错误的是
A.Hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java.io.DataInputStream的子类

HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件:
A.日志
B.命名空间镜像
C.两者都是

为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable),Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?
A.JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClass
B.HADOOP_MAP_DATATYPES环境变量
C.随作业一起提交的mapper-specification.xml文件
D.InputFormat格式类

NameNode在启动时自动进入安全模式,在安全模式阶段,说法错误的是
A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B.根据策略对数据块进行必要的复制或删除
C.当数据块最小百分比数满足最小副本数条件时,会自动退出安全模式
D.文件系统允许有修改

关于HDFS的文件写入,正确的是
A.支持多用户对同一个文件的写操作
B.用户可以在文件的任意位置进行修改
C.默认将文件复制成三份存放
D.复制的文件默认都存在同一机架上