做慕课的网站,wordpress系统架构图,塘下网站建设,wordpress自动tag单选题 题目1#xff1a;MapReduce自定义排序规则需要重写下列那项方法 选项: A readFields() B compareTo() C map() D reduce() 答案#xff1a;B ------------------------------ 题目2#xff1a;下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是 选项: A…单选题 题目1MapReduce自定义排序规则需要重写下列那项方法 选项: A readFields() B compareTo() C map() D reduce() 答案B ------------------------------ 题目2下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是 选项: A 一个Map函数就是对一部分原始数据进行指定的操作 B 一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。 C Map与Map之间不是相互独立的。 D Reducee与Reduce之间不是相互独立的。 答案A ------------------------------ 题目3MapReduce适用于 选项: A 任意应用程序 B 任意可以在Windows Server 2008上的应用程序 C 可以串行处理的应用程序 D 可以并行处理的应用程序 答案D ------------------------------ 题目4在Hadoop中下面哪个是默认的inputFormat类型它将每行内容作为新值而将字节偏移量作为Key 选项: A FileInputFormat B TextInputFormat C KeyValueTextInputFormat 答案B ------------------------------ 题目5下面哪个是一种编程模型它将大规模的数据处理工作拆分成互相独立的任务然后并行处理 选项: A MapReduce B HDFS C Pig 答案A ------------------------------ 题目6在Hadoop的分区阶段默认的Partitioner是什么 选项: A HashPar B Partitioner C HashPartitioner 答案C ------------------------------ 题目7在MapReduce中下面哪个阶段是并行进行的 选项: A Shuffle和Map B Shuffle和Sort C Reduce和Sort 答案B ------------------------------ 题目8有关MapReduce下面哪个说法是正确的 选项: A 它提供了资源管理能力 B 它是开源数据仓库系统用于查询和分析存储在Hadoop中的大型数据集 C 它是Hadoop数据处理层 答案C ------------------------------ 题目9编写MapReduce程序时下列叙述错误的是 选项: A reduce函数所在的类必须继承自Reducer类 B map函数的输出就是reduce函数的输入 C reduce函数的输出默认是有序的 D 启动MapReduce进行分布式并行计算的方法是start 答案D ------------------------------ 题目10Hadoop MapReduce计算的流程是 选项: A Map任务—Shuffle—Reduce任务 B Map任务—Reduce任务—Shuffle C Reduce任务—Map任务—Shuffle D Shuffle—Map任务—Reduce任务 答案A ------------------------------ 多选题 题目1关于MapReduce的shuffle过程叙述正确的是 选项: A Shuffle分为Map任务端的Shuffle和Reduce任务段的Shuffle B Map任务的输出结果不是立即写入磁盘而是首先写入缓存 C 并非所有场合都可以使用合并操作 D 每个Reduce任务真正开始之前大部分时间都在从Map端领取所需的数据 答案ABCD ------------------------------ 题目2MapReduce为了保证任务的正常执行采用哪些容错机制 选项: A 重复执行 B 重新开始整个任务 C 推测执行 D 直接丢弃执行效率低的作业 答案AC ------------------------------ 题目3对MapReduce的体系结构以下说法正确的是 选项: A 分布式编程架构 B 以数据为中心更看重吞吐率 C 分而治之的思想 D 将一个任务分解成多个子任务 答案ABCD ------------------------------ 题目4MapReduce体系结构主要由哪几个部分组成 选项: A TaskTracker B Task C JobTracker D Client 答案ABCD ------------------------------ 题目5下列关于传统并行计算框架比如MPI和MapReduce并行计算框架比较正确的是 选项: A 前者相比后者学习起来更难 B 前者是共享式(共享内存/共享存储)容错性差后者是非共享式的容错性好 C 前者适用于实时、细粒度计算、计算密集型后者适用于批处理、非实时、数据密集型 D 前者所需硬件价格贵可扩展性差后者硬件便宜扩展性好 答案ABCD ------------------------------ 题目6MapReduce与HBase的关系哪些描写叙述是正确的 选项: A 两者不可或缺MapReduce是HBase能够正常执行的保证 B 两者不是强关联关系没有MapReduceHBase能够正常执行 C MapReduce能够直接访问HBase D 它们之间没有不论什么关系 答案BC ------------------------------ 判断题 题目1分区数量是ReduceTask的数量。 选项: 答案 ------------------------------ 题目2Map阶段处理数据时是按照Key的哈希值与ReduceTask数量取模进行分区的规则。 选项: 答案 ------------------------------ 题目3在Hadoop中每个应用程序被表示成一个作业每个作业又被分成多个任务JobTracker的负责作业的分解、状态监控以及资源管理。 选项: 答案 ------------------------------ 题目4Map的主要工作是将多个任务的计算结果进行汇总。 选项: 答案错误 ------------------------------ 题目5HDFS是分布式文件系统其命名空间包括块、目录和文件。 选项: 答案 ------------------------------ 题目6HDFS集群开始启动时其处于安全模式可以进行读操作不能进行写操作。 选项: 答案 ------------------------------ 题目7两个键值对“hello”,1和“hello”,1x如果对其进行归并(merge)会得到“hello”,1,1如果对其进行合并(combine)会得到“hello”,2。 选项: 答案错误 ------------------------------ 题目8MapReduce设计的一个理念就是“计算向数据靠拢”而不是“数据向计算靠拢”因为移动数据需要大量的网络传输开销。 选项: 答案 ------------------------------ 填空题 题目1Sqoop底层利用_____技术以_____方式加快了数据传输速度并且具有较好的容错性功能。 选项: 答案 MapReduce 批处理 ------------------------------ 题目2Partitioner组件目的是 _____ 选项: 答案将key均匀分布在ReduceTask上 ------------------------------