龙空技术网

东方金信大数据面试题

尚硅谷教育 169

前言:

如今各位老铁们对“hadoop中默认的调度器是什么”大约比较着重,小伙伴们都需要分析一些“hadoop中默认的调度器是什么”的相关文章。那么小编也在网摘上收集了一些对于“hadoop中默认的调度器是什么””的相关内容,希望咱们能喜欢,同学们快快来了解一下吧!

东方金信

1)Hadoop部分

一、单选题

1.下面哪个程序负责HDFS数据存储。

a)NameNode bllobtracker c)Datanode d)secondaryNameNode e)tasktracker

2.HDIS中的block 默认保存几份?

a)3份b)2份c)1份

d)不确定

3.下列哪个程序通常与NameNode 在一个节点启动?

a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker

4.HDFS默认Block Size a)32MBb)64MB c)128MB

5.下列哪项通常是集群的最主要瓶颈

a)CPU b)网络c)碰盘d)内存

6.关于SecondaryNameNode哪项是正确的?

a)它是NameNode的热备

b)它对内存没有要求

c)它的目的是帮助NameNode合并编辑日志,减少NameNode 启动时间d)SecondaryNameNode应与Name

二、多选题:

7.配置机架感知的下面哪项正确

a)如果一个机架出问题,不会影响数据读写

b)写入数据的时候会写到不同机架的DataNode中c)MapReduce会根据机架获取离自已比较近的网络数据

8.Client端上传文件的时候下列哪项正确

a)数据经过NameNode 传递给DataNodeb)Client端将文件切分为Block,依次上传c)Client只上传数据到一台DataNode,然后由NameNode 负责Block 复制工作

9.下列哪个是Hadoop运行的模式

a)单机版

b)伪分布式

c)分布式

三、判断题:

1.Block Size是不可以修改的。()

2.Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。()

3.Hadoop是Java开发的,所以MapReduce只支持Java语言编写。()

4.Hadoop支持数据的随机读写。()

5.NameNode负责管理metadata,clent端何次读请求,它都会从磁盘中读取成则会输入metadata信息非反馈clent幅、(

6.NameNode本地磁盘保存了Block 的位说信息。()

7.Hadoop自身具有严格的权限管理和安全措施保障集群正常运行。()

8.Slave节点要存储数据,所以它的磁盘越大越好。(>

9.hadoop dfsadmin-report命令用于检测HDFS损坏块。()

10.Hadoop默认调度器策略为FIFO()

11.集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响整个节点运行。()

12.因为HDFS有多个副本,所以NameNode是不存在单点问题的。()

13.Mapreduce的input split就是一个block.()

14.Hadoop环境交量中的HADOOP HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200GB.()

15.DataNode首次加入cluster 的时候,如果log中报告不兼容文件版本,那需要NameNode执行"Hadoop namenode-format"操作格式化磁盘。()

SQL部分

已知数据库中有以下表:student(s#,sname,sage,ssex)学生表course(c#,cname,t#)

课程表

sc(s#,c#,score)

成绩表

teacher(t#,tname)

教师表

且表结构为:

create table student(S# int,sname varchar(32),sageint,ssex varchar(8)); create table courseC# int,cname varchar(32),t# int);create table sc(S# int,C# int,score int);create table teacher( t# int,tname varchar(16));

请写出以下查询的SQL语句:

1)查询“001"课程比*002”课程成绩高的所有学生的学号:

2)查询平均成绩大于60分的同学的学号和平均成绩:

3)查询所有同学的学号、姓名、选课数、总成绩:

4)查询出只选修了一门课程的全部学生的学号和姓名:

5)

查询有两门或两门以上课程成绩小于60分的学生学号、姓名、不及格课程名称、分数:

6)查询没学过“叶平”老师课的同学的学号、姓名:

7)查询同时选修了“001”和“002”两门课的学生学号和姓名:

8)查询任何一门课程成绩在70分以上的姓名、课程名称和分数:

9)查询各科成绩最高和最低的分:以如下形式显示:课程id,最高分,最低分:

10)

查询“001”和“002”课程成绩第4名到第10名的学生学号、姓名、课程名称和成绩;

大数据工程师笔试题

2)数据库题目

1)已知表T1中有2行数据,72中有3行数据,执行语句"selecta."fromTla,T2b"后,返回的行数为_

A、2行B、3行C、S行D.6行

2)

已知表T1和T2的字段定义完全相同,T1,T2中各有5条不同的数据,其中T1有2条数据存在于表T中执行语句"select。from T1 union all select。fromT2返回的行数为_____

A、8行B、10行C、3行D、12行

3)SQL语句优化的策略都有哪些?

4)什么是事务?什么是锁?

3)Hadoop题目

1)创建HDFS目录/user/user1:

2)上传文件test1.txt到/user/user1下:

3)查看/user/user1/test1.txt内容:

4)为文件/user/user1/test1.txt授权为rWXr-Xr-X:

5)在Hive中,查看表member详细描述信息:

6)在Hive中,向表member中插入一条记录,其中id=a,age=24:

7)浏览HBase的表member中的所有数据:

8)在HBase中,从表member中获取rowkey=a,列族=info 的所有数据:

9)以下组件的默认端口号是多少?

HDFS web:resourcemanager web:HiveServer2 thrift:hive metastore.uris:kafka broker:spark web:

10)请简述你认为什么样的情况下使用HBase?什么样的情况下使用Hive?

11)请简述Hadoop怎样实现二级排序?

标签: #hadoop中默认的调度器是什么