大数据:Hadoop(Yarn)
第1章Yarn资源调度器Yarn是一个资源调度平台负责为运算程序提供服务器运算资源相当于一个分布式的操作系统平台而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。1.1Yarn基础架构1.2Yarn工作机制1MR程序提交到客户端所在的节点。2YarnRunner向ResourceManager申请一个Application。3RM将该应用程序的资源路径返回给YarnRunner。4该程序将运行所需资源提交到HDFS上。5程序资源提交完毕后申请运行mrAppMaster。6RM将用户的请求初始化成一个Task。7其中一个NodeManager领取到Task任务。8该NodeManager创建容器Container并产生MRAppmaster。9Container从HDFS上拷贝资源到本地。10MRAppmaster向RM 申请运行MapTask资源。11RM将运行MapTask任务分配给另外两个NodeManager另两个NodeManager分别领取任务并创建容器。12MR向两个接收到任务的NodeManager发送程序启动脚本这两个NodeManager分别启动MapTaskMapTask对数据分区排序。13MrAppMaster等待所有MapTask运行完毕后向RM申请容器运行ReduceTask。14ReduceTask向MapTask获取相应分区的数据。15程序运行完毕后MR会向RM申请注销自己。1.3 Yarn作业提交过程1.4 Yarn调度器和调度算法FIFO调度器First In First Out单队列根据提交作业的先后顺序先来先服务。优点简单易懂缺点不支持多队列生产环境很少使用容量调度器公平调度器
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2473760.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!