linux调度模拟器 LinSched
本文导语: LinSched 最初是在北卡罗来纳大学开发的(IBM 和 Intel 提供赞助),但是最近又被 Google 恢复了,用来验证调度策略。这是有趣的举动,可能代表一种未来趋势。虽然 Linux 支持许多调度类并跨许多工作负荷进行了合理的调度工作...
LinSched 最初是在北卡罗来纳大学开发的(IBM 和 Intel 提供赞助),但是最近又被 Google 恢复了,用来验证调度策略。这是有趣的举动,可能代表一种未来趋势。虽然 Linux 支持许多调度类并跨许多工作负荷进行了合理的调度工作,但是对于给定硬件拓扑上的特定工作负荷,它可能不是最理想的。因为 Google 在执行特定任务(例如 MapReduce)的大量同型机集群上投资,所以针对该任务和环境调整调度有意义。在 LinSched 使用中,Google 还有助于增强适用于完全公平调度器(Completely Fair Scheduler,CFS)的 Linux,包括当任务间存在很大差异时的带宽设置和负载平衡。
LinSched 是驻留在用户空间中的 Linux 调度器模拟器。它隔离 Linux 调度器子系统并围绕它构建足够的内核环境,从而可以在用户空间内执行该模拟器。它还将围绕其构建一系列应用程序编程接口(Application Programming Interfaces,APIs)以提供必要的刺激来验证调度工作负荷并收集足够的相关数据来了解其行为(稍后将介绍其整体架构)。
将调度器放入用户空间很容易就可以执行该调度器(因为调度器的崩溃不会引起整机崩溃)。这也使得收集有关调度器的数据变得简单,因为其可以在本地文件系统中轻松而又有效地收集数据并存储数据。
使用虚拟化是一种方案,但是 LinSched 的优势是简单且有效(因为没有必要启动
LinSched 不仅仅是在用户空间中执行的调度器模拟器:它是通过必要组件的瘦模拟将 Linux 调度器迁移到用户空间,以便该调度器能够在内核以外执行。对于包装器和模拟引擎来说,LinSched 源实际上是带有名为 ./linsched 的新子目录的 Linux 版本(目前是 2.6.35)。因为 LinSched 为其模拟在 Linux 内使用 Linux 调度器子系统,所以进行更改,然后将更改集成回内核要简单得多。
LinSched 的总体架构如图 1 所示。底部是主机操作系统。LinSched 是由许多组件构建的用户空间应用程序(包括部分 Linux 内核本身)。另一个内核)。作为用户空间进程,也很容易附加一个调试器(如 GNU Debugger (GDB))来更深入地了解调度器操作。
图1 linsched架构
环境模块提供 Linux 内核的抽象概念(通过在模拟模式中支持编译的标志)。在环境模块上的是模拟引擎,扩展了 API 以用于配置环境并执行模拟。模拟引擎 API 提供同步功能,定义处理器拓扑的初始化函数以及用于任务创建、回调(例如,在调度任务时)的函数和用于执行对一些时钟节拍执行模拟的 run 函数(其反过来调用内部 Linux schedule() 函数来制定调度决策)。
上面的模拟引擎是脚本环境(真实模拟的代码)。虽然它可能是单一脚本,但是正如后面的示例所示,最简单的用法是修改现有脚本环境来增加测试场景。
LinSched 的基本架构非常简单。我们首先来研究如何安装 LinSched,然后再讨论一些扩展的 API 以及如何在模拟中使用它们。
(以上简介选自:http://www.ibm.com/developerworks/cn/linux/l-linux-scheduler-simulator/)