115 lines
36 KiB
TeX
Executable File
115 lines
36 KiB
TeX
Executable File
|
||
操作系统负责管理软硬件资源、操纵程序运行,为应用软件提供公共支撑,是“软件作为基础设施”的集中体现。过去,操作系统是信息空间的基础设施,起到以平台化方式向下管理各类资源、向上支撑应用运行的作用;未来,在信息物理持续融合趋势的推动下,操作系统管理资源将向各类物理资源扩展,甚至向其他具有“数字孪生”特性的经济、社会和生产生活资源扩展。这一趋势是“软件定义”思想发展的必然结果:随着计算系统正在突破单机、数据中心等封闭环境的限制,操作系统的资源虚拟化、功能可编程能力进一步拓展,从控制管理单个计算机系统资源进一步延伸为连接协调多个结点组成的复杂计算系统,为信息空间、物理空间乃至整个社会提供“软件定义”手段,推动着诸如网构软件操作系统、智能家居操作系统、智慧城市操作系统等“普适操作系统”(Ubiquitous Operating System)成为现实$^{[1]}$。
|
||
|
||
与此同时,操作系统的外延、或者说“操作系统应该是什么形态”这一问题也在随着技术和应用的发展而不断扩展演化。例如,在人机物融合互联这一大背景下,中间件正在表现出加速融合到操作系统中的趋势:早在上个世纪的90年代初,美国华盛顿大学的MOSES(Meta Operating System and Entity Shell)项目即使用了“元级操作系统”的概念来描述分布环境下“位于本地操作系统之上、应用之下的一层软件”$^{[2]}$;早期的普适计算中间件Gaia $^{[3]}$等已在文献中混用“元级操作系统”和“中间件”概念,而今天广泛应用的ROS(Robot Operating System)$^{[4]}$更是继承了网络中间件的核心思想。换言之,操作系统正在以海纳百川的方式沉淀各类具有软件定义特征的基础设施,这也是本章标题“操作系统与运行平台”的由来。
|
||
|
||
基于上述内涵和外延两个方面的观察,本章将从平台架构、方法机制、安全隐私、生态链构建等方面列出操作系统与运行平台的重大挑战问题,并阐述本领域的研究趋势和内容。
|
||
\section{重大挑战问题}
|
||
互联网革命正在进入下半场,“万物互联”时代正在到来,人机物融合的泛在应用场景推动着操作系统和运行平台的新一轮变革,带来体系结构、资源管理、应用支撑、首先,在所管控资源高度异构、涵盖人-机-物三元空间的条件下,未来的操作系统和运行平台需要什么样的架构(§5.1.1);其次,从向下管理泛在资源的角度,需要以及什么样的资源虚拟化和调度机制(§5.1.2);再次,从向上支撑应用运行的角度,应当如何支撑上层应用的持续适应和演化(§5.1.3);最后,在人与物加入到操作系统管理对象中之后,基础设施层的安全与隐私保护风险如何应对(§5.1.4)。
|
||
\subsection{支持软件定义的新型运行平台架构}
|
||
“软件定义”的提法最早可追溯到上个世纪90年代所提出的软件定义无线电(Software-Defined Radio)$^{[5]}$概念。在软件定义的无线电设备中,传统由晶体管、集成电路等实现的信号处理部件(如滤波器、调制/解调器等)被软件所代替,在大幅简化硬件设计同时,获得“功能可编程”的显著收益――设备能力可以按需扩增或裁剪,从而快速适应技术体制和市场需求的变化。
|
||
|
||
进入21世纪,随着云计算等新型计算范型的出现,人们对计算系统的灵活性、可管理性和资源利用率的追求日益提高,“软件定义”一词被引入到计算技术领域。以 “软件定义网络”$^{[6]}$为例,与传统网络互联能力由硬件/固件所决定不同,软件定义网络强调将整个网络自底向上划分为数据、控制和应用三个平面。其中,控制平面向下操纵和协调数据平面上设备(如交换机)的行为,向上提供尽可能与硬件无关的抽象(编程接口)、支撑应用平面运行。控制平面不仅具备“功能可编程”能力,也具备了“资源虚拟化”能力,也即能够对数据平面资源进行高效管理、封装与抽象。“软件定义”内涵的这一升华深受操作系统思想的影响。例如,首个开源的软件定义网络控制器NOX(Network Operating System)在其文献$^{[7]}$中指出,“现代操作系统通过提供对资源和信息高层抽象的可控访问…使得程序可以在各种计算硬件上安全和高效执行复杂任务”,NOX就是将操作系统思想拓展到了网络设备管理中。
|
||
\begin{figure}[htbp]
|
||
\centering
|
||
\subfigure[传统操作系统]{
|
||
\centering
|
||
\includegraphics[width=0.4\linewidth,height=2.5cm]{fig2-5/tos.png}
|
||
}\
|
||
\subfigure[软件定义网络$\lbrack$x$\rbrack$]{
|
||
\centering
|
||
\includegraphics[width=0.5\linewidth, height=2.5cm]{fig2-5/sdn.png}
|
||
}
|
||
\caption{操作系统与软件定义网络架构的类比}
|
||
\end{figure}
|
||
|
||
将操作系统“功能可编程”、“资源虚拟化”的思想拓展到存储、安全、数据中心等具体领域,我们就得到了软件定义存储、软件定义安全、软件定义的数据中心等概念。进一步,随着操作系统由计算机软硬件之间的桥梁、人与计算机之间的桥梁拓展到云边端、人机物之间的桥梁,其定位将由单个计算机“管家”演化为支撑“软件定义一切”的运行平台。传统操作系统架构面向的是信息空间内孤立计算结点,这一沿用数十年的架构将面临如下两个方面的挑战。
|
||
\begin{itemize}
|
||
\item 从“精确控制”到“连接协调”的挑战。未来的人机物融合系统将是大规模、网络化的计算系统,虽然每个节点上仍将运行传统的节点操作系统,在节点内部通过对资源实施严格精确控制来达到资源虚拟化、功能可编程的目的,但这种精确控制机制很难直接应用到网络层面。事实上,这种简单放大的思路在30年前的Amobea等分布式操作系统实践中就已经证明很难奏效(参见本书历史篇§3.4“中间件”一节)。根本原因在于网络化系统具有开放和复杂系统的特征,其所涉及的实体往往跨越多个管理域,系统边界也随时间演化而不断发生变化,很难构建静态不变的控制中心,或是明确稳定的自顶向下层次化结构。在这种场景下,更为妥当的方式将是 “连接协调”,即通过按需聚合和动态协同来打破不同节点之间的壁垒,统一管理并优化利用计算、数据甚至物理世界各种资源。从“精确控制”到“连接协调”的方式的这一转变,将从根本上动摇现有操作系统的架构,并催生新一代、运行于节点操作系统之上的网络操作系统。
|
||
\item 计算、通信、控制三元融合场景的挑战。今天广泛使用的Windows、Linux等操作系统在架构上深受首个现代意义上操作系统--Unix的影响。它们运行于单一计算结点范围内,内部大致可划分为资源管理、系统调用、人机接口等层次。这种架构针对信息空间内部的孤立计算结点设计,很难支撑泛在化、智能化、网络化的新型应用场景。具体而言,在计算维度上,单一的本地计算将向云边端一体化计算、人机物协作计算、智能和机器学习计算等新型场景变迁;在通信维度上,5G等新型网络的出现使得网络时延和吞吐量得到极大改善,可望触发移动和嵌入式操作系统的新一轮革命;在控制维度上,物联网、机器人等与物理世界紧密融合的计算设备涌现,使得“功能可编程”将突破信息空间范畴,需要在操作系统架构设计层面上考虑物理空间约束和对物理空间的影响。
|
||
\end{itemize}
|
||
\subsection{泛在资源的高效虚拟化和灵活调度}
|
||
文献$^{[1]}$给出了“普适操作系统”的概念,指出未来的操作系统不仅仅是IT操作系统,也将成为物理世界和虚拟世界的操作系统,在今天已经初露端倪的机器人操作系统、车辆操作系统、物联网操作系统等基础上,校园操作系统、城市操作系统、家庭操作系统等可望在将来成为现实。在这一背景下,操作系统的核心功能――资源虚拟化和调度的实现机制面临一系列挑战(图\ref{fig2})。
|
||
|
||
首先,高性能处理器、新型存储器件、高速网络互联设备等快速发展,使得经典的计算资源虚拟化和调度机制面临挑战。例如,多核和多芯片计算机系统中非一致性内存访问架构使得传统基于页的虚存系统面临挑战;张量处理器等人工智能新型加速器的出现,亟待相应细粒度的虚拟化技术支持;非易失性内存的应用使得内存中的某些数据不再需要存储到硬盘,对传统类文件系统架构带来挑战;大规模分布式异构计算以及移动异构片上系统,对Linux等多线程共享存储的单内核结构提出挑战;100G及以上以太网链路在大规模数据中心的普及,网络带宽增长速度超越CPU处理能力增长速度,操作系统网络协议栈面临挑战;等等。
|
||
\begin{figure}[htbp]
|
||
\centering
|
||
\includegraphics[width=\linewidth]{fig2-5/mmm.png}
|
||
\caption{人机物融合新型资源的虚拟化和调度所面临挑战}
|
||
\label{fig2}
|
||
\end{figure}
|
||
|
||
其次,如何为人机物融合计算中的各类新型异构资源建立抽象,是未来操作系统需要解决的核心问题。本质上,操作系统和运行平台负责向应用提供“抽象”,并将这些“抽象”绑定到硬件祼机。数十年来,这一领域已经积累了诸如进程、线程、文件、内存页等一系列重要抽象机制,为现代操作系统奠定了基石。但是,未来操作系统所管理的资源将跨越人、机、物三元空间,涵盖物理资源、计算资源、数据资源等多种类型,现有抽象远远不能满足需求。因此,需要探索符合新型资源特点、切合其特性的抽象机制,并突破在单一计算结点、有一定边界的分布式系统、跨域开放式系统等不同尺度上维护这些抽象的方法机理。
|
||
|
||
再次,在操作系统支持下,物理资源将呈现物理与数字二像性,如何将信息空间内的抽象与物理空间内的实体绑定,并持续保持和校正二者之间的一致性,是操作系统泛在化以后产生的新问题。一方面,需要利用预建立物理模型、传感器实时数据、较大时空尺度上的运行历史等数据,集成多物理量、多尺度、多概率的仿真过程,实现物理资源到信息空间中实体的正向映射,以及“因果关联”的虚拟实体到物理资源的映射;另一方面,即使建立了相应的“数字孪生”关系,也要考虑物理域和社会域资源在管理和调度过程中的特有属性,例如动作的非精确性和动态性、固有的噪声等。
|
||
|
||
第四,如何使打破信息-物理世界间以及不同节点间的壁垒,按需聚合各类资源,是实现泛在资源优化利用的关键。如前节所述,未来的计算系统在微观尺度上仍将运行我们今天所熟悉的节点级操作系统,而在整个系统的宏观尺度上,资源管理模型将从“精确控制”向“连接协调”转变。虽然这一理念在中间件、网构软件等领域已经有了初步实践,但一系列实现机制层面上的开放问题仍有待解决,包括需要何种模型来协调跨域资源及其能力、如何在动态环境下维持相对稳定的“功能可编程”抽象、如何有效管理调度各种冲突及涌现现象等。
|
||
|
||
第五,需要深入理解未来泛在计算场景下应用模式的共性特征,为上层应用的“软件定义”提供适当的、相对稳定的编程接口。可以预见,未来泛在计算场景至少包括数据规模巨大、强调按需能力获取的“云-边”效用计算,资源需求动态变化、不确定性很强的智能计算,移动性强、承载设备多、续航要求高、迭代快的智慧城市、工业互联网等领域的协作计算,人与物相互驱动、相互协同的人机物统一计算等。这些泛在应用模式很多都处在探索阶段,需要理解和凝练应用模式的共性特征,进而通过编程接口支撑上层应用灵活实施软件定义。
|
||
\subsection{复杂软件系统持续适应演化的共性支撑}
|
||
近年来,以人机物融合系统为背景,有研究者提出了信息产业的“昆虫纲悖论”:一方面,未来物联网设备和应用场景将会像昆虫一样繁多,带来空前巨大的市场;另一方面,由于每种场景都存在其个性化需求和特点,针对场景所开发的软件系统将缺乏可拷贝性,导致边际成本显著提高,反过来制约产业的发展。要打破这一悖论,关键在于软件系统不能静态绑定到特定场景,而应当具备灵活适应场景的能力,在其生命周期内能够持续演化来应对环境和用户需求的变化。
|
||
|
||
软件适应能力将成为未来人机物融合软件系统的基本属性,而操作系统在支撑软件适应演化活动方面具有天然优势:从可计算性的角度而言,操作系统与下层硬件裸机一起组成了能够“操纵”应用软件执行的通用图灵机实现,这一“操纵”能力使得操作系统有可能驱动应用软件的适应和演化;从计算反射$^{[10]}$实现的角度而言,操作系统和运行平台是应用软件执行的“元层容器”,对于上层应用具有计算反射能力,例如获知上层应用和环境状态、维护系统化反映上层应用环境和状态的模型、对上层应用实施调整操作等。因此,操作系统和运行平台是驱动计算节点动态感知、自主学习、在线演化的理想载体,但这一地位也同时对平台设计实现提出了一系列挑战。
|
||
\begin{itemize}
|
||
\item 操作系统及其上应用的自主适应与学习赋能。从“网络就是计算机”到“场景就是计算机”,其蕴含的理念从计算资源聚合进一步拓展到了多样化人机物融合场景下的资源按需定制。要实现“场景就是计算机”,关键在于操作系统和其上应用需要具备主动适应新场景和场景变化的能力,包括:操作系统本身和其上应用都具有柔性体系结构,节点本身可以动态调整,节点与节点这间连接关系可以按需变化,并且携带有指导这些变化的元层数据;在操作系统和运行平台内部构建“感知-理解-调整”回路,能够捕获和理解环境及运行状态,进而据此进行应用配置生成、主动部署、参数和连接关系在线调整等操作;具有从过去的适应和演化动作及效果中持续学习的能力,从而突破预定义场景和决策规则的约束,使得操作系统及其上应用在适应场景和用户需求变化的维度上能够表现出一定的“智能”。
|
||
\item 大规模复杂软件系统的演化规律及其支撑机制。人机物融合场景下,许多软件系统已经达到了空前的规模。例如,互联网的前身ARPANET仅连接了4个节点,而2018年移动社交应用微信的月活跃用户数达到了10.8亿。规模上的量变引起质变,此类系统表现出了“系统之系统”、信息物理融合系统和“社会-技术”系统的特点,具有与单个节点或小规模分布式系统不同的演化规律,包括:复杂软件系统规模巨大,其海量状态数据之间存在着千丝万缕的联系,如何“去粗取精、去伪存真”,提取能够作为适应演化依据的运行态势数据;复杂软件系统中的节点通过“连接”形成了一个复杂网络,如何基于复杂网络中的交互掌握软件架构和运行大势;在由大量自治软件单元所组成的复杂软件系统中,适应性演化动作往往发生在单元、子系统、系统等多个尺度上,如何在群体层面上形成恰当的适应性演化行为,以及不同层次上的适应性演化如何相互影响;等等。
|
||
\item “人在回路中”的软件系统演化决策。软件是“由人开发,为人开发”的产品,人在软件生命周期各个阶段所发挥的作用不可替代,人是软件产品需求的提出者,也是需求落地实施的开发者,同时也是软件终端的使用者以及运行时的维护和升级者。因此,未来人机物融合软件系统适应性演化决策应当是软件和人相结合的方式,除了现有的规则、策略、机器学习等自动化方法外,“人在回路中”是其重要的特点,操作系统和运行平台如何通过集成DevOps工具和平台来有效支持人来发挥作用、同时又通过人工智能相关技术减少人主动干预的负担,是未来要解决的重要挑战。
|
||
\item “信息-物理-社会”空间的协同持续演化。复杂软件系统是典型的“社会-技术-物理”系统,软件将与其所在的社会和物理环境紧密融合在一起,相互作用、相互影响。这与传统的、完全在信息空间运行的软件有着质的区别。具体到基础性的、“操纵计算系统执行”的操作系统和运行平台层面,需要有能力支撑上层应用与物理世界和人类社会长期性的共同进化。这将显著扩展现有操作系统的内涵,带来一组极具挑战性的开放问题,例如:物理空间变化的频率远高于信息空间变化的频率,如何高效的适应物理空间的变化;利用人工智能算法来进行演化决策,一旦决策错误可能会直接在物理空间造成严重后果,其中的技术、法律甚至伦理问题如何解决;等等。
|
||
\end{itemize}
|
||
\subsection{人机物融合过程中的安全与隐私保护}
|
||
数十年来,“魔高一尺,道高一丈”,主流操作系统不断围绕系统用户认证、访问控制、数据安全、漏洞攻击缓解等方面进行安全增强。然而,安全与隐私保护是一种伴生技术,新的安全问题伴随新计算模式的涌现而不断产生。未来,随着5G通讯、移动互联、云计算与物联网的应用普及,人机物将广泛互联,在网络虚拟世界与现实世界的行为将实现虚实深度融合,导致信息系统的安全防御边界愈加模糊,面临的安全威胁在种类和数量上都将激增,用户隐私保护的难度显著增加。在未来人机物融合的过程中,作为信息空间与物理空间乃至整个社会进行统一信息处理的载体,操作系统及运行平台在安全和隐私保护方面的需求将面临一系列挑战:
|
||
|
||
首先,需要在大规模松耦合交互场景下建立虚实融合的信任关系。在未来人机物深度融合的时代,将会有大量物理设备与应用软件接入到运行平台,以数字身份作为运行主体在系统中发挥作用。随着越来越多的现实世界行为被迁移到网络虚拟空间进行处理,在数字世界中如何对纷繁芜杂的虚拟社会关系进行准确刻画并实施严格管理,是构筑未来安全可信数字空间的所必须要面对的挑战。在此基础上,要建立数字身份的信任关系,还需要在平台层面上对数字实体在虚拟世界的行为进行全面、如实地记录,为准确刻画数字世界实体间的信任关系提供有力依据。并且,由于现实社会中主体之间关系的大规模、松耦合特性,原有的集中式管理方式对人机物融合系统的实体管理将无法适用,需要实现管理的弱中心化,基于众包、基于区块链等新型信任关系构建方法已在操作系统领域崭露头角。例如,IBM的面向区块链的分布式操作系统Hyperledger Fabric可以利用区块链来支撑分布式应用运行,并且通过模块化的共识协议来使得系统可以灵活适应不同的应用场景和信任模型。
|
||
|
||
其次,需要实现人机物融合场景下的严苛安全和隐私保护需求。人机物融合场景下计算节点众多、数据传输分散,诸如边缘计算等以“计算尽可能靠近数据的源头”为基本理念的计算模式将走向前台。而这些新的计算模式由于其服务模式的复杂性、实时性,数据的多源异构性、感知性以及终端的资源受限特性,传统数据安全和隐私保护机制将很难高效应用。同时,由于移动终端的资源一般都比较有限,其所能承载的数据存储计算能力和安全算法执行能力也有一定的局限性。如何将传统的隐私保护方案与边缘计算环境中边缘数据处理特性相结合,从数据隐私、位置隐私、身份隐私等多个方面入手研究相应的保护方案,是未来操作系统安全与隐私保护领域面临的重要挑战。同时,为了支撑广泛、大规模的人机物融合和互联,需要突破现有操作系统安全和隐私保护的被动防御机制、打破“信任篱笆”,强化安全与隐私保护的主动性与支配性,在利益与风险之间权衡,既关注更强、更灵活的隐私保护,又支持网络资源共享和互联互通。
|
||
\section{研究内容}
|
||
如5.1.1节所述,未来操作系统分成两种类型:节点操作系统和网络操作系统。前者是今天操作系统的后续者,在有明确边界的节点范围内,实现资源虚拟化和功能可编程;后者运行于节点操作系统之上,实现网络环境下人机物异构资源聚合和优化管理,支撑各种类型、不同尺度的泛在应用。本节将以这一分类为依据,分别阐述节点操作系统(§2.1-§2.3)和网络操作系统(§2.4-§2.6)的研究内容,并在§2.7、§2.8、§2.9和§2.10中专门阐述物理和社会资源管理、操作系统和应用的适应和演化、操作系统生态链构建相关研究问题。
|
||
\subsection{支持泛在应用和新型硬件的节点操作系统}
|
||
节点操作系统是未来操作系统生态中的基石。过去60年中,大型主机、个人计算机、实时嵌入设备、手持移动设备、可穿戴和物联网设备等不同类型计算节点的出现,以及相应应用场景的普及,持续推动着节点操作系统技术的发展。针对未来人机物融合环境中网络资源、存储资源、数据资源、计算资源、传感资源等海量异构资源,节点操作系统将进一步探索以“软件定义”的方式实现资源的虚拟化和柔性调度的方法机制,通过编程接口支撑各类泛在化、网络化和智能化应用。另一方面,新型应用对算力和存储性能等多方面的要求导致新型异构硬件的不断出现和演化,如图形处理器、张量处理器、非易失性内存、远程直接内存访问等。操作系统自身需要适应这些新型硬件发展,进而研究异构计算、内存计算等新型运行平台架构,实现技术架构升级和软硬件之间的深度融合优化设计。
|
||
|
||
此外,如何依托云计算等后台支持,构建跨终端、体系化的操作系统平台,使得用户在不同平台上获得一致化的用户体验和设备自由切换能力,也是泛在计算的重要使能机制。典型案例是谷歌继移动操作系统Android和轻量级桌面系统ChromeOS之后正在研制的跨平台Fuchsia操作系统,其目标是能够覆盖嵌入式、终端、平板和桌面等所有平台。
|
||
\subsection{面向特定应用领域的节点操作系统优化技术}
|
||
特定领域的节点操作系统实现技术将进一步突破。一方面,针对复杂环境对智能终端的高可靠、低功耗、强交互、智能化和高安全等方面的迫切需求,突破高可靠终端操作系统体系结构、多场景自适应的电源管理优化技术、多种生物特征认证增强技术、资源受限环境下的深度学习适配优化技术,构建具备高可靠、低功耗、强交互、智能化和高安全能力的新一代智能终端操作系统。另一方面,针对嵌入式计算中安全关键、任务关键、非关键等任务混合运行及其安全隔离问题,研究混合任务确定性调度、混合系统实时响应、混合任务间高效通信机制等技术,形成具有确定性保障能力的嵌入式混合关键任务操作系统保障机制,满足嵌入式计算在复杂环境中对系统实时性、安全性、可靠性的严酷要求。
|
||
\subsection{软硬件结合的节点操作系统安全防护技术}
|
||
如何结合处理器和硬件平台的特点,设计新型安全高效的操作系统结构,是节点操作系统技术另一主要研究内容。当前,基于CPU的可信计算空间隔离和基于TPM芯片的可信计算技术为可信软件执行提供了硬件级的执行验证,这些技术都从操作系统底层提供了有力的可信执行支持,未来操作系统安全研究将利用这些先进技术来降低漏洞给应用带来的安全风险,发展软硬协同的操作系统安全攻防对抗模式,变被动响应为主动防护,夯实信息系统的安全基础。具体而言,需要突破软硬件高效协同的安全体系结构设计、安全防护模型和方法、跨域交互机理及优化方法和基于模糊测试的内核安全性测试等关键技术,结合硬件平台提供的多层次特权防护、资源分区隔离等安全能力,解决软硬协同的高安全操作系统设计中的核心问题。
|
||
\subsection{面向新型应用和部署模式的资源虚拟化技术}
|
||
随着云原生应用架构的不断发展和应用,以“函数即服务”(FaaS)为代表的无服务器计算(Serverless)等计算模式和边缘计算等应用模式给传统操作系统和虚拟化架构带来了挑战。首先,虚拟化技术需要能够在支持多租户隔离的前提下实现高密度的资源虚拟化。以在边缘计算场景为例,与集中式云数据中心不同,可能需要在边缘的十几个服务器上分别支持数千种不同的服务,当前已有的基于容器的轻量级虚拟化技术尚不能完全满足。其次,在无服务器计算和边缘计算等场景中,应用对资源的需求是高度动态变化的,这给虚拟化的性能提出了苛刻要求,需要探索新的轻量级虚拟化架构和优化机制。再次,部分云计算应用开始出现向微服务应用发展的趋势。这意味着软件架构进一步地解耦,单个镜像上运行的业务更加专一。因此,当前提出了 Unikernel等机制来大幅度精简冗余模块来提高虚拟机的启动速度,但虚拟化场景下的适用性和成熟度还需要进一步提升。最后,计算资源之外的其它资源(如GPU、存储、网络等)专用虚拟化技术需要进一步探索。
|
||
\subsection{网络环境下跨结点的资源高效按需聚合技术}
|
||
“计算的泛在化”意味着操作系统和运行平台的作用范围突破了传统单一计算结点范畴,需要在广域环境和广义的计算空间内调度各类资源,为上层软件提供相对稳定的抽象,这是未来操作系统和运行平台所面临的重大挑战,而资源聚合及统一管理优化是网络操作系统实现这一目标的手段。在计算系统规模持续增长的情况下,需要突破海量虚拟机资源的高效管理、虚拟机间通信优化、自适应的虚拟机在线迁移及动态部署、共生虚拟机间共享内存的弹性管理及优化、虚拟机访存效率优化等技术,实现跨结点的高效分布式资源调度。另一方面,网络操作系统中往往没有明确、固化的控制中心或层次结构,跨结点的“资源虚拟化”和“能力可编程”主要依靠“连接协调”、通过自底向上的方式来实现。如何借鉴社会系统、经济系统、生物系统等复杂系统机理,实现上述目标,也是此类操作系统面临的挑战。
|
||
|
||
在跨结点的资源按需聚合方面,未来的一个重要应用模式是“云-边-端”协同模式。因此,需要面向现代网络化信息支撑体系的发展趋势,探索以资源虚拟化、服务云化、前后融合为基本特征的“云-边-端”协同操作系统柔性结构设计与优化技术。研究“云-边-端”高效资源协同调度框架、基于云边端协同和多目标优化的任务调度技术等,解决复杂环境给软硬件资源管理带来的挑战。
|
||
\subsection{虚拟化和多租户条件下的主动防御技术}
|
||
其次,需要抵御虚拟化和多租户等新型运行支撑技术带来的安全风险。未来,更多的服务被整合在单一运行平台上,这些服务中可能包括了来自不同租户的不同安全等级的信息,必须根据用户需求对应用系统的硬件、软件、数据、网络、存储等不同层面资源实现安全隔离。同时,为了提高资源利用效率,运行平台根据资源使用情况进行动态调度,这种动态变化的环境将显著增大了安全隔离的难度。目前主要通过底层的虚拟机监控器Hypervisor来负责实现虚拟机的隔离,为用户提供自底向上的虚拟化软硬件运行环境,具备较强的隔离性。而为了提高服务运行性能,以Docker为代表的轻量级虚拟化容器技术也被广泛应用,相对于虚拟机的强隔离性,容器技术则是以弱隔离性换取性能的提高。在应用虚拟化技术的过程中,隔离性与性能之间的取舍、动态变化下虚拟计算资源的安全复用、Hypervisor层的虚拟机监管、虚拟机逃逸防护等都成为必须要面对的挑战。同时,虚拟化技术还需要对软件定义网络在数据中心内部的网络安全管理提供支持,通过虚拟网关等技术对虚拟化数据流进行安全监控,这些虚拟设备能否安全使用都将对系统安全性产生深刻的影响。
|
||
\subsection{物理和社会空间资源的抽象和管控技术}
|
||
操作系统的“资源虚拟化”能力来自于其对资源的抽象、封装和调度的能力。传统操作系统针对的是信息空间内部的资源 ,而如何表达和管理各类高度异构、动态变化的物理和社会空间资源,是未来泛在化操作系统需要应对的问题。在此基础上,在认知、物理和信息空间三者之间,如何刻画、检验、保持、校正多模型结构之间定性与定量一致性,进而实现具有“数字孪生”的物理和社会空间资源的调度和管理,是未来操作系统重要研究内容之一。
|
||
|
||
此外,未来操作系统的编程接口不仅涉及到计算资源的“软件定义”,可能包括各种可传感物体对象、智能无人系统等各类物理资源,甚至向其他具有“数字孪生”特性的经济、社会和生产生活资源,其接口形式、接口实现机理等都是开放的问题。
|
||
\subsection{人机物融合的操作系统架构演进技术}
|
||
面向未来“人-机-物”融合环境中网络资源、存储资源、数据资源、计算资源、传感资源等海量异构资源,以“软件定义”的方式实现资源的虚拟化和柔性调度,通过编程接口支撑中心式的云计算和分布式的分散计算模式以及各类智能应用。适应人工智能芯片、非易失性存储等硬件发展,研究异构计算、内存计算等新型系统软件架构,实现技术架构升级和软硬件之间的深度融合优化设计。
|
||
\subsection{运行平台支持的软件在线适应与演化技术}
|
||
操作系统和运行平台是能够支撑上层应用适应和演化的天然基础设施,但由于在线演化的需求是在“软件作为基础设施”过程中逐渐显现的,其实现机理也是目前操作系统和运行平台领域研究相对薄弱的环节,需要从运行状态把握、群体智能决策调整、宏观和微观演化效果评估等角度开展研究。相关研究内容已经在重大挑战性问题的5.1.3节中给出,本节不再赘述。
|
||
\subsection{基于开源和众包的操作系统生态构建技术}
|
||
随着互联网的深入发展和广泛应用,操作系统和运行平台的研发出现了新的特点,其中开源和众包对操作系统的发展产生了深远影响。它们一方面改变了操作系统产业的商业模式,服务化成为趋势,操作系统厂商如苹果、微软纷纷从销售产品获利转型为提供服务获利的模式;另一方面促进了面向行业或应用场景需求的专用操作系统的发展,降低了操作系统研发定制的门槛,使得更多的厂商可以参与到操作系统生态链构建中来。但是,开源和众包模式的引入,也为操作系统的开发带来了一系列问题。例如,在使用开源资源时,如指导思想和方法不当,可能导致在产品中包含若干“黑盒子”,引入代码不可控、产品升级被动等风险;产品如过度依赖开源,发展途径就会被开源主导,创新的空间将被大幅约束;等等。如何在操作系统生态链构建过程中最大限度发挥开源和众包的长处,是需要深入研究的问题,相关的研究方向包括操作系统代码来源链的建模和分析、开源许可证的合规性及冲突分析、多来源缺陷数据的定性与定量统计分析等。
|
||
\section{结束语}
|
||
无论是今天还是未来,操作系统都是“软件作为基础设施”的集中体现,也是“软件定义一切”能力的基石。在计算泛在化背景下,未来的操作系统将突破当前单机操作系统这一狭义形式,向支撑人机物融合、具有“资源虚拟化”和“功能可编程”特点的泛化运行平台过渡。受这一趋势所推动,一系列重大挑战性问题涌现,包括支持软件定义的新型运行平台架构、泛在资源的高效虚拟化和调度方法、软件系统持续适应演化的支撑机制、人机物融合过程中的安全与隐私问题等。本节对上述挑战的概念内涵、产生背景和展开后的具体问题进行了详细阐述,并在此基础上结合操作系统和运行平台领域当前研究热点,从未来的节点操作系统、网络操作系统等角度,对领域研究内容进行了梳理。
|
||
\section{参考文献}
|
||
[1] Mei, H., and Guo, Y.: Toward ubiquitous operating systems: A software-defined perspective, Computer, 2018, 51, (1), pp. 50-56
|
||
|
||
[2] Pezely, D.J., Almquist, M.D., Evenson, M.T., and Bricken, W.: Design and implementation of the meta operating system and entity shell. Technical Report, Human Interface Technology Lab, University of Washington, 1992.
|
||
|
||
[3] Román, M., Hess, C., Cerqueira, R., Ranganathan, A., Campbell, R.H., and Nahrstedt, K.: Gaia: a middleware platform for active spaces, ACM SIGMOBILE Mobile Computing and Communications Review, 2002, 6, (4), pp. 65-67
|
||
|
||
[4] Quigley, M., Conley, K., Gerkey, B., Faust, J., Foote, T., Leibs, J., Wheeler, R., and Ng, A.Y.: ROS: an open-source Robot Operating System. Proc. ICRA workshop on open source software2009 pp. 5
|
||
|
||
[5] Tuttlebee, W.H.: Software-defined radio: facets of a developing technology, IEEE Personal Communications, 1999, 6, (2), pp. 38-44
|
||
|
||
[6] Kreutz, D., Ramos, F., Verissimo, P., Rothenberg, C.E., Azodolmolky, S., and Uhlig, S.: Software-Defined Networking: A Comprehensive Survey, PROCEEDINGS OF THE IEEE, 2015, 103, (1), pp. 14-76
|
||
|
||
[7] Gude, N., Koponen, T., Pettit, J., Pfaff, B., Casado, M., McKeown, N., and Shenker, S.: NOX: towards an operating system for networks, ACM SIGCOMM Computer Communication Review, 2008, 38, (3), pp. 105-110
|
||
|
||
[8] Northrop, L., Feiler, P., Gabriel, R.P., Goodenough, J., Linger, R., Longstaff, T., Kazman, R., Klein, M., Schmidt, D., and Sullivan, K.: Ultra-large-scale systems: The software challenge of the future, Technical report, CMU Software Engineering Institute, 2006.
|
||
|
||
[9] Soules, C.A., Appavoo, J., Hui, K., Wisniewski, R.W., Da Silva, D., Ganger, G.R., Krieger, O., Stumm, M., Auslander, M.A., and Ostrowski, M.: System Support for Online Reconfiguration, USENIX Annual Technical Conference, 2003.
|
||
|
||
[10] Maes, P.: Concepts and experiments in computational reflection, ACM SIGPLAN Notices, 1987, 22, pp. 147-155
|