software-strategy-book/Ch2-7-DomainApplication.tex

108 lines
36 KiB
TeX
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

软件系统已经成为各行各业的重要基础设施,包括单纯的信息基础设施、软件嵌入的物理设备、以及软件提供的服务设施等。可以预计,基于这些软件基础设施,未来的应用软件系统将以面向领域的人机物融合场景计算为主要呈现形式。即应用软件系统将使计算服务嵌入各行各业以及民众生活,使计算从单纯的赛博空间进入人机物融合空间,综合利用人类社会(人)、信息空间(机)和物理世界(物)等的资源,通过协作进行领域特定的个性化计算,实现领域价值。
人机物融合场景下的软件应用系统起源于2006年前后出现的信息物理融合系统Cyber-Physical SystemsCPS\index{信息物理融合系统Cyber-Physical SystemsCPS}以及更早兴起的物联网Internet of Things, IoT\index{物联网Internet of Things, IoT}。早期研究侧重于网络化嵌入式系统和控制系统等,包含物理资源层、传感网络层、计算控制层、和价值服务层,物理资源层通过传感网络层连接到计算控制层;计算控制层则根据感知获得的事件、日志等,并根据相应的数据处理和行为决策逻辑向外提供服务。这类系统明显的具有面向特定应用领域,实现场景计算的特征,譬如智能交通、工业制造、无人驾驶、健康医疗等。
CPS与IoT技术的结合使因特网能感知现实世界通过和云计算的融合使嵌入式系统与云数据中心及云服务连接起来进而支持更高层服务和控制的实现通过与云计算\index{云计算}、雾计算\index{雾计算}及边缘计算\index{边缘计算}深度融合,使能“人”的融入,从而形成了新的应用软件系统形态。随着人的因素在系统运行过程起越来越重要的作用,这类系统逐渐发展出泛在化、社会化和智能化的典型特征。
\ref{fig1}给出了这类面向领域的应用软件系统的通用架构。其含义是,第一,应用场景及其各类物理设备、人及其互连关系等形成面向领域的应用软件系统的上下文元素(或场景元素),当出现计算需求时,与需求相关的上下文元素形成与需求对应的上下文。第二,自适应控制层提供场景元素的动态接入/撤出、场景元素的动态发现、场景元素的融合管理、以及场景元素的社会化协同等机制,形成或动态演化出能满足当前应用需求的系统。第三,所组成的应用系统通过和其上下文元素的交互,实现需求所要求的价值。因此,这类应用软件系统可成为面向需求和场景的软件系统,表现出异构多样化设备的可接入、异质构件的互操作、以及个性化需求的可满足性等,系统通过多样化感知设备使能对现实场景的感知和直接的作用。
\begin{figure}[htbp]
\centering
\includegraphics[width=\linewidth]{fig2-7/marc.png}
\caption{面向领域的应用软件系统元架构}
\label{fig1}
\end{figure}
本章选择四个有代表性的典型应用场景,分别阐述其挑战性问题和主要研究内容。
\section{无人自治系统及其群体系统}
无人自治系统UAS是机械系统计算技术传感器和软件的融合包括无人地面车辆、无人飞行器、智能机器人等。其典型特征是能自主感知其周边环境的状态并根据其环境状态通过其内部搭载的计算部件理解环境状态并作出对下步动作的决策并将决策结果直接实施到其机械系统上其各个部分的工作全部通过软件来协调完成。比如无人地面车辆UGV是在与地面接触且没有人在场的情况下运行的车辆一般配备一组传感器以观察其周边环境并自主决定其行为。
无人自治系统其核心是其环境和情景的可感知性和行为的自治性典型的具有如下能力1环境感知能力能收集其周边环境的信息形成对环境的认知例如获得建筑物内部的结构检测环境中感兴趣的物体例如人和车辆2规划和自主行为能力不同功能的无人自治系统有不同的规划和行为能力比如无人地面车辆可以在没有人工导航的情况下自主在航点之间行走无人飞行器可以在没有人工导航的情况下自主在航点之间飞行智能机器人可以在没有人工控制的情况下自主完成为它设定的任务等等3自我修复能力无需外部协助即可自行修复和自我定期维护4环境安全保护能力能在完成设定任务的同时避免对人员财产或自身造成伤害5自主学习能力。包括在没有外部帮助的情况下学习或获得新功能根据环境调整自身的行为策略在没有外部帮助的情况下适应环境培养针对任务目标完成的道德意识。
自主无人系统的群体协作系统是从单体自主无人系统扩展而来的。除了单体自主无人系统具有的特点外群体协作系统还具有1功能分布性即不同功能的自主无人系统协同工作以完成更复杂的任务通过共享资源扩大完成任务的能力范围2空间分布性多个自主无人系统可以分布在工作空间的各个区域同时工作提高完成任务的效率增强系统的鲁棒性。
\subsection{关键技术挑战}
从软件的角度看,无人自治单体和群体系统的关键技术挑战包括:
\begin{itemize}
\item 环境感知的实时性和场景理解的综合性:无人自治系统的上下文环境是物理世界,物理世界的时间动态是不可逆转的,这对系统的时间性提出了严格的要求,信息获取和提交的实时性影响系统判断与决策精度。无人自治系统的环境具有多个方面的属性,系统一般搭载多个设备分别采集部分信息,分布信息的实时关联和准确汇聚也是构造软件系统的关键挑战。场景感知的目的是对场景的理解,只有在准确理解了。其信息采集的实时性、多维信息关联的一致性、以及场景理解的准确性是无人自治系统的一大挑战。
\item 行为决策的适应性和系统控制的鲁棒性:物理世界不是完全可预测和可控的,无人自治系统需要具备动态自适应能力,即使遇到意想不到的情况,也要保证系统的鲁棒性。同时还必须满足其可靠性和效率等方面的需求。更重要的是,当系统用于安全攸关或者危险环境中时,由于系统实施的控制行为,将对物理环境产生直接的作用效果,系统需要具有强的内生安全性,并保证其行为不会对环境造成威胁。
\item 群体无人自治系统的通信、协作和冲突消解:群体无人自治系统是由多个无人自治系统按照一定的结构或关系构成的一个整体,群体系统的结构决定单个系统间的交互框架,决定单个系统间的信息和控制关系。两种常用的结构是:集中式和分散式。无人自治系统形成群体的目的是完成需要协作才能完成的任务,建立有效的结构是任务完成的关键,有效的结构可以增强自主无人群体系统的协作程度。如何根据任务的复杂性和不确定性,建立动态自组织群体结构是群体有效通信和协作的关键挑战。群体无人自治系统在任务执行过程中,常常出现任务冲突、空间冲突或路径冲突等,一旦发生冲突很容易引起系统的混乱,影响系统的性能,群体无人自治系统的在线冲突消解和有效的行为协调也是本研究方向的一大挑战。
\end{itemize}
\subsection{主要研究内容}
无人自治系统首先是一个完成特定功能的系统,其无人自治特性体现在在没有人干预的情况下根据其所处的环境自主决定如何更好地完成其功能。因此,其主要研究围绕自主决策这个特性展开,即主要关注“环境-监测-分析-规划-实施-环境”这样一个决策回路,其中环境指系统所处的现实世界,该回路中的所有活动以系统所拥有的知识(包括环境知识和行为决策知识)为基础,系统根据知识去感知环境、分析场景并进行行为决策和采取行为。具体包括:
\begin{itemize}
\item 环境感知和场景理解(监测):指无人自治系统对环境信息的感知和分析能力。环境感知包括三个方面:空间感知和建模,静止物体感知和运动物体感知。无人自治系统的环境感知依赖多种传感设备,第一,需要分离空间感知能力和环境实体感知能力,研究空间建模方法以及系统和空间的位置关系判别方法;第二,对静止物体和运动物体的感知,包括物体探测和物体识别,实时捕捉物体和空间及物体和物体间的关系,在系统中建立空间状态的镜像;研究运动物体行动轨迹的追踪方法,变化物体的变化性分析和预测方法;第三,需要研究如何组合空间状态感知和(静止/运动)物体感知和认知,并运用时序关联建立综合感知的技术,研究理解系统所处环境的场景的方法。
\item 安全风险因素识别和风险评估指根据系统所处的环境场景研究系统环境安全因素的监测和安全风险评估方法。根据不同特定领域的基础研究提取安全因素的特征工程技术、深度学习技术、强化学习技术等研究安全因素的分类并确立风险等级。这里的安全因素是广义的安全关注点和无人自治系统的应用场景相关包括坏境给系统带来的风险和系统对环境带来的风险两个方面需要研究以应用场景为依据的安全关注点提取和建模方法建立安全因素分类体系和因果关系模型这是系统知识库的重要部分。在此基础上研究基于HAZOP原理的安全风险评估方法。
\item 行为优化和自主决策:无人自治系统工作过程的首要矛盾就是既要采用最佳策略完成预定任务又要规避各种可能的安全风险。由于系统常常处于动态变化的环境中,行为(包括系统运动行为和交互行为)优化和自主决策(解决已有行为规划是否需要改变、改成什么、如何改变等问题)成为关键特征。为了支持自主决策,需要研究针对系统应用领域和场景的自适应规则和策略的提取和建模,这也是系统知识库的另一个重要组成部分。值得研究的问题包括:环境因素到系统行为到系统任务间的关联关系建模,基于关联关系的任务完成度和安全风险的推理和分析,以及基于系统决策知识的自适应行为优化。
\item 自主学习和模型演化:赋予系统“学习能力”是为了使能系统能充分应对复杂多变的环境,使系统能根据运行时的经验,支持模型(包括系统环境模型和系统能力模型)的演化,自动提升系统的能力,提升系统的性能。但无人自治系统引入自主学习能力,还有很多问题需要研究,包括:学习和自主决策的关系、学习能力的需求识别、系统不同活动与自主学习能力的集成原理和方式、不同活动和不同学习方法的集成、学习构件的任务定义和交互定义、等等。更重要的是,基于控制论的无人自治系统引出了各种源于标准控制系统的体系结构,基于学习的无人自治系统自适应也可能需要以学习能力为中心的新的系统体系结构。
\item 群体协同和动态合作在复杂任务场景下多无人自治系统依赖任务分解和自主行为进行群体协作和动态合作提高任务完成的质量和效率。需要研究的内容包括1群体中个体的在线调度问题需要将动态观测需求常态化研究有效的机制来制定任务规划/重规划的决策时间点、机制策略、规划算法等。其难点是需要综合考虑个体动态环境和计算能力如其他个体状态信息获取延迟滞后、任务发布与任务到达间的动态不确定的时间差、应急任务的时效可用性、个体计算能力对任务的应急响应性能等2针对异构群体的任务分解和协同问题包括任务驱动的群体配置和协同架构机器协同算法机制架构的有效性度量和成本分析机制等群体架构的优化方法等有效分解复杂任务确定协调控制策略, 控制任务的求解过程, 实现个体间的有效协调配合。
\end{itemize}
可以预计,群体无人自治系统的发展,将推动包括智能制造、智能交通、智能农业、智能医疗、智能城市、国家安全等的重大变革。但无人自治系统的全面应用还需要很多工程性的工作,比如,建立以数据驱动的无人车间/智能工厂的体系架构和标准体系,形成人机协同的无人车间/工业智能系统完整的体系、技术与标准,实现知识驱动的无人车间/智能工厂的广泛应用,攻克以无人自治系统为基础的智能装备全生命周期的高安全性、高可靠性、高实时性、高精确性等难题等。
\section{工业软件系统}
工业是推动科技创新、经济增长和社会稳定的重要力量。工业软件系统是指专用于或主要用于工业领域,为提高工业企业研发、制造、生产管理水平和工业管理性能的软件系统,包括嵌入式工业软件、协同集成类软件、生产控制类软件、生产管理类软件等四大类。工业系统利用信息技术将工业过程的控制逻辑化、管理流程代码化,从而驱动装备和管理业务按照既定的逻辑自动高效地运行,并实现预先设定的功能。工业软件系统的应用可以提高产品价值、降低企业成本进而提升企业的核心竞争力,是现代工业装备的大脑,也成为支撑第四次工业革命的核心。
云计算、物联网和人工智能正逐步成为影响工业软件发展的核心技术。工业互联网的底层是工业通信网络和传感器网络随着NB-IoT和智能传感器的快速发展CPS(信息物理融合系统)已成为新的热点。SaaS应用已经成为管理软件的发展方向但工业软件因其特殊性不适合采用公有云方式但可以通过混合云方式将企业敏感数据和业务环节进行剥离进而实现企业整体的数字化改造。基于大数据和机器学习的工业智能通过整合企业相关数据与人工智能算法实现数字驱动企业运营。
工业软件目前呈现如下的应用趋势1通过智能工厂项目建设提升数字化竞争力建设数字工厂的核心首先是完善的信息化规划其次是对各项信息化应用的有机集成2通过协同研发平台优化研发管理体系优化研发管理体系的核心在于数据和流程的标准化以及跨企业研发平台的建设思路3推广工业机器人在垂直行业的应用其核心在于对传统工艺的理解和改造4应用商业智能实现数据驱动企业发展在商业智能系统中实现全员统一查阅企业视图全面预测数据洞察驱动的业务流程最佳化形成统一的基础架构预先构建的分析解决方案演变成企业绩效管理系统。
\subsection{关键技术挑战}
工业物联网是第四次工业革命的核心基础设施,从软件系统的角度看,工业物联网特殊性体现在工业大数据上,其中包括工业信息化数据、机器设备数据和产业链跨界数据等,其中数据的采集环境多样,数据采集具有很高的准确性和实时性要求,并且大部分数据具有时序特性。工业软件系统在人机物融合应用场景下的主要挑战,来自于对上述四大类软件系统进行无缝集成的需求。具体挑战包括:
\begin{itemize}
\item 贯穿工业生产全过程的体系化的软件系统之系统:流程工业涉及多个方面,既涉及与企业价值相关的产品生产需求,又涉及原材料提取、传递及其通过物理、机械和/或化学方式转化成其他产品的过程。当工业生产的每个环节都配备传感和通信设备之后,为了实现智能制造,首先需要构建各个生产环节上的独立的信息系统和控制系统,比如生产管控系统、安全环保系统、供应链管理系统、能源管理系统、资产管理系统等。但如何汇聚这些独立的软件系统和物理设备,用统一的机制综合物流、能源流、资金流,形成工业生产全过程全方位的动态镜像,从而实现基于生产数据和管理数据多维度共享基础上的工业智能,不仅是软件技术和软件体系结构上的挑战,也是先进控制和管理上的挑战。
\item 工业控制系统的安全性和系统失效的风险性:一方面,相对独立的工业控制系统越来越多地与开放的管理系统互联,在实现数据共享、智能决策的同时,也为工业控制系统安全带来隐患与威胁。这类系统中的控制协议,大多在开始设计时只考虑如何能满足要求的效率、实用性和可靠性,而忽略了安全性要求。如何增强工控系统的控制协议的安全性,成为建立并实施一体化工业软件系统之系统的最大忧患。另一方面,工业系统中包含了成千上万的物理设备,这些设备很多具有很高的损耗率和失效率,而这些常常导致巨大事故,其系统设计时的风险分析、运行时的失效监测数据实时准确采集、以及精确的风险预测和溯源分析等等,对软件系统的设计和运行支撑都带来挑战。
\item 海量多维流数据的实时处理。工业软件系统需要面对的是超高的数据通量和低质乱序的传输同时需要满足的需求又是高质全序查询与复杂分析。只要系统处于运行态检测设备7天24小时不间断地产生数据数据采集频率高而且量大。软件系统需要管理千万条时间序列数据并以每秒百万至千万点的速度处理数据。更加困难的是这些数据基本都是异构的而且从异地采集的常常出现表头缺失、数据错列、数据缺失、数据串行等问题需要高效正确的纠错算法等等这些都是系统设计和运行时的挑战性问题。
\end{itemize}
\subsection{主要研究内容}
工业控制软件系统包括如下研究内容:
\begin{itemize}
\item 实时准确的信息感知和数据采集。流程工业生产过程优化调控和经营管理优化决策需要准确的信息,其难点是如何实现从原料供应、生产运行到产品销售全流程与全生命周期资源属性等的快速获取与信息集成。因此,原材料与产品属性的快速检测、物流流通轨迹的监测以及部分关键过程参量的在线检测是实现流程工业智能优化制造的前提和基础。
\item 生产运行监测和动态优化决策。流程生产计划的不确定因素众多,原料采购价格和市场需求多变,给生产运行和经营管理的决策带来难题。核心要解决如何深度融合市场和装置运行特性知识进行管理模式的变革,以大数据、知识型工作自动化为代表的现代信息技术为制造过程计划和管理的优化决策带来了契机。
\item 以软件为核心的生产全流程自动协同控制。流程工业制造采用由经济优化、计划调度、先进控制、基础控制等不同功能层组成的分层递阶结构,如何根据实际过程的动态实时运行情况,从全局出发协调系统各部分的操作,成为生产过程优化调控的核心。软件系统需要将物质转化机理与装置运行信息进行深度融合,建立过程价值链的表征关系,支持生产过程全流程的自动协同控制与优化。
\item 生产过程故障诊断与环境安全监测和预报。保证生产制造装备安全、可靠运行是保证生产制造全流程优化运行的关键,也是综合自动化系统正常运行的保证。需要软件系统集成传感、检测、控制以及溯源分析等技术,实现模型与数据驱动的流程工业过程运行工况的故障预报、诊断与自愈控制,以及生产制造全生命周期安全环境足迹监控与风险控制,实现绿色制造。
\item 高通量时序数据全生命周期管理、传输和利用。工业物联网的数据采集、管理和利用涉及跨越“云-网-端”三层体系架构,终端层需要支持高性能的写入、高压缩比的存储以及简单查询。场控层需要配备高效丰富的时间序列查询引擎。数据中心层需要能与大数据分析平台无缝集成,支持时序数据处理和挖掘分析。
\end{itemize}
\section{智慧城市系统}
智慧城市系统利用各种信息技术,将城市的系统和服务打通并集成,以提升资源运用的效率,优化城市管理和服务,以及改善市民生活质量。智慧城市系统是新一代信息技术在城市中广泛且深入应用的结果,其驱动力在于突破地域、部门或系统的边界,促进城市信息空间、物理空间和社会空间的深度融合,以此为基础向城市管理者提供城市规划管理的支持,并向市民提供泛在、周到的智能服务。智慧城市系统除了针对具体应用需求的应用系统外,还需要建立为这些应用系统提供共性支撑的基础支撑平台。在该平台的支撑下,具有不同功能的智慧应用系统,以及对智慧城市具有不同诉求和能力的组织和个人,密切协作,形成各展所长、相互支撑的共生生态系统。
\subsection{主要技术挑战}
智慧城市系统的主要技术挑战包括:
\begin{itemize}
\item 系统边界可伸缩,实现跨域信息系统互连互通。在城市信息化建设的初期,城市管理的各个部门独立开展信息化工作,建成了大批“孤岛系统”。建立智慧城市系统的首要挑战就是针对跨部门跨系统的应用场景,如何进行异构信息交换、系统间互操作以及协同问题求解。智慧城市系统的功能重点体现在信息服务上,系统边界体现为信息边界。通过软件定义把信息资源虚拟化,再通过软件系统对虚拟资源进行管理和调度,这是实现跨域信息系统互连互通的技术支撑,也是目前存在重要技术挑战。具体而言,其主要挑战在于,如何进行信息资源的虚拟化,以及如何在信息资源虚拟化的基础上,实现信息服务可编程,通过统一系统调用接口,访问信息资源提供的服务,实现信息资源的灵活管理、调度和更新,以满足对信息服务的多样需求。
\item 满足信息服务的准确一致性要求,提供可信的城市信息服务。智慧城市系统重在为用户提供准确、一致和可信的信息服务,信息服务可信性保障的挑战重点体现在,第一,保证信息服务中信息来源的可信性,比如如何根据信息服务需求,判断并评估需求相关的权威信息来源,并进行可靠的信息挖掘和抽取;第二,对需要推理产生的综合信息服务需求,需要有高置信度的信息源比对、推理和信息融合方法,以保证可以从多信息源中获得所需要的综合信息;第三,如何保证综合信息服务中信息的一致性,也是目前的重要挑战。
\item 满足信息服务时变性和场景相关性特征,实现及时个性化信息萃取和挖掘。智慧城市系统需要能满足不同用户不同场景的个性化信息服务需求,但其信息源海量、分布且动态变化,实现需求驱动的信息动态采集,进行场景相关的信息萃取和综合,并实现适时适地适用的信息服务,是智慧城市系统的重要挑战。
\end{itemize}
\subsection{主要研究内容}
智慧城市系统的主要研究内容包括:
\begin{itemize}
\item 城市信息资源互操作与管理。建立城市信息资源互操作与管理系统,一方面需要打破城市各孤岛系统的壁垒,建立数据共享开放、功能协同的机制;另一方面需要实现对城市各类信息资源的统一索引、授权、监控管理,促进基于语义的资源大规模共享与协同。
\item 城市知识萃取与演化。城市信息系统具有“智慧”的前提是必须掌握与城市相关的各种知识。既包括特定应用相关的专门知识的获取和管理,也包括智慧城市的基础支撑平台,以针对跨应用的共性城市知识建立统一的知识萃取与演化机制,为各类应用提供共性支撑,包括三方面能力:一是领域知识模型构造能力,将分散在信息系统和专家头脑中的知识集中抽象成统一知识模型并建立相应的知识库;二是领域知识模型演化能力,随着城市知识的演化更新知识模型,并保持知识库的一致性;三是知识可信性评估能力,从溯源、推理、传播、交叉验证等多种渠道,评估知识的可信性。
\item 群智城市信息感知和协同推荐。智慧城市系统应满足城市全方位感知和多样化信息服务需求,需要研究多人多组织参与的群智感知和服务定义。具体包括三个方面。第一,群智和移动群体城市感知。将持有智能手机在城市中移动的市民,视为是融合手机的感知、计算、通信能力和人类智能的“综合感知终端”,形成群智和移动群体城市感知网络;第二,构建基于“云-边-端”计算架构的智慧城市互连和协作架构,使能“综合感知终端”通过移动互联网,实现云平台支撑下的互联和协作,完成大规模、复杂城市感知任务。第三,群智智慧城市服务定义和推荐。面向智慧城市中信息服务应用的多样化、本地化、个性化的需求,促进人机交互和协作,在基于互联网的群智汇聚平台支撑下,研究信息服务的软件定义方法,实现大规模协同式信息服务的定义、设计和推荐,形成各展所长、相互支撑的共生生态系统。
\end{itemize}
\section{高性能CAE软件系统}
高性能计算机辅助工程高性能CAE泛指运用高性能计算机解决高端装备、重大工程和重要产品的全生命周期—设计、研制、生产和使用—中关键的科学和技术问题包括对功能、性能与安全可靠性进行计算、优化设计对其未来的工作状态和运行行为进行模拟仿真以期及早发现设计缺陷改进和优化设计方案证实工程/产品的可用性与可靠性。
高性能CAE软件系统是高性能计算机辅助工程的载体是计算力学、计算数学、相关的工程科学、工程管理学与现代计算机科学和技术相结合的产物是一种综合性、知识密集型的信息产品是实现高端装备、重大工程和重要产品的计算分析、模拟仿真与优化设计的工程软件是支持工程科学家进行创新研究和工程师进行创新设计的最重要的工具和手段在提高装备/工程/产品的设计质量、降低研究开发成本、缩短开发周期等方面发挥重要的作用。
高性能CAE软件系统关系到国家创新驱动发展战略的实施成效是推动关重装备自主创新发展的核心载体是将装备向精细化设计转化的桥梁与纽带是重大工程实施、核反应堆设计与安全分析、航空发动机优化设计、飞行器优化设计、高端精密仪器装备、重大科学实验装置、复杂电磁环境与防护等关重装备/科学装置研制不可替代的研究手段。高性能CAE软件系统也是工程行业和制造企业信息化的主导技术智能制造的重要基础和核心支撑实现工程/产品创新的主要技术手段,对推动我国制造业转型升级、加快我国从制造大国向制造强国的转变、实现制造强国和高质量发展,具有重要意义。
高性能CAE软件系统通常具有如下能力1大规模复杂几何结构的快速网格生成能力能够处理由众多具有高阶/间断曲面的零部件构造的、空间尺度跨度比大的复杂结构实现大规模网格的快速生成2多学科耦合的复杂系统耦合求解能力复杂的工程/产品大都是处在多物理场与多相多态介质非线性耦合状态下工作其行为绝非是多个单一问题的简单迭加3复杂物理现象的精准刻画和交互分析能力交互显示全机构/全场景复杂系统中的精细复杂的装置结构、极端物理条件下未知的复杂物理现象、几何结构与物理场以及多物理场间的难以解析描述的相互影响4高效发挥高性能计算机计算效率的能力能够适应高性能计算机体系结构的复杂性高效利用其结点间高速互联、结点内众核异构、处理器内多层嵌套的体系结构特点实现深度并行特别要具有面向国产CPU性能优化的能力充分发挥国产芯片的计算性能。5集成化、连贯性: 实现数值模拟流程的连贯性;实现多学科模拟集成,提高工程/产品开发整体流程的连贯性能够帮助用户选择分析流程和判断分析结果使CAE软件具有像“傻瓜”相机一样的一按即得的功效。
\subsection{关键技术挑战}
高性能CAE软件系统在应用上具有广泛性和综合性比如应用于关重装备、核能开发、航空航天、汽车船舶、石油化工、土木建筑、电子制造等领域在研制上具有融合性和协作性是计算力学、计算数学、相关的工程科学、工程管理学与现代计算机科学和技术相结合而形成的一种综合性、知识密集型的信息产品需要工程应用人员、工程科学家、数学家和计算机科学家合作完成。
要实现我国高性能CAE软件系统的自主可控和实际应用高产出必须体系化地实现以下几个飞跃1软件的计算能力与超级计算机硬件峰值性能同步提升实现数量级跨越2软件的置信度与科学建模水平同步提升多维度提高仿真置信度3超大规模模拟前后处理交互能力与工程设计建模精细化水平同步提升实现可交互操控的网格单元数的数量级跨越4CAE的基础理论、方法和科学数据的快速的集成和工程化能力的飞跃实现高性能CAE软件能力的跨越式发展5基于新兴技术的智能化、网络化和云化的新型服务模式实现随时随地的仿真模拟。
为了实现以上飞跃,从软件角度看,必须应对以下关键技术挑战:
\begin{itemize}
\item 突破效能瓶颈随着计算性能的不断提升高性能计算机的体系越来越庞大结构越来越复杂涉及到计算芯片、计算结点、网络互联、存储系统等诸多方面。高性能计算机体系结构上的每项变化都会给CAE软件对计算能力的发挥带来挑战需要在算法研究、应用优化、编程实现等方面进行重大调整使得数值模拟软件获得计算机峰值性能变得更加困难难以做到软件计算能力与计算机硬算力同步发展。当前多数自主CAE软件的计算能力严重滞后于超级计算机峰值性能。
\item 突破精度瓶颈:多可变形体、多相多态介质、多物理场、多尺度耦合分析,以及从材料到工程/产品设计一体化的仿真与优化分析在高性能CAE中普遍存在。在并行模拟仿真情境下数学物理方程解算算法的精度、多物理耦合解算过程中解算算法间耦合的精度以及解算算法与物理模型的匹配度决定了复杂体系科学建模的集成与转化能力是提升高性能CAE软件置信度的决定性因素。
\item 突破交互及其效率瓶颈高性能CAE软件要求人机交互界面直观、直觉和操作便捷。随着工程建模精细度的提高高性能CAE用户界面功能日趋繁杂工作流程的构建及操作日益繁琐同时离散网格和数据场规模持续增长导致人机交互响应速度减慢。这使得在使用高性能CAE软件开展仿真过程中大量时间和人力被花费在几何建模、网格生成和可视分析花费于前后处理的繁琐的参数调节以及漫长的交互响应等待影响了工程/产品的创新型设计和研发严重降低了高性能CAE软件的仿真产出。
\item 突破软件研发效率瓶颈自主高性能CAE软件的成功研制将依赖于工程建模、数值离散、并行计算和大规模前后处理等方向在基础理论、算法研究和软件开发等方面系统化的创新成果。作为一个多学科交叉的、综合性的知识密集型产品CAE软件由数百到数千个算法模块组成其数据库存放着众多的设计方案、标准构件行业性的标准、规范、判定设计和计算正确与否的知识性规则。以上原因导致高性能CAE软件体系结构复杂、代码量巨大、软件开发难度大。
\end{itemize}
\subsection{主要研究内容}
对高性能CAE软件系统而言其主要研究内容包括
\begin{itemize}
\item 匹配于高性能计算机硬件体系结构的高可扩展、可移植并行性能优化针对效能瓶颈结合国产高性能计算机硬件体系结构特征开展高并发情形下的数据通信、负载平衡、混合并行、深度并行、微处理器浮点运算性能优化等高性能计算共性基础研究支撑CAE软件的计算能力从当前串行、小规模并行向数千上万处理器核上的大规模并行跃迁为高性能CAE软件高效发挥国产高性能计算机的计算性能奠定基础。
\item 面向数学物理方程的高精度并行解算器:针对解算精度瓶颈,以实现复杂系统高效、高精度求解为目标,研究适应于并行求解环境的高精度/高效率解算算法、解算算法间高精度耦合并行算法设计实现解算算法易于集成的开放式架构和编程接口研究匹配于物理模型的解算算法智能选择机制提高高性能CAE软件的模拟置信度。
\item GUI界面的个性化定制针对交互瓶颈研发高性能CAE软件前后处理技术为精细化建模场景下大规模高质量网格快速生成、海量数据场的复杂物理规律交互展现奠定基础研发高性能CAE软件GUI定制技术实现GUI的个性化定制提高软件操控便捷性实现前后处理自动/半自动的使用方式,降低数值模拟整体时间开销,提高产出效率。
\item 高性能CAE软件系统快速研发新模式针对高性能CAE软件系统研发效率瓶颈研究既适用于基础/共性成果快速集成,又便于基础/共性成果快速专业化应用的高性能CAE软件研发新模式。提供载体将在突破效能瓶颈、精度瓶颈和交互瓶颈过程中形成的工程建模、数值离散、并行计算、前后处理的共性研究成果集成于其中。基于集成载体通过软件复用快速产出高性能CAE软件。高性能CAE软件的计算效能、计算精度和交互能力可通过复用共性并行计算技术、共性科学建模技术、共性前后处理技术来快速获得和提高。
\end{itemize}
\section{本章小结}
本章涉及特定领域的软件系统,提出了人机物融合应用的系统架构参考模式,选择无人自治单体和群体系统、工业控制软件系统、智慧城市系统、和基础平台软件系统四类特定领域的软件系统,分别从其主要技术挑战和主要研究内容两个方面进行分析,指出这个特定领域的软件系统在软件方法学上的挑战。