dan's notes, to be reviewed and revised --xiaoxing
This commit is contained in:
parent
e361a91304
commit
3b3345c945
|
@ -9,7 +9,9 @@
|
|||
\end{minipage}
|
||||
\end{center}
|
||||
|
||||
上述描述主要是从计算机系统中与硬件相对应的角度,给出了软件的一种存在形式的描述。而从软件历史渊源看,它本质上是刻画完成给定应用目标的\index{可计算函数}可计算函数~\cite{Turing:1937:ComputableNumbers},这构成了软件的实质内容。在本书中,我们将软件\index{软件}视作是\emph{以计算为核心手段实现应用目标的解决方案}。软件属于人工制品,以适应其所处环境的方式完成应用目标;更进一步,它是一种计算的逻辑制品,既有图灵可计算性~\cite{Turing:1937:ComputableNumbers, Cooper:2002:CT:961908}和计算复杂性~\cite{Cook:1983:OCC:358141.358144}的刚性约束,同时又有通用图灵机模型给予的巨大的通用性和灵活性。正是图灵机所具备的认识论意义上的强大表达和计算能力,提供了一种逼近人类认知的解空间,造就了软件成为人类认识世界、改造世界的文明发展的承载。
|
||||
|
||||
|
||||
上述描述主要是从计算机系统中与硬件相对应的角度,给出了软件的一种存在形式的描述。\todo{不通顺?改为:上述描述从存在形式的角度出发,将计算机软件描述为计算机系统中与硬件相对应的部分?}而从软件历史渊源看,它本质上是刻画完成给定应用目标的\index{可计算函数}可计算函数~\cite{Turing:1937:ComputableNumbers},这构成了软件的实质内容。在本书中,我们将软件\index{软件}视作是\emph{以计算为核心手段实现应用目标的解决方案}。软件属于人工制品,以适应其所处环境的方式完成应用目标;更进一步,它是一种计算的逻辑制品,既有图灵可计算性~\cite{Turing:1937:ComputableNumbers, Cooper:2002:CT:961908}和计算复杂性~\cite{Cook:1983:OCC:358141.358144}的刚性约束,同时又有通用图灵机模型给予的巨大的通用性和灵活性。正是图灵机所具备的强大表达和计算能力,提供了一种逼近人类认知的解空间,造就了软件成为人类认识世界、改造世界的文明发展的承载。\todo{修改前一句:比如“造就了软件承载。。。的地位”,或者拆成两句话}
|
||||
|
||||
软件科学与工程学科(以下简称软件学科)是以软件为基本研究对象的人工科学(或曰“人工制品科学”,Science of Artificial~\cite{Simon:1996:SA:237774}),包括研究和分析、开发和运行、使用和演化软件等活动所涉及的理论、原则、方法、技术、工具和系统。回顾计算机科学技术的发展历史,从1966年首届图灵奖至2018年的53次颁奖中,属于软件领域的有37次(69.8\%),其中以程序设计语言、编译和操作系统为主获奖的有22次,还有4次数据库获奖。 因此,在方法论的意义上,软件学科构成整个计算机科学技术学科的相当大的部分,并与系统科学、控制科学以及经济学、社会学等相关学科交叉融合,具有高度综合性。作为本书第一部分的开篇,本章将简要回顾软件和软件技术的发展历程,通过梳理软件发展脉络,总结软件学科的基本内涵、主要线索、研究方法和发展规律,为第一部分软件学科历史回顾的展开进行铺垫,同时为第二部分学科发展战略研究提供背景。
|
||||
|
||||
|
@ -48,22 +50,22 @@
|
|||
\caption{Babagge分析机的第一个程序}
|
||||
\label{fig:1-4}
|
||||
\end{minipage}
|
||||
\end{figure}
|
||||
\end{figure}\todo{图需要对齐}
|
||||
|
||||
Computer一词历史上出现在1613年,用来指完成演算或计算的人员。这种说法一直持续到19世纪末后第二次工业革命时期产生了用来演算的机器为止\footnote{https://www.computerhope.com/issues/ch000984.htm}。著名的哈佛大学天文台在1877年至1919年期间雇佣了一批妇女作为处理天文数据的技术工人。在电子计算机出现之前的人力和机械计算时代,Mathematic Tables项目是最大最复杂的计算项目,该项目的关键思想就是利用编程完成特定函数的计算。Gertrude Blanch女士作为“数学的导演”和“计算的经理”,设计了人力计算团队执行的“算法”,其算法设计成为此后数十年超越函数的标准计算思路。逐渐地,人们发明了表达编程的记号和方法,例如1921年Lillian和Frank Gilbreth的过程图(Process Charts,参见图1-5),后来的程序流图与之形式十分类似;又如1940年IBM的W.J. Eckert提出的打孔卡(参见图1-6)。我们可以看到,计算和编程是紧密相关的,而编程的结果事实上是给出了一种计算应用(数学计算)的解决方案,它可以由人力计算或机械计算完成。然而,在人力/机械计算时代,还未形成通用计算和编程的思想。
|
||||
Computer一词历史上出现在1613年,用来指完成演算或计算的人员。这种说法一直持续到19世纪末第二次工业革命时期产生了用来演算的机器为止\footnote{https://www.computerhope.com/issues/ch000984.htm}。著名的哈佛大学天文台在1877年至1919年期间雇佣了一批妇女作为处理天文数据的技术工人。在电子计算机出现之前的人力和机械计算时代,Mathematic Tables项目是最大最复杂的计算项目,该项目的关键思想就是利用编程完成特定函数的计算。Gertrude Blanch女士作为“数学的导演”和“计算的经理”,设计了人力计算团队执行的“算法”,其算法设计成为此后数十年超越函数的标准计算思路。逐渐地,人们发明了表达编程的记号和方法,例如1921年Lillian和Frank Gilbreth的过程图(Process Charts,参见图1-5),后来的程序流图与之形式十分类似;又如1940年IBM的W.J. Eckert提出的打孔卡(参见图1-6)。我们可以看到,计算和编程是紧密相关的,而编程的结果事实上是给出了一种计算应用(数学计算)的解决方案,它可以由人力计算或机械计算完成。然而,在人力/机械计算时代,还未形成通用计算设备编程的思想。
|
||||
|
||||
|
||||
\subsection{电子计算时代}
|
||||
1936年,Alan Turing在他的著名论文“On computable numbers, with an application to the Entscheidungs problem”提出了图灵机,开创了计算理论。
|
||||
上世纪四十年代出现了电子计算机。计算机先驱们相继研制了Colossus(1943)、ENIAC(1946)、EDSAC(1949)和Mark I(1949)等计算机~\cite{Aspray:1986:IDC:1435661.1436778}。EDSAC作为第一台存储程序结构的电子计算机开启了通用计算的时代。此时的程序通过一种微开关的形式加载到机器硬件上。五十年代后,出现了用户和计算机之间的简单交互。Grace Hopper在1951年和1952年为UNIVAC I编写了A-0系统,这是第一个电子计算机的编译器~\cite{Ridgway:1952:CR:800259.808980}。从今天的角度看,A-0更像现代编译器概念的Loader或Linker,可以认为是第一个系统软件。UNIVAC I的程序由一组子程序和参数序列组成。两年后,A-2系统成为了第一个开放源码的软件。早期的驻留管理程序将程序从纸带或者穿孔卡上读入到计算机中进行加载,这种技术直接导致了历史上第一个商用操作系统,即1956年推出的IBM 704操作系统。五十年代后,人们开始意识到1936年提出的图灵机模型的理论意义,图灵机由此成为计算机科学发展的理论基础。通用图灵机和通用计算使人们进一步认识到可编程是计算的基本属性,人们通过编写程序使得计算机完成指定的任务。
|
||||
上世纪四十年代出现了电子计算机。\todo{调整逻辑以反映最新认识}计算机先驱们相继研制了Colossus(1943)、ENIAC(1946)、EDSAC(1949)和Mark I(1949)等计算机~\cite{Aspray:1986:IDC:1435661.1436778}。EDSAC作为第一台存储程序结构的电子计算机开启了通用计算的时代。此时的程序通过一种微开关的形式加载到机器硬件上。五十年代后,出现了用户和计算机之间的简单交互。Grace Hopper在1951年和1952年为UNIVAC I编写了A-0系统,这是第一个电子计算机的编译器~\cite{Ridgway:1952:CR:800259.808980}。从今天的角度看,A-0更像现代编译器概念的Loader或Linker,可以认为是第一个系统软件。UNIVAC I的程序由一组子程序和参数序列组成。两年后,A-2系统成为了第一个开放源码的软件。早期的驻留管理程序将程序从纸带或者穿孔卡上读入到计算机中进行加载,这种技术直接导致了历史上第一个商用操作系统,即1956年推出的IBM 704操作系统。五十年代后,人们开始意识到1936年提出的图灵机模型的理论意义,图灵机由此成为计算机科学发展的理论基础。通用图灵机和通用计算使人们进一步认识到可编程是计算的基本属性,人们通过编写程序使得计算机完成指定的任务。
|
||||
|
||||
\subsection{软件和软件工程的出现}
|
||||
|
||||
自Von Neumann计算机诞生之初,存储程序原理即表明了程序在计算中的核心位置。程序也被作为研究对象促进的计算机学科的发展。早期最重要的系统成果有两个方面:一是,从机器语言到汇编语言到高级语言及解释和编译技术的出现,人们开发程序的生产率得到了迅速进步;二是,为了发挥硬件性能、改善人机交互、有效管理资源而产生了操作系统,人们运行程序的可靠性和成本得以显著降低。围绕程序是什么、怎么写、怎样运行的研究随着计算机的发展形成了计算机学科的重要分支,数据结构、算法理论和程序理论形成了学科的重要基础,计算机应用领域开始拓展。计算机学科在世界范围内受到了重视,一些高校先后设置了计算机系。
|
||||
自von Neumann计算机诞生之初,存储程序原理即表明了程序在计算中的核心位置。程序被作为研究对象促进了计算机学科的发展。早期最重要的系统成果有两个方面:一是,从机器语言到汇编语言到高级语言及解释和编译技术的出现,人们开发程序的生产率得到了迅速进步;二是,为了发挥硬件性能、改善人机交互、有效管理资源而产生了操作系统,人们运行程序的可靠性和成本得以显著降低。围绕程序是什么、怎么写、怎样运行的研究随着计算机的发展形成了计算机学科的重要分支,数据结构、算法理论和程序理论形成了学科的重要基础,计算机应用领域开始拓展。计算机学科在世界范围内受到了重视,一些高校先后设置了计算机系。
|
||||
|
||||
“软件”一词最早出现在1953年兰德公司R.R. Carhart的报告中,用来说明讨论可靠性时与硬件相对应的“人因”。而人们现在通常理解中的“软件”这一术语来自John W. Tukey在1958年所发表的论文~\cite{Tukey:1958:Software},文中指出 “软件由精心编排的解释程序、编译器以及自动编程的其他方面组成,它们至少像电容器、晶体管、电线和磁带等现代计算机硬件一样重要”。软件的概念逐渐地形成并清晰起来,具有了形态(程序和编程)上早期认识。1968年,或许是巧合,出现了两个软件发展史上的重大事件。这两个事件的背景都与IBM著名的IBM S/360系统相关。
|
||||
“软件”一词最早出现在1953年兰德公司R.R. Carhart的报告中~\cite{Carhart1953Rand},用来说明讨论可靠性时与硬件相对应的“人因”。而人们现在通常理解中的“软件”这一术语来自John W. Tukey在1958年所发表的论文~\cite{Tukey:1958:Software},文中指出 “软件由精心编排的解释程序、编译器以及自动编程的其他方面组成,它们至少像电容器、晶体管、电线和磁带等现代计算机硬件一样重要”。软件的概念逐渐地形成并清晰起来,具有了形态(程序和编程)上的早期认识。1968年,或许是巧合,出现了两个软件发展史上的重大事件。这两个事件的背景都与IBM著名的IBM S/360系统相关。
|
||||
|
||||
第一个事件是软件与硬件的解绑~\cite{Humphrey:2002:SUP:513126.513132}。早期的软件依附在硬件之上解决应用问题,软件完全是针对其运行的硬件开发,不能再用于其它硬件。此时的计算机系统中硬件和软件是相互“捆绑”的。技术上的一体带来了商业上的一体。计算机公司(如IBM)的商业模式在收费上采取只考虑硬件价格而软件和系统服务免费的策略。这在当时对于用户是很有吸引的,也增强了公司的竞争力。到1964年时情况发生了变化,IBM发布了新的IBM S/360系统,其目标是用户能够升级硬件系统而不需要替换或改变他们的应用程序。这在事实上形成了一种把应用解决方案剥离出硬件系统的技术可行性。而稍后RCA也宣布了其新的Spectra 70系统与IBM S/360兼容。这使得IBM难以阻止RCA在市场上“免费”使用其软件。1968年,IBM宣布了其软件和硬件系统的解绑。此后,软件从计算机系统硬件中剥离出来,获得了可以独立发展的空间,有机会产生独立的商业和竞争模式。可以看到,除了商业上的反垄断和市场竞争因素外,软件本质上所具备的“解决方案”的独立性和计算平台抽象使得解绑具备了历史必然性和技术可行性。软件学科的独立存在凸显。之后的发展以Bill Gates创立Microsoft和Larry Ellison创立Oracle为标志,软件成为独立产品并形成巨大产业,应用领域从以科学计算和商业计算开始不断扩大,逐渐从作为硬件附属品的软硬件一体化阶段过渡到软件产品化、产业化阶段。人们逐步认识到软件是计算机系统的灵魂,其共性沉淀形成的系统软件向下管理计算机系统的各类资源,向上满足用户对计算机系统的应用需求。
|
||||
第一个事件是软件与硬件的解绑~\cite{Humphrey:2002:SUP:513126.513132}。早期的软件依附在硬件之上解决应用问题,软件完全是针对其运行的硬件开发,不能再用于其它硬件。此时的计算机系统中硬件和软件是相互“捆绑”的。技术上的一体带来了商业上的一体。计算机公司(如IBM)的商业模式在收费上采取只考虑硬件价格而软件和系统服务免费的策略。这在当时对于用户是很有吸引力的,也增强了公司的竞争力。到1964年时情况发生了变化,IBM发布了新的IBM S/360系统,其目标是用户能够升级硬件系统而不需要替换或改变他们的应用程序。这在事实上形成了一种把应用解决方案剥离出硬件系统的技术可行性。而稍后RCA也宣布了其新的Spectra 70系统与IBM S/360兼容。这使得IBM难以阻止RCA在市场上“免费”使用其软件。1968年,IBM宣布了其软件和硬件系统的解绑。此后,软件从计算机系统硬件中剥离出来,获得了可以独立发展的空间,有机会产生独立的商业和竞争模式。可以看到,除了商业上的反垄断和市场竞争因素外,软件本质上所具备的“解决方案”的独立性和计算平台抽象使得解绑具备了历史必然性和技术可行性。软件学科的独立存在凸显。之后的发展以Bill Gates创立Microsoft和Larry Ellison创立Oracle为标志,软件成为独立产品并形成巨大产业,应用领域从科学计算和商业计算开始不断扩大,逐渐从作为硬件附属品的软硬件一体化阶段过渡到软件产品化、产业化阶段。人们逐步认识到软件是计算机系统的灵魂,其共性沉淀形成的系统软件向下管理计算机系统的各类资源,向上满足用户对计算机系统的应用需求。
|
||||
|
||||
第二个事件是软件工程\index{软件工程}的提出。计算机能力的快速提高和软件复杂性增加导致了所谓的“软件危机”现象。典型的案例是IBM S/360的操作系统OS/360的进度、开销和可靠性均不尽人意。北大西洋公约组织(NATO)在1968年举行了首次软件工程会议~\cite{Naur:1969:SER:1102020}。在这次会议上,专家们首次提出需要与其他领域的工程方法一样系统化地进行软件开发。正如Margaret Hamilton在开发阿波罗在轨飞行和导航系统项目中所明确指出的,“我努力使软件具有其应有的地位,使得构造软件的活动受到应有的尊重,因而我开始用‘软件工程’将其与硬件和其他类型的工程区分开来,成为整个系统工程的一部分”~\cite{Cameron:2018:ComputingEdge}。软件工程的出现激活了软件发展的巨大活力。这一史实也说明了软件发展的外在驱动力,即不断增长的应用需求和计算能力。
|
||||
|
||||
|
@ -75,15 +77,15 @@ Computer一词历史上出现在1613年,用来指完成演算或计算的人
|
|||
从计算平台看,软件运行平台从主机平台、微机平台、局域网平台、互联网平台到万物互联平台;系统软件也从批处理式、交互式、网络化发展到云边端融合等模式去支撑从少量集中到海量分布异构的资源管理和利用。
|
||||
从应用形式看,软件的应用目标从最初军事为主的科学计算起步,拓展到商业计算、个人计算、网络计算、云计算,到如今泛在计算等林林总总各个领域的场景需求,应用软件极大丰富。
|
||||
为更好地面向需求,满足各类质量、进度和成本约束,驾驭各类复杂性成为软件学科的一大重要挑战,软件语言从机器语言、汇编语言、高级语言、发展到领域特定语言,成为描述软件的基本方式。
|
||||
在此之上形成所谓的软件方法学\index{软件方法学},主要涉及指导软件设计的原理和原则,以及基于这些原理、原则的方法和技术。狭义的软件方法学也指某种特定的软件设计指导原则和方法体系。从ALGOL~\cite{Naur:1960:ALG:1061146.1061147}诞生至今,软件方法学从结构化方法~\cite{Dahl:1972:SP:1243380}、对象化方法~\cite{Booch:1986:OD:9794.9797, Meyer:1997:OSC:261119}、构件化方法~\cite{Heineman:2001:CSE:379381}、服务化方法~\cite{Huhns:2005:SCK:1053547.1053596},发展到网构化方法~\cite{Mei:2016:INS:3086926}。%,形成一系列的支撑软件。
|
||||
在此之上形成所谓的软件方法学\index{软件方法学},主要涉及指导软件设计的原理和原则,以及基于这些原理、原则的方法和技术。狭义的软件方法学也指某种特定的软件设计指导原则和方法体系。从ALGOL~\cite{Naur:1960:ALG:1061146.1061147}诞生至今,软件方法学从结构化方法~\cite{Dahl:1972:SP:1243380}、对象化方法~\cite{Booch:1986:OD:9794.9797, Meyer:1997:OSC:261119}、构件化方法~\cite{Heineman:2001:CSE:379381},向服务化~\cite{Huhns:2005:SCK:1053547.1053596}、智能化\todo{add references}和网构化~\cite{Mei:2016:INS:3086926}的方向发展。%,形成一系列的支撑软件。
|
||||
|
||||
\subsubsection{以抽象为主线的软件学科发展}
|
||||
|
||||
软件学科本质上是一门方法论学科。以计算手段解决问题的过程是从应用需求的问题空间到计算平台约束的解空间的映射过程,包括从解空间到平台空间上的计算实现\footnote{本质上,平台空间属于解空间中可直接计算执行的部分,其中计算平台形成了对解空间的约束。}。软件可以看成是现实世界中的问题及其求解方案在计算机上的一系列的符号表示。如何将现实世界表示为人和计算机都能够理解的符号系统是软件学科最核心的问题之一,此即软件模型及其建模问题~\cite{Booch:2007:ooadwa, Kramer:2007:AKC:1232743.1232745}。软件模型组成了解空间,是将现实世界问题空间映射到计算机世界平台空间的“桥梁”;用人工科学的角度看,软件模型的集合构成问题空间到平台空间的界面。
|
||||
软件学科本质上是一门方法论学科。以计算手段解决问题的过程是从应用需求的问题空间到计算平台约束的解空间的映射过程,包括从解空间到平台空间上的计算实现\footnote{本质上,平台空间属于解空间中可直接计算执行的部分,其中计算平台形成了对解空间的约束。}。软件可以看成是现实世界中的问题及其求解方案在计算机上的一系列的符号表示。如何将现实世界表示为人和计算机都能够理解的符号系统是软件学科最核心的问题之一,此即软件模型及其建模问题~\cite{Booch:2007:ooadwa, Kramer:2007:AKC:1232743.1232745}。软件模型组成了解空间,是将现实世界问题空间映射到计算机世界平台空间的“桥梁”;从人工科学的角度看,软件模型的集合构成问题空间到平台空间的界面。
|
||||
|
||||
Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite{Lucy:1997:LinguisticRelativity}。其较弱的版本称为语言相对论,是指语言影响思维与决策;而较强的版本称为语言决定论,则是指语言决定思维与认知边界。软件的语汇就是软件的各种抽象设施,是建立软件模型的基本元素。认识软件的切入点是认识各种软件抽象,宏观地说,软件方法学的核心是探讨如何建立、实现和使用抽象。
|
||||
|
||||
抽象是驾驭复杂性的基本手段。软件抽象设施往往以软件语言,特别是以程序设计语言、模型语言和相应接口形式给出;软件模型是解决方案(现实世界描述、问题描述及其求解方案)的抽象表示。模型和建模构成了软件范型的核心内容\cite{Floyd:1979:PP:359138.359140, Lu:2009:ISS:1640206.1640213, Mei:2012:ISP:2311627.2311662, Kuhn:1970:StructureSciRev}。软件范型是从软件工程师(或程序员)视角看到的软件模型及其构造原理,而构造软件模型的语汇(也称基本元素)是各类软件抽象设施,构造模型的方法是各类抽象的分解、组合和变换,建立抽象和抽象之间的关系。从结构上看,基于认知程度的不同,高层抽象可以分解为低层抽象,底层抽象可以组合或聚集为高层抽象,抽象之间还有不同语义保持度的转换。在问题空间、解空间和平台空间表述时,都可以建立或者定义所需的抽象,也可以使用已定义的抽象表述对象或者实现一个新定义的抽象。
|
||||
抽象是驾驭复杂性的基本手段。软件抽象设施往往以软件语言,特别是以程序设计语言、模型语言和相应接口形式给出;软件模型是解决方案(现实世界描述、问题描述及其求解方案)的抽象表示。模型和建模构成了软件范型的核心内容\cite{Floyd:1979:PP:359138.359140, Lu:2009:ISS:1640206.1640213, Mei:2012:ISP:2311627.2311662, Kuhn:1970:StructureSciRev}。软件范型是从软件工程师(或程序员)视角看到的软件模型及其构造原理,而构造软件模型的语汇(也称基本元素)是各类软件抽象设施,构造模型的方法是各类抽象的分解、组合和变换,建立抽象和抽象之间的关系。从结构上看,基于认知程度的不同,高层抽象可以分解为低层抽象,底层抽象可以组合或聚集为高层抽象,抽象之间还有不同语义保持度的转换。在问题空间、解空间和平台空间表述时,都可以建立或者定义所需的抽象,也可以使用已定义的抽象表述对象或者实现一个新定义的抽象。\todo{这里需要更新使之和摘要一致:范型-->语言。}
|
||||
|
||||
%而系统软件的核心在于实现这些抽象,软件工程则使用这些抽象构造应用软件。不同层次的抽象、抽象的计算实现和使用组成了软件发展的脉络。我们试图以软件各种抽象为主线来梳理和汇聚软件发展的基本历程。
|
||||
%例如,在典型的大数据处理系统(如Google搜索引擎)中,我们可以看到接口与服务、方法与设施、虚拟化与实现等不同层次组成的抽象栈,它们分别对应着Web服务、MapReduce、Dryad、Pregel、BigTable、集群调度、分布式文件、操作系统等抽象层。
|
||||
|
@ -112,17 +114,17 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
|
||||
军事领域的科学和工程计算是计算应用的最初需求。面向科学和工程计算建立的抽象成为软件发展的早期里程碑。为了满足数值计算的需求,John Backus于1953年发明了Fortran语言~\cite{Backus:1978:HFI:960118.808380},是历史上第一个正式推广的高级程序设计语言,于1957年在IBM 704计算机上实现。Fortran语言提供的抽象对用数学公式表达的问题求解提供了直接支持。经过多年的版本更替,Fortran语言至今仍在使用。Fortran的主要贡献者John Backus于1977年获得了图灵奖\footnote{https://amturing.acm.org/award\_winners/backus\_0703524.cfm}。
|
||||
|
||||
1960年,面向常规商业信息处理的COBOL语言发布,即COBOL-60~\cite{Sammet:1978:EHC:800025.1198367}。COBOL提供了面向周期性循环处理和数据变换的抽象,适合于报表、情报、计划编制等商业数据处理,如今仍有应用。同一时间段,面向通用计算的算法语言ALGOL 60诞生,成为ACM当时算法描述的标准,它提供了数据结构、块结构、递归等设施~\cite{Perlis:1978:ASD:800025.1198352, Naur:1978:ESL:800025.1198353}。ALGOL语言的意义重大,一是它确立了结构化高级程序设计语言设计的基础,之后的Pascal~\cite{Wirth:1993:RDP:154766.155378}、C~\cite{Ritchie:1993:DCL:154766.155580}、Java等命令式程序设计语言都是在此基础上设计出来的;二是它催生了试图严格或形式化地定义语言和程序的一大批软件基础理论成果。ALGOL 60的主要贡献者Peter Naur获得了2006年图灵奖。
|
||||
1960年,面向常规商业信息处理的COBOL语言发布,即COBOL-60~\cite{Sammet:1978:EHC:800025.1198367}。COBOL提供了面向周期性循环处理和数据变换的抽象,适合于报表、情报、计划编制等商业数据处理,如今仍有应用。同一时间段,面向通用计算的算法语言ALGOL 60诞生,成为ACM当时算法描述的标准,它提供了数据结构、块结构、递归等设施~\cite{Perlis:1978:ASD:800025.1198352, Naur:1978:ESL:800025.1198353}。ALGOL语言的意义重大,一是它确立了结构化高级程序设计语言设计的基础,之后的Pascal~\cite{Wirth:1993:RDP:154766.155378}、C~\cite{Ritchie:1993:DCL:154766.155580}、Java\todo{add a reference: 15年白皮书}等命令式程序设计语言都是在此基础上发展出来的;二是它催生了试图严格或形式化地定义语言和程序的一大批软件基础理论成果。ALGOL 60的主要贡献者Peter Naur获得了2006年图灵奖。
|
||||
|
||||
60年代末至80年代,历经Simula 67~\cite{Nygaard:1978:DSL:800025.1198392}、Smalltalk~\cite{Kay:1993:EHS:154766.155364}、C++~\cite{Stroustrup:1993:HC:154766.155375}等语言,面向对象程序设计形成,提供了类(对象)、方法(消息传递)、继承等设施,引入了封装和多态等机制。面向对象语言的创立者Ole-Johan Dahl、Kristen Nygaard和重要贡献者Alan Kay也分别于2001年和2003年获得了图灵奖。
|
||||
60年代末至80年代,历经Simula 67~\cite{Nygaard:1978:DSL:800025.1198392}、Smalltalk~\cite{Kay:1993:EHS:154766.155364}、C++~\cite{Stroustrup:1993:HC:154766.155375}等语言,面向对象程序设计形成,提供了类(对象)、方法(消息传递)、继承等设施,引入了封装和多态等机制。
|
||||
|
||||
与命令式程序设计语言不同,50年代末人们还探索了声明式程序设计语言,其代表是基于Lambda演算的函数式语言LISP~\cite{McCarthy:1978:HL:800025.1198360}、基于Horn Logic的Prolog~\cite{Colmerauer:1993:BP:154766.155362}、基于关系演算的SQL~\cite{Chamberlin:2012:EHS:2420618.2420665}等。以LISP为例,它提供了用于问题求解的函数抽象,首次在语言中支持递归函数定义。LISP的设计思想深刻地影响了ML~\cite{Gordon:1978:MIP:512760.512773}、Haskell~\cite{Hudak:2007:HHL:1238844.1238856}等函数式程序设计语言~\cite{Backus:1978:PLV:359576.359579}的发展。
|
||||
与命令式程序设计语言不同,50年代末人们还探索了声明式程序设计语言,其代表是基于Lambda\todo{用希腊字母代替}演算的函数式语言LISP~\cite{McCarthy:1978:HL:800025.1198360}、基于Horn子句的Prolog~\cite{Colmerauer:1993:BP:154766.155362}、基于关系演算的SQL~\cite{Chamberlin:2012:EHS:2420618.2420665}等。以LISP为例,它提供了用于问题求解的函数抽象,首次在语言中支持递归函数定义。LISP的设计思想深刻地影响了ML~\cite{Gordon:1978:MIP:512760.512773}、Haskell~\cite{Hudak:2007:HHL:1238844.1238856}等函数式程序设计语言~\cite{Backus:1978:PLV:359576.359579}的发展。
|
||||
|
||||
随着人们对程序设计安全可靠、便捷有效等要求的提高,以及计算平台向并发、分布、异构发展,程序设计语言呈现了两方面走向:一是,程序设计范型的融合,例如面向对象语言和函数式语言相融合并支持并发、安全计算,出现了Scala、Rust等程序设计语言,展现了强劲的势头;另一方面是,面向特定领域的语言受到了重视,它们针对领域应用提供高效便捷的抽象,例如面向大数据处理的Map Reduce~\cite{Dean:2008:MSD:1327452.1327492}、面向区块链智能合约的Solidity\footnote{https://en.wikipedia.org/wiki/Solidity}。
|
||||
随着人们对程序设计安全可靠、便捷有效等要求的提高,以及计算平台向并发、分布、异构发展,程序设计语言呈现了两方面走向:一是,程序设计范型的融合,例如面向对象语言和函数式语言相融合并支持并发、安全计算,出现了Scala、Rust等程序设计语言,展现了强劲的势头;另一方面是,面向特定领域的语言受到了重视,它们针对领域应用提供高效便捷的抽象,例如面向大数据处理的Map Reduce~\cite{Dean:2008:MSD:1327452.1327492}、面向区块链智能合约的Solidity\footnote{https://en.wikipedia.org/wiki/Solidity}等。
|
||||
|
||||
程序设计语言向上要面向问题求解方法的表达,向下要在计算机系统上实现。围绕语言的语法、语义和语用等方面的程序理论和围绕问题求解的计算理论成为了软件理论的重要部分。从ALGOL 60开始,关于程序(构造)的理论研究就开始了,其基本内容是在计算理论的基础上建立程序的形式语义,并对程序及其性质进行推理,其本质是基于数学的方法来建立抽象及抽象之间的联系~\cite{floyd:1967:assigning, 陆汝钤:2017:计算系统的形式语义}。在60年代到70年代,人们建立了程序设计语言的操作语义学、公理语义学、指称语义学和代数语义学。
|
||||
程序设计语言向上要表达问题求解方法,向下要在计算机系统上实现。围绕语言的语法、语义和语用等方面的程序理论和围绕问题求解的计算理论成为了软件理论的重要部分。从ALGOL 60开始,关于程序(构造)的理论研究就开始了,其基本内容是在计算理论的基础上建立程序的形式语义,并对程序及其性质进行推理,其本质是基于数学的方法来建立抽象及抽象之间的联系~\cite{floyd:1967:assigning, 陆汝钤:2017:计算系统的形式语义}。在上世纪60年代到70年代,人们建立了程序设计语言的操作语义、公理语义、指称语义和代数语义。
|
||||
%程序语言与形式语义的研究紧密联系,例如,1974年Barbara Liskov提出了抽象数据类型的程序设计思想~\cite{Liskov:1974:PAD:800233.807045},建立了现代面向对象语言的核心特征,包括强类型检查和通用类型支持,支持了对象化方法语言中的类抽象。
|
||||
以形式语义学为基础,人们长期探索程序的形式开发和形式验证等形式化方法和技术以提高软件生产率和软件质量,取得显著的进展。例如模型检验基于判定理论、利用高效的数据结构和算法能快速自动地验证一大类计算机硬件和软件系统的关键性质,获得了2005年图灵奖~\cite{Clarke:2000:MC:332656}。与程序相关的问题的求解判定和算法复杂性也成为程序设计语言设计和形式化方法的重要内容。
|
||||
以形式语义为基础,人们长期探索程序的形式开发和形式验证等形式化方法和技术以提高软件生产率和软件质量,取得显著的进展。例如模型检验基于判定理论、利用高效的数据结构和算法能快速自动地验证一大类计算机硬件和软件系统的关键性质,\todo{三个人名}因此获得了2005年图灵奖~\cite{Clarke:2000:MC:332656}。与程序相关的问题的求解判定和算法复杂性也成为程序设计语言设计和形式化方法的重要内容。
|
||||
|
||||
%\subsubsection{以实现抽象为目标的系统软件}
|
||||
\subsubsection{系统软件}
|
||||
|
@ -147,7 +149,7 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
%面向应用建立问题解决方案的抽象成为软件开发方法的共识。
|
||||
软件开发可以看作是使用各种抽象构建并实现新抽象获得问题解的过程。分而治之的模块化和组合化是使用抽象和在使用中建立新抽象的基本思路,信息隐藏是其基本原则。
|
||||
|
||||
程序设计模型影响着甚至决定着软件范型。软件开发试图在问题空间中建立有更强表达能力、并易于向平台空间抽象高效映射的一系列抽象。因而,软件开发的诸多基本抽象往往力求与程序设计语言的抽象尽可能相容或一致,使得软件工程模型不同阶段、不同层次的抽象有着较好的对应,保持较好的可跟踪性和平滑的实现映射。例如,70年代的结构化分析和设计方法对应于结构化程序设计、80年代的面向对象分析和设计对应于面向对象程序设计等等。另一方面,在程序设计语言抽象的基础上,为了与人们应用问题求解思维过程的一致,在软件的需求和设计上也出现了含有高层的抽象设施的软件语言,也称软件建模语言。它们具有面向问题空间描述的抽象形式,例如,在面向对象方法学中的统一建模语言UML~\cite{Booch:1999:UML:291167}用Use Case对需求进行抽象建模,用Message对需求和设计中类交互进行抽象。
|
||||
程序设计模型影响着甚至决定着软件范型\todo{程序设计模型,改为程序设计语言}。软件开发试图在问题空间中建立有更强表达能力、并易于向平台空间抽象高效映射的一系列抽象。因而,软件开发的诸多基本抽象往往力求与程序设计语言的抽象尽可能相容或一致,使得软件工程模型不同阶段、不同层次的抽象有着较好的对应,保持较好的可跟踪性和平滑的实现映射。例如,70年代的结构化分析和设计方法对应于结构化程序设计、80年代的面向对象分析和设计对应于面向对象程序设计等等。另一方面,在程序设计语言抽象的基础上,为了与人们应用问题求解思维过程的一致,在软件的需求和设计上也出现了含有高层的抽象设施的软件语言,也称软件建模语言。它们具有面向问题空间描述的抽象形式,例如,在面向对象方法学中的统一建模语言UML~\cite{Booch:1999:UML:291167}用Use Case对需求进行抽象建模,用Message对需求和设计中类交互进行抽象。
|
||||
更进一步,随着软件抽象粒度和层次的提升,软件开发方法和软件语言的发展愈加紧密。例如,基于复用思想的软件构件化方法中提出了软件体系结构,构件和构件间的连接子成为其重要组成;服务化方法定义了服务和服务间的流程编排;以及网构化方法提供了自主实体和实体间的按需连接,等等。
|
||||
|
||||
软件生命期不同阶段有不同抽象,由抽象间的(使用/实现)关系复合构建映射成为软件开发的重要任务。
|
||||
|
@ -156,21 +158,21 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
|
||||
%如图,结构化抽象与THE OS、C与UNIX、面向对象与CORBA和EJB、服务化与Docker虚拟机交相辉映,形成了以计算为手段的解平台提升,并与结构化、对象化、构件化、服务化等软件开发方法携手同行。
|
||||
|
||||
软件开发方法从制品的角度来认识、构造和演进软件。而另一方面,软件作为人类的智力产品,其质量存在不确定性,同时其产生和发展过程中蕴含着复杂的协作。因此,从工程化的角度看,软件度量和质量保证,以及软件开发和演化的动态过程也是必不可少的。以软件开发方法为基础,软件工程必然延伸到了度量、质量和过程。例如,UML软件工程不仅支持面向对象的分析与设计,还支持从业务建模、需求获取、分析、设计、实现、测试到部署的迭代化软件开发活动,在此基础上形成了所谓统一软件开发过程(Unified Process)。软件过程模式从早期的手工作坊式生产组织方式、企业化生产组织方式发展到社会化生产方式。企业化生产组织方式主要有软件过程(1970)、CMM(1988)、SCRUM(1995)、RUP(2000)、外包(2001)、敏捷和极限编程(2001)、PSP(2005)等;社会化生产方式有开源(1997)、Git(2005)等,以及相应的开发社交平台Stack Overflow(2007)等。
|
||||
软件开发方法从制品的角度来认识、构造和演进软件。而另一方面,软件作为人类的智力产品,其质量存在不确定性,同时其产生和发展过程中蕴含着复杂的协作。因此,从工程化的角度看,软件度量和质量保证,以及软件开发和演化的动态过程也是必不可少的。以软件开发方法为基础,软件工程必然延伸到了度量、质量和过程。例如,UML软件工程不仅支持面向对象的分析与设计,还支持从业务建模、需求获取、分析、设计、实现、测试到部署的迭代化软件开发活动,在此基础上形成了所谓统一软件开发过程(Unified Process)。软件过程模式从早期的手工作坊式生产组织方式、企业化生产组织方式发展到社会化生产方式。企业化生产组织方式主要有软件过程(1970)、CMM(1988)、SCRUM(1995)、RUP(2000)、外包(2001)、敏捷和极限编程(2001)、PSP(2005)等;社会化生产方式有开源(1997)、Git(2005)等,以及相应的开发社交平台Stack Overflow(2007)等。\todo{这段是否需要改,容易捕捉本段主题}
|
||||
|
||||
%DevOps(2008)放到学科构架里面去说。
|
||||
|
||||
\section{软件学科的内涵、发展规律和基本架构}
|
||||
\subsection{内涵与学科特征}
|
||||
软件实质是以计算为核心手段实现应用目标的解决方案,是最纯粹的人工制品\cite{Simon:1996:SA:237774},其内涵特征包括了三个方面:
|
||||
软件实质是以计算为核心手段实现应用目标的解决方案,是一种人工制品\cite{Simon:1996:SA:237774},其内涵特征包括了三个方面:
|
||||
\begin{description}
|
||||
\item[功能性] 以何种结构和行为
|
||||
\item[目的性] 达成什么应用目的
|
||||
\item[适应性] 何种环境依赖之下
|
||||
\end{description}
|
||||
不同于一般物品,软件是一种人工制品,同时也是一种纯粹的逻辑制品。作为逻辑制品,其困难不在于物理限制而在于逻辑构造。因此,软件开发活动本质上不同于传统工程制造:后者在于“造物”,前者可谓“拟人”—即表达人脑思维形成的问题解决方案。%后者可有规模效应,而对前者而言,每一个软件系统都是独一无二的创造。
|
||||
不同于一般的人工制品,软件也是一种纯粹的逻辑制品。作为逻辑制品,其困难不在于物理限制而在于逻辑构造。因此,软件开发活动本质上不同于传统工程制造:后者在于“造物”,前者可谓“拟人”—即表达人脑思维形成的问题解决方案。%后者可有规模效应,而对前者而言,每一个软件系统都是独一无二的创造。
|
||||
|
||||
软件学科是以软件为研究对象,研究以软件求解应用问题的理论、原则、方法和技术,以及相应的工具支持、运行平台和生态环境的学科。其核心内容是以计算为工具的问题求解方法论,目标是达成效能、效率和价值的统一。N. Wirth在“软件工程简史”一文中指出 “如果说我们能从过去学到什么,那就是计算机科学本质上是方法论学科。它开发并传授泛在多样化应用中共性知识和技术”~\cite{Wirth:2008:BHS:1449571.1449577}。我们认为,在这个意义上,软件学科实质上就是Wirth所说的计算机科学的主体。
|
||||
软件学科是以软件为研究对象,研究以软件求解应用问题的理论、原则、方法和技术,以及相应的工具支持、运行平台和生态环境的学科。其核心内容是以计算为工具的问题求解方法论,目标是达成效能、效率和价值的统一。N. Wirth在“软件工程简史”一文中指出 “如果说我们能从过去学到什么,那就是计算机科学本质上是方法论学科。它开发并传授多样化应用中的共性知识和技术”~\cite{Wirth:2008:BHS:1449571.1449577}。我们认为,在这个意义上,软件学科实质上就是Wirth所说的计算机科学的主体。
|
||||
|
||||
软件的功能性、目的性和适应性,使得软件学科呈现出了艺术、科学和工程共存的学科特征。这源自于软件本身融合了人类活动、数学物理规律约束的计算模型和装置、以及面向应用价值的工程设计。软件之目的性是其工程属性的来源,而功能性的设计及设计的柔性孕育了艺术、方法和原创的结合,运行软件的硬件平台之物理和可计算内生了软件发展必须遵循科学规律和遵从的环境约束。艺术、科学和工程在软件发展的不同阶段和侧面会相互渗透乃至相互转换。归根到底,其目的性表征的价值、软硬平台与外部环境所形成的功能、以及界面适应性是其核心,这也成就了软件成为万能集成器和粘合剂的基础设施地位。
|
||||
|
||||
|
@ -183,7 +185,7 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
|
||||
\textbf{外在驱动力}
|
||||
|
||||
计算平台的发展和应用范围的扩张分别构成了软件学科发展的平台驱动力和应用驱动力。平台的变迁构成了软件灵活成长的平台空间;而应用的扩张构成软件所解决的问题空间。在平台空间和问题空间之间,构成了由软件填补的界面空间。软件的发展是这三个空间变化、渗透和互动的产物。
|
||||
计算平台的发展和应用范围的扩张分别构成了软件学科发展的平台驱动力和应用驱动力。平台的变迁构成了软件灵活成长的平台空间;而应用的扩张构成软件所解决的问题空间。在平台空间和问题空间之间,构成了由软件填补的解空间\todo{或者使用界面空间,需要前面解释}。软件的发展是这三个空间变化、渗透和互动的产物。
|
||||
|
||||
应用拉动,平台变化,推动软件的发展。从应用驱动力的角度,软件的应用范围不断扩展,渗透力不断增强。不断增长的应用诉求拉动了软件技术从最初单纯的计算与数据处理拓展到各个行业的应用、乃至现在无所不在的应用,软件学科的无可比拟的渗透力变得空前的强大,软件的形态、开发方法和运行支撑等诸多方面发生了巨大的变化。从平台驱动力的角度,计算平台从单机发展到局域网、互联网、物联网,从云计算、端计算、边缘计算到泛在计算,形成了从封闭、静态环境(单机计算平台)到开放、动态环境(泛在计算平台)的态势,造就了软件发展的不竭动力,使得软件所能提供的解决方案的解空间空前强大。在应用驱动力和平台驱动力的联合作用下,软件正走向“定义一切”。
|
||||
|
||||
|
@ -197,11 +199,11 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
|
||||
\textbf{理论方法}
|
||||
|
||||
理论方法首先给出软件对象的定义描述,并假设它们之间可能的联系,通过证明来判断这些联系是否成立,并解释所得到的结果。源于以图灵机为代表的形式化计算模型的奠基性贡献,使得计算平台具有刚性的数学理论约束,使得数学一开始就进入了计算机理论研究。通过建立形式理论、推理获得结果并解释结果,形成了软件作为数学对象来研究和开发的方法学。这种方法提供了开发模型并理解模型边界的分析框架,在软件正确性方面发挥了重要作用。理论方法根植于数学,将计算视作数学对象开展研究。
|
||||
理论方法首先给出软件对象的定义描述,并假设它们之间可能的联系,通过证明来判断这些联系是否成立,并解释所得到的结果。源于以图灵机为代表的形式化计算模型的奠基性贡献,使得数学一开始就进入了计算机理论研究。通过建立形式理论、推理获得结果并解释结果,形成了软件作为数学对象来研究和开发的方法学。这种方法提供了开发模型并理解模型边界的分析框架,在软件正确性方面发挥了重要作用。理论方法根植于数学,将软件视作数学对象开展研究。
|
||||
|
||||
\textbf{实验方法}
|
||||
|
||||
实验方法属于实验科学方法,其本质是建模。它首先基于假设构造一个模型,通过对实验成果的统计/量化度量和分析,来确认所获得的模型。例如,为评价一种软件开发的新方法或者工具,需要通过建立假设条件下的模型,开展度量和分析,以说明方法和工具较已有方法的先进性。实验方法源自于自然科学和社会科学方法。对于软件学科的研究,可以利用计算的手段开展软件的实验研究,亦即仿真,包括用软件模拟软件的模型方法或用数据科学方法来研究软件及其环境的现象和方法。
|
||||
实验方法属于实验科学方法。它首先基于假设构造一个模型,通过对实验成果的统计/量化度量和分析,来确认所获得的模型。例如,为评价一种软件开发的新方法或者工具,需要通过建立假设条件下的模型,开展度量和分析,以说明方法和工具较已有方法的先进性。实验方法源自于自然科学和社会科学方法。对于软件学科的研究,可以利用计算的手段开展软件的实验研究,亦即仿真,包括用软件模拟软件的模型方法或用数据科学方法来研究软件及其环境的现象和方法。
|
||||
|
||||
\textbf{设计方法}
|
||||
|
||||
|
@ -216,6 +218,7 @@ Sapir-Whorf语言相对论假设对语汇的重要性给出了一个表述~\cite
|
|||
%\end{itemize}
|
||||
|
||||
\subsection{软件学科的基本架构}
|
||||
\todo{保证前后一致,范型->语言;且压缩摘要相关部分}
|
||||
%出于不同目的考虑,学科可有不同的划分。从目前我国人才培养一级学科划分看,软件学科横跨了计算机科学与技术,软件工程、网络空间安全等三个一级学科。特别是,与计算机软件与理论二级学科和软件工程一级学科关系密切。与本国际本科计算教育学科相比,软件学科横跨了ACM/IEEE计算教程等五个学科,即计算机科学、计算机工程、软件工程、信息技术、信息系统。它们的覆盖关系如图1-X所示。
|
||||
|
||||
%我们着眼于软件学科发展历程的回顾,重新梳理,就现状划分了三个子领域,即程序设计语言与理论、系统软件、软件工程。其中,程序设计语言与理论的核心内容是建立抽象;系统软件的核心内容是实现抽象;软件工程的核心内容是使用抽象。它们与我国目前一级学科、ACM/IEEE计算学科的关系如图1-X所示。
|
||||
|
|
Loading…
Reference in New Issue