Update lab8

This commit is contained in:
Object Ho 2014-10-14 18:57:17 +08:00
parent 0a5dc30b11
commit b5a1abb2b0
1 changed files with 82 additions and 108 deletions

190
lab8.md
View File

@ -24,11 +24,11 @@
**练习2: 完成基于文件系统的执行程序机制的实现(需要编码)**
改写proc.c中的load\_icode函数和其他相关函数实现基于文件系统的执行程序机制。执行make
qemu。如果能看看到sh用户程序的执行界面则基本成功了。如果在sh用户界面上可以执行”ls”,”hello”等其他放置在sfs文件系统中的其他执行程序则可以认为本实验基本成功。**使用的是qemu-1.0.1**)。
改写proc.c中的load\_icode函数和其他相关函数实现基于文件系统的执行程序机制。执行make qemu。如果能看看到sh用户程序的执行界面则基本成功了。如果在sh用户界面上可以执行”ls”,”hello”等其他放置在sfs文件系统中的其他执行程序则可以认为本实验基本成功。**使用的是qemu-1.0.1**)。
### 2.2 项目组成
```
.
├── boot
├── kern
@ -122,7 +122,8 @@ qemu。如果能看看到sh用户程序的执行界面则基本成功了。
│ └── umain.c
├── ls.c
├── sh.c
└── ……
└── ……
```
本次实验主要是理解kern/fs目录中的部分文件并可用user/\*.c测试所实现的Simple
FS文件系统是否能够正常工作。本次实验涉及到的代码包括
@ -130,7 +131,7 @@ FS文件系统是否能够正常工作。本次实验涉及到的代码包括
* 文件系统测试用例: user/\*.c对文件系统的实现进行测试的测试用例
* 通用文件系统接口
n user/libs/file.[ch]|dir.[ch]|syscall.c与文件系统操作相关的用户库实行
n user/libs/file.[ch]|dir.[ch]|syscall.c与文件系统操作相关的用户库实行
n kern/syscall.[ch]:文件中包含文件系统相关的内核态系统调用接口
n kern/fs/sysfile.[ch]|file.[ch]:通用文件系统接口和实行
@ -147,9 +148,7 @@ n kern/fs/devs/dev.[ch]|dev\_disk0.cdisk0硬盘设备提供给文件系统的
n tools/mksfs.c创建一个Simple FS文件系统格式的硬盘镜像。理解此文件的实现细节对理解SFS文件系统很有帮助
* 对内核其它模块的扩充
n kern/process/proc.[ch]:增加成员变量 struct fs\_struct
\*fs\_struct用于支持进程对文件的访问重写了do\_execve
load\_icode等函数以支持执行文件系统中的文件。
n kern/process/proc.[ch]:增加成员变量 struct fs\_struct \*fs\_struct用于支持进程对文件的访问重写了do\_execve load\_icode等函数以支持执行文件系统中的文件。
n kern/init/init.c增加调用初始化文件系统的函数fs\_init。
## 3. 文件系统设计与实现
@ -158,8 +157,7 @@ n kern/init/init.c增加调用初始化文件系统的函数fs\_init。
操作系统中负责管理和存储可长期保存数据的软件功能模块称为文件系统。在本次试验中,主要侧重文件系统的设计实现和对文件系统执行流程的分析与理解。
ucore的文件系统模型源于Havard的OS161的文件系统和Linux文件系统。但其实这二者都是源于传统的UNIX文件系统设计。UNIX提出了四个文件系统抽象概念文件(file)、目录项(dentry)、索引节点(inode)和安装点(mount
point)。
ucore的文件系统模型源于Havard的OS161的文件系统和Linux文件系统。但其实这二者都是源于传统的UNIX文件系统设计。UNIX提出了四个文件系统抽象概念文件(file)、目录项(dentry)、索引节点(inode)和安装点(mount point)。
* 文件UNIX文件中的内容可理解为是一有序字节buffer文件都有一个方便应用程序识别的文件名称也称文件路径名。典型的文件操作有读、写、创建和删除等。
* 目录项目录项不是目录而是目录的组成部分。在UNIX中目录被看作一种特定的文件而目录项是文件路径中的一部分。如一个文件路径名是“/test/testfile”则包含的目录项为根目录“/”目录“test”和文件“testfile”这三个都是目录项。一般而言目录项包含目录项的名字文件名或目录名和目录项的索引节点见下面的描述位置。
@ -174,15 +172,14 @@ ucore模仿了UNIX的文件系统设计ucore的文件系统架构主要由四
* 文件系统抽象层:向上提供一个一致的接口给内核其他部分(文件系统相关的系统调用实现模块和其他内核功能模块)访问。向下提供一个同样的抽象函数指针列表和数据结构屏蔽不同文件系统的实现细节。
* Simple
FS文件系统层一个基于索引方式的简单文件系统实例。向上通过各种具体函数实现以对应文件系统抽象层提出的抽象函数。向下访问外设接口
* Simple FS文件系统层一个基于索引方式的简单文件系统实例。向上通过各种具体函数实现以对应文件系统抽象层提出的抽象函数。向下访问外设接口
* 外设接口层向上提供device访问接口屏蔽不同硬件细节。向下实现访问各种具体设备驱动的接口比如disk设备接口/串口设备接口/键盘设备接口等。
对照上面的层次我们再大致介绍一下文件系统的访问处理过程,加深对文件系统的总体理解。假如应用程序操作文件(打开/创建/删除/读写首先需要通过文件系统的通用文件系统访问接口层给用户空间提供的访问接口进入文件系统内部接着由文件系统抽象层把访问请求转发给某一具体文件系统比如SFS文件系统具体文件系统Simple
FS文件系统层把应用程序的访问请求转化为对磁盘上的block的处理请求并通过外设接口层交给磁盘驱动例程来完成具体的磁盘操作。结合用户态写文件函数write的整个执行过程我们可以比较清楚地看出ucore文件系统架构的层次和依赖关系。
对照上面的层次我们再大致介绍一下文件系统的访问处理过程,加深对文件系统的总体理解。假如应用程序操作文件(打开/创建/删除/读写首先需要通过文件系统的通用文件系统访问接口层给用户空间提供的访问接口进入文件系统内部接着由文件系统抽象层把访问请求转发给某一具体文件系统比如SFS文件系统具体文件系统Simple FS文件系统层把应用程序的访问请求转化为对磁盘上的block的处理请求并通过外设接口层交给磁盘驱动例程来完成具体的磁盘操作。结合用户态写文件函数write的整个执行过程我们可以比较清楚地看出ucore文件系统架构的层次和依赖关系。
![image](lab8/image001.png)
**ucore文件系统总体结构**
从ucore操作系统不同的角度来看ucore中的文件系统架构包含四类主要的数据结构,
@ -196,6 +193,7 @@ FS文件系统层把应用程序的访问请求转化为对磁盘上的block
如果一个用户进程打开了一个文件那么在ucore中涉及的相关数据结构其中相关数据结构将在下面各个小节中展开叙述和关系如下图所示
![image](lab8/image002.png)
**ucore中文件相关关键数据结构及其关系**
### 3.2 通用文件系统访问接口
@ -207,9 +205,11 @@ Lab8中部分用户库函数与文件系统有关我们先讨论对单个文
在文件操作方面最基本的相关函数是open、close、read、write。在读写一个文件之前首先要用open系统调用将其打开。open的第一个参数指定文件的路径名可使用绝对路径名第二个参数指定打开的方式可设置为O\_RDONLY、O\_WRONLY、O\_RDWR分别表示只读、只写、可读可写。在打开一个文件后就可以使用它返回的文件描述符fd对文件进行相关操作。在使用完一个文件后还要用close系统调用把它关闭其参数就是文件描述符fd。这样它的文件描述符就可以空出来给别的文件使用。
读写文件内容的系统调用是read和write。read系统调用有三个参数一个指定所操作的文件描述符一个指定读取数据的存放地址最后一个指定读多少个字节。在C程序中调用该系统调用的方法如下
```
count = read(filehandle, buffer, nbytes);
```
该系统调用会把实际读到的字节数返回给count变量。在正常情形下这个值与nbytes相等但有时可能会小一些。例如在读文件时碰上了文件结束符从而提前结束此次读操作。
如果由于参数无效或磁盘访问错误等原因使得此次系统调用无法完成则count被置为-1。而write函数的参数与之完全相同。
@ -226,14 +226,12 @@ count = read(filehandle, buffer, nbytes);
FS简称SFS文件系统就可更好地分析文件系统抽象层的设计。即从具体走向抽象。ucore内核把所有文件都看作是字节流任何内部逻辑结构都是专用的由应用程序负责解释。但是ucore区分文件的物理结构。ucore目前支持如下几种类型的文件
* 常规文件文件中包括的内容信息是由应用程序输入。SFS文件系统在普通文件上不强加任何内部结构把其文件内容信息看作为字节。
* 目录包含一系列的entry每个entry包含文件名和指向与之相关联的索引节点index
node的指针。目录是按层次结构组织的。
* 目录包含一系列的entry每个entry包含文件名和指向与之相关联的索引节点index node的指针。目录是按层次结构组织的。
* 链接文件:实际上一个链接文件是一个已经存在的文件的另一个可选择的文件名。
* 设备文件:不包含数据,但是提供了一个映射物理设备(如串口、键盘等)到一个文件名的机制。可通过设备文件访问外围设备。
* 管道:管道是进程间通讯的一个基础设施。管道缓存了其输入端所接受的数据,以便在管道输出端读的进程能一个先进先出的方式来接受数据。
在lab8中关注的主要是SFS支持的常规文件、目录和链接中的 hardlink
的设计实现。SFS文件系统中目录和常规文件具有共同的属性而这些属性保存在索引节点中。SFS通过索引节点来管理目录和常规文件索引节点包含操作系统所需要的关于某个文件的关键信息比如文件的属性、访问许可权以及其它控制信息都保存在索引节点中。可以有多个文件名可指向一个索引节点。
在lab8中关注的主要是SFS支持的常规文件、目录和链接中的 hardlink 的设计实现。SFS文件系统中目录和常规文件具有共同的属性而这些属性保存在索引节点中。SFS通过索引节点来管理目录和常规文件索引节点包含操作系统所需要的关于某个文件的关键信息比如文件的属性、访问许可权以及其它控制信息都保存在索引节点中。可以有多个文件名可指向一个索引节点。
#### 3.3.1 文件系统的布局
@ -247,6 +245,7 @@ SFS文件系统的布局如下图所示。
![image](lab8/image003.png)
第0个块4K是超级块superblock它包含了关于文件系统的所有关键参数当计算机被启动或文件系统被首次接触时超级块的内容就会被装入内存。其定义如下
```
struct sfs_super {
uint32_t magic; /* magic number, should be SFS_MAGIC */
@ -255,17 +254,14 @@ struct sfs_super {
char info[SFS_MAX_INFO_LEN + 1]; /* infomation for sfs */
};
```
可以看到包含一个成员变量魔数magic其值为0x2f8dbe2a内核通过它来检查磁盘镜像是否是合法的
SFS img成员变量blocks记录了SFS中所有block的数量即 img
的大小成员变量unused\_block记录了SFS中还没有被使用的block的数量成员变量info包含了字符串"simple
file system"。
可以看到包含一个成员变量魔数magic其值为0x2f8dbe2a内核通过它来检查磁盘镜像是否是合法的 SFS img成员变量blocks记录了SFS中所有block的数量即 img 的大小成员变量unused\_block记录了SFS中还没有被使用的block的数量成员变量info包含了字符串"simple file system"。
第1个块放了一个root-dir的inode用来记录根目录的相关信息。有关inode还将在后续部分介绍。这里只要理解root-dir是SFS文件系统的根结点通过这个root-dir的inode信息就可以定位并查找到根目录下的所有文件信息。
从第2个块开始根据SFS中所有块的数量用1个bit来表示一个块的占用和未被占用的情况。这个区域称为SFS的freemap区域这将占用若干个块空间。为了更好地记录和管理freemap区域专门提供了两个文件kern/fs/sfs/bitmap.[ch]来完成根据一个块号查找或设置对应的bit位的值。
最后在剩余的磁盘空间中存放了所有其他目录和文件的inode信息和内容数据信息。需要注意的是虽然inode的大小小于一个块的大小4096B但为了实现简单每个
inode 都占用一个完整的 block。
最后在剩余的磁盘空间中存放了所有其他目录和文件的inode信息和内容数据信息。需要注意的是虽然inode的大小小于一个块的大小4096B但为了实现简单每个 inode 都占用一个完整的 block。
在sfs\_fs.c文件中的sfs\_do\_mount函数中完成了加载位于硬盘上的SFS文件系统的超级块superblock和freemap的工作。这样在内存中就有了SFS文件系统的全局信息。
@ -274,6 +270,7 @@ inode 都占用一个完整的 block。
**磁盘索引节点**
SFS中的磁盘索引节点代表了一个实际位于磁盘上的文件。首先我们看看在硬盘上的索引节点的内容
```
struct sfs_disk_inode {
uint32_t size; 如果inode表示常规文件则size是文件大小
@ -284,18 +281,15 @@ struct sfs_disk_inode {
uint32_t indirect; 此inode的一级间接数据块索引值
};
```
通过上表可以看出如果inode表示的是文件则成员变量direct[]直接指向了保存文件内容数据的数据块索引值。indirect间接指向了保存文件内容数据的数据块indirect指向的是间接数据块indirect
block此数据块实际存放的全部是数据块索引这些数据块索引指向的数据块才被用来存放文件内容数据。
默认的ucore 里 SFS\_NDIRECT 是 12即直接索引的数据页大小为 12 \* 4k =
48k当使用一级间接数据块索引时ucore 支持最大的文件大小为 12 \* 4k +
1024 \* 4k = 48k + 4m。数据索引表内0 表示一个无效的索引inode 里 blocks
表示该文件或者目录占用的磁盘的 block 的个数。indiret 为 0
时,表示不使用一级索引块。(因为 block 0 用来保存 super
block它不可能被其他任何文件或目录使用所以这么设计也是合理的
默认的ucore 里 SFS\_NDIRECT 是 12即直接索引的数据页大小为 12 \* 4k = 48k当使用一级间接数据块索引时ucore 支持最大的文件大小为 12 \* 4k + 1024 \* 4k = 48k + 4m。数据索引表内0 表示一个无效的索引inode 里 blocks 表示该文件或者目录占用的磁盘的 block 的个数。indiret 为 0 时,表示不使用一级索引块。(因为 block 0 用来保存 super block它不可能被其他任何文件或目录使用所以这么设计也是合理的
对于普通文件,索引值指向的 block
中保存的是文件中的数据。而对于目录,索引值指向的数据保存的是目录下所有的文件名以及对应的索引节点所在的索引块(磁盘块)所形成的数组。数据结构如下:
```
/* file entry (on disk) */
struct sfs_disk_entry {
@ -303,16 +297,13 @@ struct sfs_disk_entry {
char name[SFS_MAX_FNAME_LEN + 1]; 文件名
};
```
操作系统中,每个文件系统下的 inode 都应该分配唯一的 inode 编号。SFS
下,为了实现的简便(偷懒),每个 inode 直接用他所在的磁盘 block 的编号作为
inode 编号。比如root block 的 inode 编号为 1每个 sfs\_disk\_entry
数据结构中name 表示目录下文件或文件夹的名称ino 表示磁盘 block
编号,通过读取该 block 的数据,能够得到相应的文件或文件夹的 inode。ino 为0
时,表示一个无效的 entry。
操作系统中,每个文件系统下的 inode 都应该分配唯一的 inode 编号。SFS 下,为了实现的简便(偷懒),每个 inode 直接用他所在的磁盘 block 的编号作为 inode 编号。比如root block 的 inode 编号为 1每个 sfs\_disk\_entry 数据结构中name 表示目录下文件或文件夹的名称ino 表示磁盘 block 编号,通过读取该 block 的数据,能够得到相应的文件或文件夹的 inode。ino 为0时表示一个无效的 entry。
此外,和 inode 相似,每个 sfs\_dirent\_entry 也占用一个 block。
**内存中的索引节点**
```
/* inode for sfs */
struct sfs_inode {
@ -326,45 +317,22 @@ struct sfs_inode {
list_entry_t hash_link; /* entry for hash linked-list in sfs_fs */
};
```
可以看到SFS中的内存inode包含了SFS的硬盘inode信息而且还增加了其他一些信息这属于是便于进行是判断否改写、互斥操作、回收和快速地定位等作用。需要注意一个内存inode是在打开一个文件后才创建的如果关机则相关信息都会消失。而硬盘inode的内容是保存在硬盘中的只是在进程需要时才被读入到内存中用于访问文件或目录的具体内容数据
为了方便实现上面提到的多级数据的访问以及目录中 entry 的操作,对 inode
SFS实现了一些辅助的函数
1. sfs\_bmap\_load\_nolock将对应 sfs\_inode 的第 index 个索引指向的
block 的索引值取出存到相应的指针指向的单元ino\_store。该函数只接受
index <= inode-\>blocks 的参数。当 index == inode-\>blocks
时,该函数理解为需要为 inode 增长一个 block。并标记 inode 为 dirty所有对
inode 数据的修改都要做这样的操作,这样,当 inode 不再使用的时候sfs
能够保证 inode 数据能够被写回到磁盘。sfs\_bmap\_load\_nolock 调用的
sfs\_bmap\_get\_nolock 来完成相应的操作,阅读
sfs\_bmap\_get\_nolock了解他是如何工作的。sfs\_bmap\_get\_nolock 只由
sfs\_bmap\_load\_nolock 调用)
2. sfs\_bmap\_truncate\_nolock将多级数据索引表的最后一个 entry
释放掉。他可以认为是 sfs\_bmap\_load\_nolock 中index == inode-\>blocks
的逆操作。当一个文件或目录被删除时sfs 会循环调用该函数直到
inode-\>blocks 减为 0释放所有的数据页。函数通过 sfs\_bmap\_free\_nolock
来实现,他应该是 sfs\_bmap\_get\_nolock 的逆操作。和
sfs\_bmap\_get\_nolock 一样,调用 sfs\_bmap\_free\_nolock 也要格外小心。
3. sfs\_dirent\_read\_nolock将目录的第 slot 个 entry
读取到指定的内存空间。他通过上面提到的函数来完成。
4. sfs\_dirent\_write\_nolock用指定的 entry 来替换某个目录下的第 slot
个entry。他通过调用 sfs\_bmap\_load\_nolock保证当第 slot 个entry
不存在时slot == inode-\>blocksSFS 会分配一个新的
entry即在目录尾添加了一个 entry。
5. sfs\_dirent\_search\_nolock是常用的查找函数。他在目录下查找
name并且返回相应的搜索结果文件或文件夹的 inode
的编号(也是磁盘编号),和相应的 entry 在该目录的 index
编号以及目录下的数据页是否有空闲的 entry。SFS
实现里文件的数据页是连续的,不存在任何空洞;而对于目录,数据页不是连续的,当某个
entry 删除的时候SFS 通过设置 entry-\>ino 为0将该 entry 所在的 block
标记为 free在需要添加新 entry 的时候SFS 优先使用这些 free 的
entry其次才会去在数据页尾追加新的 entry。
1. sfs\_bmap\_load\_nolock将对应 sfs\_inode 的第 index 个索引指向的 block 的索引值取出存到相应的指针指向的单元ino\_store。该函数只接受 index <= inode-\>blocks 的参数。当 index == inode-\>blocks 时,该函数理解为需要为 inode 增长一个 block。并标记 inode 为 dirty所有对 inode 数据的修改都要做这样的操作,这样,当 inode 不再使用的时候sfs 能够保证 inode 数据能够被写回到磁盘。sfs\_bmap\_load\_nolock 调用的 sfs\_bmap\_get\_nolock 来完成相应的操作,阅读 sfs\_bmap\_get\_nolock了解他是如何工作的。sfs\_bmap\_get\_nolock 只由 sfs\_bmap\_load\_nolock 调用)
2. sfs\_bmap\_truncate\_nolock将多级数据索引表的最后一个 entry 释放掉。他可以认为是 sfs\_bmap\_load\_nolock 中index == inode-\>blocks 的逆操作。当一个文件或目录被删除时sfs 会循环调用该函数直到 inode-\>blocks 减为 0释放所有的数据页。函数通过 sfs\_bmap\_free\_nolock 来实现,他应该是 sfs\_bmap\_get\_nolock 的逆操作。和 sfs\_bmap\_get\_nolock 一样,调用 sfs\_bmap\_free\_nolock 也要格外小心。
3. sfs\_dirent\_read\_nolock将目录的第 slot 个 entry 读取到指定的内存空间。他通过上面提到的函数来完成。
4. sfs\_dirent\_write\_nolock用指定的 entry 来替换某个目录下的第 slot 个entry。他通过调用 sfs\_bmap\_load\_nolock保证当第 slot 个entry 不存在时slot == inode-\>blocksSFS 会分配一个新的entry即在目录尾添加了一个 entry。
5. sfs\_dirent\_search\_nolock是常用的查找函数。他在目录下查找 name并且返回相应的搜索结果文件或文件夹的 inode 的编号(也是磁盘编号),和相应的 entry 在该目录的 index 编号以及目录下的数据页是否有空闲的 entry。SFS 实现里文件的数据页是连续的,不存在任何空洞;而对于目录,数据页不是连续的,当某个 entry 删除的时候SFS 通过设置 entry-\>ino 为0将该 entry 所在的 block 标记为 free在需要添加新 entry 的时候SFS 优先使用这些 free 的 entry其次才会去在数据页尾追加新的 entry。
注意,这些后缀为 nolock 的函数,只能在已经获得相应 inode 的semaphore
才能调用。
注意,这些后缀为 nolock 的函数,只能在已经获得相应 inode 的semaphore才能调用。
**Inode的文件操作函数**
```
static const struct inode_ops sfs_node_fileops = {
.vop_magic = VOP_MAGIC,
@ -375,19 +343,22 @@ static const struct inode_ops sfs_node_fileops = {
……
};
```
上述sfs\_openfile、sfs\_close、sfs\_read和sfs\_write分别对应用户进程发出的open、close、read、write操作。其中sfs\_openfile不用做什么事sfs\_close需要把对文件的修改内容写回到硬盘上这样确保硬盘上的文件内容数据是最新的sfs\_read和sfs\_write函数都调用了一个函数sfs\_io并最终通过访问硬盘驱动来完成对文件内容数据的读写。
**Inode的目录操作函数**
```
static const struct inode_ops sfs_node_dirops = {
.vop_magic = VOP_MAGIC,
.vop_open = sfs_opendir,
.vop_close = sfs_close,
.vop_getdirentry = sfs_getdirentry,
.vop_lookup = sfs_lookup,
.vop_lookup = sfs_lookup,
……
};
```
对于目录操作而言由于目录也是一种文件所以sfs\_opendir、sys\_close对应户进程发出的open、close函数。相对于sfs\_opensfs\_opendir只是完成一些open函数传递的参数判断没做其他更多的事情。目录的close操作与文件的close操作完全一致。由于目录的内容数据与文件的内容数据不同所以读出目录的内容数据的函数是sfs\_getdirentry其主要工作是获取目录下的文件inode信息。
### 3.4 文件系统抽象层 -VFS
@ -397,6 +368,7 @@ static const struct inode_ops sfs_node_dirops = {
#### 3.4.1 file&dir接口
file&dir接口层定义了进程在内核中直接访问的文件相关信息这定义在file数据结构中具体描述如下
```
struct file {
enum {
@ -410,8 +382,9 @@ struct file {
atomic_t open_count; //打开此文件的次数
};
```
而在kern/process/proc.h中的proc\_struct结构中描述了进程访问文件的数据接口
fs\_struct其数据结构定义如下
而在kern/process/proc.h中的proc\_struct结构中描述了进程访问文件的数据接口fs\_struct其数据结构定义如下
```
struct fs_struct {
struct inode *pwd; //进程当前执行目录的内存inode指针
@ -420,12 +393,14 @@ struct fs_struct {
semaphore_t fs_sem; //确保对进程控制块中fs_struct的互斥访问
};
```
当创建一个进程后该进程的fs\_struct将会被初始化或复制父进程的fs\_struct。当用户进程打开一个文件时将从filemap数组中取得一个空闲file项然后会把此file的成员变量node指针指向一个代表此文件的inode的起始地址。
#### 3.4.2 inode 接口
index
node是位于内存的索引节点它是VFS结构中的重要数据结构因为它实际负责把不同文件系统的特定索引节点信息甚至不能算是一个索引节点统一封装起来避免了进程直接访问具体文件系统。其定义如下
```
struct inode {
union { //包含不同文件系统特定inode信息的union成员变量
@ -442,7 +417,9 @@ struct inode {
const struct inode_ops *in_ops; //抽象的inode操作包含访问inode的函数指针
};
```
在inode中有一成员变量为in\_ops这是对此inode的操作函数指针列表其数据结构定义如下
```
struct inode_ops {
unsigned long vop_magic;
@ -456,6 +433,7 @@ int (*vop_lookup)(struct inode *node, char *path, struct inode **node_store);
……
};
```
参照上面对SFS中的索引节点操作函数的说明可以看出inode\_ops是对常规文件、目录、设备文件所有操作的一个抽象函数表示。对于某一具体的文件系统中的文件或目录只需实现相关的函数就可以被用户进程访问具体的文件了且用户进程无需了解具体文件系统的实现细节。
### 3.5 设备层文件 IO 层
@ -464,8 +442,8 @@ int (*vop_lookup)(struct inode *node, char *path, struct inode **node_store);
#### 3.5.1 关键数据结构
为了表示一个设备需要有对应的数据结构ucore为此定义了struct
device其描述如下
为了表示一个设备需要有对应的数据结构ucore为此定义了struct device其描述如下
```
struct device {
size_t d_blocks; //设备占用的数据块个数
@ -476,9 +454,11 @@ struct device {
int (*d_ioctl)(struct device *dev, int op, void *data); //用ioctl方式控制设备的函数指针
};
```
这个数据结构能够支持对块设备比如磁盘、字符设备比如键盘、串口的表示完成对设备的基本操作。ucore虚拟文件系统为了把这些设备链接在一起还定义了一个设备链表即双向链表vdev\_list这样通过访问此链表可以找到ucore能够访问的所有设备文件。
但这个设备描述没有与文件系统以及表示一个文件的inode数据结构建立关系为此还需要另外一个数据结构把device和inode联通起来这就是vfs\_dev\_t数据结构
```
// device info entry in vdev_list
typedef struct {
@ -489,19 +469,21 @@ typedef struct {
list_entry_t vdev_link;
} vfs_dev_t;
```
利用vfs\_dev\_t数据结构就可以让文件系统通过一个链接vfs\_dev\_t结构的双向链表找到device对应的inode数据结构一个inode节点的成员变量in\_type的值是0x1234则此
inode的成员变量in\_info将成为一个device结构。这样inode就和一个设备建立了联系这个inode就是一个设备文件。
利用vfs\_dev\_t数据结构就可以让文件系统通过一个链接vfs\_dev\_t结构的双向链表找到device对应的inode数据结构一个inode节点的成员变量in\_type的值是0x1234则此 inode的成员变量in\_info将成为一个device结构。这样inode就和一个设备建立了联系这个inode就是一个设备文件。
#### 3.5.2 stdout设备文件
**初始化**
既然stdout设备是设备文件系统的文件自然有自己的inode结构。在系统初始化时即只需如下处理过程
```
kern_init-->fs_init-->dev_init-->dev_init_stdout --> dev_create_inode
--> stdout_device_init
--> vfs_add_dev
```
在dev\_init\_stdout中完成了对stdout设备文件的初始化。即首先创建了一个inode然后通过stdout\_device\_init完成对inode中的成员变量inode-\>\_\_device\_info进行初始
这里的stdout设备文件实际上就是指的console外设它其实是串口、并口和CGA的组合型外设。这个设备文件是一个只写设备如果读这个设备就会出错。接下来我们看看stdout设备的相关处理过程。
@ -509,6 +491,7 @@ kern_init-->fs_init-->dev_init-->dev_init_stdout --> dev_create_inode
**初始化**
stdout设备文件的初始化过程主要由stdout\_device\_init完成其具体实现如下
```
static void
stdout_device_init(struct device *dev) {
@ -520,11 +503,13 @@ stdout_device_init(struct device *dev) {
dev->d_ioctl = stdout_ioctl;
}
```
可以看到stdout\_open函数完成设备文件打开工作如果发现用户进程调用open函数的参数flags不是只写O\_WRONLY则会报错。
**访问操作实现**
stdout\_io函数完成设备的写操作工作具体实现如下
```
static int
stdout_io(struct device *dev, struct iobuf *iob, bool write) {
@ -538,6 +523,7 @@ stdout_io(struct device *dev, struct iobuf *iob, bool write) {
return -E_INVAL;
}
```
可以看到要写的数据放在iob-\>io\_base所指的内存区域一直写到iob-\>io\_resid的值为0为止。每次写操作都是通过cputchar来完成的此函数最终将通过console外设驱动来完成把数据输出到串口、并口和CGA显示器上过程。另外也可以注意到如果用户想执行读操作则stdout\_io函数直接返回错误值**-**E\_INVAL。
#### 3.5.3 stdin 设备文件
@ -547,6 +533,7 @@ stdout_io(struct device *dev, struct iobuf *iob, bool write) {
**初始化**
stdin设备文件的初始化过程主要由stdin\_device\_init完成了主要的初始化工作具体实现如下
```
static void
stdin_device_init(struct device *dev) {
@ -561,11 +548,13 @@ stdin_device_init(struct device *dev) {
wait_queue_init(wait_queue);
}
```
相对于stdout的初始化过程stdin的初始化相对复杂一些多了一个stdin\_buffer缓冲区描述缓冲区读写位置的变量p\_rpos、p\_wpos以及用于等待缓冲区的等待队列wait\_queue。在stdin\_device\_init函数的初始化中也完成了对p\_rpos、p\_wpos和wait\_queue的初始化。
**访问操作实现**
stdin\_io函数负责完成设备的读操作工作具体实现如下
```
static int
stdin_io(struct device *dev, struct iobuf *iob, bool write) {
@ -581,6 +570,7 @@ stdin_io(struct device *dev, struct iobuf *iob, bool write) {
```
可以看到如果是写操作则stdin\_io函数直接报错返回。所以这也进一步说明了此设备文件是只读文件。如果此读操作则此函数进一步调用dev\_stdin\_read函数完成对键盘设备的读入操作。dev\_stdin\_read函数的实现相对复杂一些主要的流程如下
```
static int
dev_stdin_read(char *buf, size_t len) {
@ -614,9 +604,7 @@ dev_stdin_read(char *buf, size_t len) {
}
```
在上述函数中可以看出如果p\_rpos <
p\_wpos则表示有键盘输入的新字符在stdin\_buffer中于是就从stdin\_buffer中取出新字符放到iobuf指向的缓冲区中如果p\_rpos
\>=p\_wpos则表明没有新字符这样调用read用户态库函数的用户进程就需要采用等待队列的睡眠操作进入睡眠状态等待键盘输入字符的产生。
在上述函数中可以看出如果p\_rpos < p\_wpos则表示有键盘输入的新字符在stdin\_buffer中于是就从stdin\_buffer中取出新字符放到iobuf指向的缓冲区中如果p\_rpos \>=p\_wpos则表明没有新字符这样调用read用户态库函数的用户进程就需要采用等待队列的睡眠操作进入睡眠状态等待键盘输入字符的产生。
键盘输入字符后如何唤醒等待键盘输入的用户进程呢回顾lab1中的外设中断处理可以了解到当用户敲击键盘时会产生键盘中断在trap\_dispatch函数中当识别出中断是键盘中断中断号为IRQ\_OFFSET + IRQ\_KBD会调用dev\_stdin\_write函数来把字符写入到stdin\_buffer中且会通过等待队列的唤醒操作唤醒正在等待键盘输入的用户进程。
@ -624,53 +612,46 @@ p\_wpos则表示有键盘输入的新字符在stdin\_buffer中于是就从
与实验七相比实验八增加了文件系统并因此实现了通过文件系统来加载可执行文件到内存中运行的功能导致对进程管理相关的实现比较大的调整。我们来简单看看文件系统是如何初始化并能在ucore的管理下正常工作的。
首先看看kern\_init函数可以发现与lab7相比增加了对fs\_init函数的调用。fs\_init函数就是文件系统初始化的总控函数它进一步调用了虚拟文件系统初始化函数vfs\_init与文件相关的设备初始化函数dev\_init和Simple
FS文件系统的初始化函数sfs\_init。这三个初始化函数联合在一起协同完成了整个虚拟文件系统、SFS文件系统和文件系统对应的设备键盘、串口、磁盘的初始化工作。其函数调用关系图如下所示
首先看看kern\_init函数可以发现与lab7相比增加了对fs\_init函数的调用。fs\_init函数就是文件系统初始化的总控函数它进一步调用了虚拟文件系统初始化函数vfs\_init与文件相关的设备初始化函数dev\_init和Simple FS文件系统的初始化函数sfs\_init。这三个初始化函数联合在一起协同完成了整个虚拟文件系统、SFS文件系统和文件系统对应的设备键盘、串口、磁盘的初始化工作。其函数调用关系图如下所示
![image](lab8/image004.png)
文件系统初始化调用关系图
参考上图并结合源码分析可大致了解到文件系统的整个初始化流程。vfs\_init主要建立了一个device
list双向链表vdev\_list为后续具体设备键盘、串口、磁盘以文件的形式呈现建立查找访问通道。dev\_init函数通过进一步调用disk0/stdin/stdout\_device\_init完成对具体设备的初始化把它们抽象成一个设备文件并建立对应的inode数据结构最后把它们链入到vdev\_list中。这样通过虚拟文件系统就可以方便地以文件的形式访问这些设备了。sfs\_init是完成对Simple
FS的初始化工作并把此实例文件系统挂在虚拟文件系统中从而让ucore的其他部分能够通过访问虚拟文件系统的接口来进一步访问到SFS实例文件系统。
list双向链表vdev\_list为后续具体设备键盘、串口、磁盘以文件的形式呈现建立查找访问通道。dev\_init函数通过进一步调用disk0/stdin/stdout\_device\_init完成对具体设备的初始化把它们抽象成一个设备文件并建立对应的inode数据结构最后把它们链入到vdev\_list中。这样通过虚拟文件系统就可以方便地以文件的形式访问这些设备了。sfs\_init是完成对Simple FS的初始化工作并把此实例文件系统挂在虚拟文件系统中从而让ucore的其他部分能够通过访问虚拟文件系统的接口来进一步访问到SFS实例文件系统。
### 3.7 文件操作实现
#### 3.7.1 打开文件
有了上述分析后我们可以看看如果一个用户进程打开文件会做哪些事情首先假定用户进程需要打开的文件已经存在在硬盘上。以user/sfs\_filetest1.c为例首先用户进程会调用在main函数中的如下语句
```
int fd1 = safe_open("/test/testfile", O_RDWR | O_TRUNC);
```
从字面上可以看出如果ucore能够正常查找到这个文件就会返回一个代表文件的文件描述符fd1这样在接下来的读写文件过程中就直接用这样fd1来代表就可以了。那这个打开文件的过程是如何一步一步实现的呢
**通用文件访问接口层的处理流程**
首先进入通用文件访问接口层的处理流程,即进一步调用如下用户态函数:
open-\>sys\_open-\>syscall
从而引起系统调用进入到内核态。到了内核态后通过中断处理例程会调用到sys\_open内核函数并进一步调用sysfile\_open内核函数。到了这里需要把位于用户空间的字符串"/test/testfile"拷贝到内核空间中的字符串path中并进入到文件系统抽象层的处理流程完成进一步的打开文件操作中。
首先进入通用文件访问接口层的处理流程,即进一步调用如下用户态函数: open-\>sys\_open-\>syscall从而引起系统调用进入到内核态。到了内核态后通过中断处理例程会调用到sys\_open内核函数并进一步调用sysfile\_open内核函数。到了这里需要把位于用户空间的字符串"/test/testfile"拷贝到内核空间中的字符串path中并进入到文件系统抽象层的处理流程完成进一步的打开文件操作中。
**文件系统抽象层的处理流程**
1. 分配一个空闲的file数据结构变量file
在文件系统抽象层的处理中首先调用的是file\_open函数它要给这个即将打开的文件分配一个file数据结构的变量这个变量其实是当前进程的打开文件数组current-\>fs\_struct-\>filemap[]中的一个空闲元素即还没用于一个打开的文件而这个元素的索引值就是最终要返回到用户进程并赋值给变量fd1。到了这一步还仅仅是给当前用户进程分配了一个file数据结构的变量还没有找到对应的文件索引节点。
1. 分配一个空闲的file数据结构变量file在文件系统抽象层的处理中首先调用的是file\_open函数它要给这个即将打开的文件分配一个file数据结构的变量这个变量其实是当前进程的打开文件数组current-\>fs\_struct-\>filemap[]中的一个空闲元素即还没用于一个打开的文件而这个元素的索引值就是最终要返回到用户进程并赋值给变量fd1。到了这一步还仅仅是给当前用户进程分配了一个file数据结构的变量还没有找到对应的文件索引节点。
为此需要进一步调用vfs\_open函数来找到path指出的文件所对应的基于inode数据结构的VFS索引节点node。vfs\_open函数需要完成两件事情通过vfs\_lookup找到path对应文件的inode调用vop\_open函数打开文件。
2. 找到文件设备的根目录“/”的索引节点
需要注意这里的vfs\_lookup函数是一个针对目录的操作函数它会调用vop\_lookup函数来找到SFS文件系统中的“/test”目录下的“testfile”文件。为此vfs\_lookup函数首先调用get\_device函数并进一步调用vfs\_get\_bootfs函数其实调用了来找到根目录“/”对应的inode。这个inode就是位于vfs.c中的inode变量bootfs\_node。这个变量在init\_main函数位于kern/process/proc.c执行时获得了赋值。
2. 找到文件设备的根目录“/”的索引节点需要注意这里的vfs\_lookup函数是一个针对目录的操作函数它会调用vop\_lookup函数来找到SFS文件系统中的“/test”目录下的“testfile”文件。为此vfs\_lookup函数首先调用get\_device函数并进一步调用vfs\_get\_bootfs函数其实调用了来找到根目录“/”对应的inode。这个inode就是位于vfs.c中的inode变量bootfs\_node。这个变量在init\_main函数位于kern/process/proc.c执行时获得了赋值。
3. 找到根目录“/”下的“test”子目录对应的索引节点
在找到根目录对应的inode后通过调用vop\_lookup函数来查找“/”和“test”这两层目录下的文件“testfile”所对应的索引节点如果找到就返回此索引节点。
3. 找到根目录“/”下的“test”子目录对应的索引节点在找到根目录对应的inode后通过调用vop\_lookup函数来查找“/”和“test”这两层目录下的文件“testfile”所对应的索引节点如果找到就返回此索引节点。
4. 把file和node建立联系
完成第3步后将返回到file\_open函数中通过执行语句“file-\>node=node;”就把当前进程的current-\>fs\_struct-\>filemap[fd]即file所指变量的成员变量node指针指向了代表“/test/testfile”文件的索引节点node。这时返回fd。经过重重回退通过系统调用返回用户态的syscall-\>sys\_open-\>open-\>safe\_open等用户函数的层层函数返回最终把把fd赋值给fd1。自此完成了打开文件操作。但这里我们还没有分析第2和第3步是如何进一步调用SFS文件系统提供的函数找位于SFS文件系统上的“/test/testfile”所对应的sfs磁盘inode的过程。下面需要进一步对此进行分析。
4. 把file和node建立联系。完成第3步后将返回到file\_open函数中通过执行语句“file-\>node=node;”就把当前进程的current-\>fs\_struct-\>filemap[fd]即file所指变量的成员变量node指针指向了代表“/test/testfile”文件的索引节点node。这时返回fd。经过重重回退通过系统调用返回用户态的syscall-\>sys\_open-\>open-\>safe\_open等用户函数的层层函数返回最终把把fd赋值给fd1。自此完成了打开文件操作。但这里我们还没有分析第2和第3步是如何进一步调用SFS文件系统提供的函数找位于SFS文件系统上的“/test/testfile”所对应的sfs磁盘inode的过程。下面需要进一步对此进行分析。
**SFS文件系统层的处理流程**
这里需要分析文件系统抽象层中没有彻底分析的vop\_lookup函数到底做了啥。下面我们来看看。在sfs\_inode.c中的sfs\_node\_dirops变量定义了“.vop\_lookup
= sfs\_lookup”所以我们重点分析sfs\_lookup的实现。
这里需要分析文件系统抽象层中没有彻底分析的vop\_lookup函数到底做了啥。下面我们来看看。在sfs\_inode.c中的sfs\_node\_dirops变量定义了“.vop\_lookup = sfs\_lookup”所以我们重点分析sfs\_lookup的实现。
sfs\_lookup有三个参数nodepathnode\_store。其中node是根目录“/”所对应的inode节点path是文件“testfile”的绝对路径“/test/testfile”而node\_store是经过查找获得的“testfile”所对应的inode节点。
@ -681,9 +662,11 @@ Sfs\_lookup函数以“/”为分割符从左至右逐一分解path获得各
#### 3.7.2 读文件
读文件其实就是读出目录中的目录项,首先假定文件在磁盘上且已经打开。用户进程有如下语句:
```
read(fd, data, len);
```
即读取fd对应文件读取长度为len存入data中。下面来分析一下读文件的实现。
**通用文件访问接口层的处理流程**
@ -699,35 +682,26 @@ read(fd, data, len);
3) 读文件过程
[1] 实际读文件
循环读取文件每次读取buffer大小。每次循环中先检查剩余部分大小若其小于4096字节则只读取剩余部分的大小。然后调用file\_read函数详细分析见后将文件内容读取到buffer中alen为实际大小。调用copy\_to\_user函数将读到的内容拷贝到用户的内存空间中调整各变量以进行下一次循环读取直至指定长度读取完成。最后函数调用层层返回至用户程序用户程序收到了读到的文件内容。
[2] file\_read函数
这个函数是读文件的核心函数。函数有4个参数fd是文件描述符base是缓存的基地址len是要读取的长度copied\_store存放实际读取的长度。函数首先调用fd2file函数找到对应的file结构并检查是否可读。调用filemap\_acquire函数使打开这个文件的计数加1。调用vop\_read函数将文件内容读到iob中详细分析见后。调整文件指针偏移量pos的值使其向后移动实际读到的字节数iobuf\_used(iob)。最后调用filemap\_release函数使打开这个文件的计数减1若打开计数为0则释放file。
**SFS文件系统层的处理流程**
vop\_read函数实际上是对sfs\_read的包装。在sfs\_inode.c中sfs\_node\_fileops变量定义了.vop\_read
= sfs\_read所以下面来分析sfs\_read函数的实现。
vop\_read函数实际上是对sfs\_read的包装。在sfs\_inode.c中sfs\_node\_fileops变量定义了.vop\_read = sfs\_read所以下面来分析sfs\_read函数的实现。
sfs\_read函数调用sfs\_io函数。它有三个参数node是对应文件的inodeiob是缓存write表示是读还是写的布尔值0表示读1表示写这里是0。函数先找到inode对应sfs和sin然后调用sfs\_io\_nolock函数进行读取文件操作最后调用iobuf\_skip函数调整iobuf的指针。
在sfs\_io\_nolock函数中先计算一些辅助变量并处理一些特殊情况比如越界然后有sfs\_buf\_op
= sfs\_rbuf,sfs\_block\_op =
sfs\_rblock设置读取的函数操作。接着进行实际操作先处理起始的没有对齐到块的部分再以块为单位循环处理中间的部分最后处理末尾剩余的部分。每部分中都调用sfs\_bmap\_load\_nolock函数得到blkno对应的inode编号并调用sfs\_rbuf或sfs\_rblock函数读取数据中间部分调用sfs\_rblock起始和末尾部分调用sfs\_rbuf调整相关变量。完成后如果offset
+ alen \>
din-\>fileinfo.size写文件时会出现这种情况读文件时不会出现这种情况alen为实际读写的长度则调整文件大小为offset
+ alen并设置dirty变量。
在sfs\_io\_nolock函数中先计算一些辅助变量并处理一些特殊情况比如越界然后有sfs\_buf\_op = sfs\_rbuf,sfs\_block\_op = sfs\_rblock设置读取的函数操作。接着进行实际操作先处理起始的没有对齐到块的部分再以块为单位循环处理中间的部分最后处理末尾剩余的部分。每部分中都调用sfs\_bmap\_load\_nolock函数得到blkno对应的inode编号并调用sfs\_rbuf或sfs\_rblock函数读取数据中间部分调用sfs\_rblock起始和末尾部分调用sfs\_rbuf调整相关变量。完成后如果offset + alen \> din-\>fileinfo.size写文件时会出现这种情况读文件时不会出现这种情况alen为实际读写的长度则调整文件大小为offset + alen并设置dirty变量。
sfs\_bmap\_load\_nolock函数将对应sfs\_inode的第index个索引指向的block的索引值取出存到相应的指针指向的单元ino\_store。它调用sfs\_bmap\_get\_nolock来完成相应的操作。sfs\_rbuf和sfs\_rblock函数最终都调用sfs\_rwblock\_nolock函数完成操作而sfs\_rwblock\_nolock函数调用dop\_io-\>disk0\_io-\>disk0\_read\_blks\_nolock-\>ide\_read\_secs完成对磁盘的操作。
## 4. 实验报告要求
从网站上下载lab8.zip后解压得到本文档和代码目录
lab8完成实验中的各个练习。完成代码编写并检查无误后在对应目录下执行
make handin 任务,即会自动生成
lab8-handin.tar.gz。最后请一定提前或按时提交到网络学堂上。
从网站上下载lab8.zip后解压得到本文档和代码目录lab8完成实验中的各个练习。完成代码编写并检查无误后在对应目录下执行 make handin 任务即会自动生成lab8-handin.tar.gz。最后请一定提前或按时提交到网络学堂上。
注意有“LAB8”的注释这是需要主要修改的内容。代码中所有需要完成的地方challenge除外都有“LAB8”和“YOUR
CODE”的注释请在提交时特别注意保持注释并将“YOUR
CODE”替换为自己的学号并且将所有标有对应注释的部分填上正确的代码。
注意有“LAB8”的注释这是需要主要修改的内容。代码中所有需要完成的地方challenge除外都有“LAB8”和“YOUR CODE”的注释请在提交时特别注意保持注释并将“YOUR CODE”替换为自己的学号并且将所有标有对应注释的部分填上正确的代码。