介绍Linux下的系统调用过程
2024年04月11日
54
在应用程序中,很多时候都会调用到系统调用来完成一些操作,可是系统调用是在内核态下才能调用,用户态下的应用程序是无法直接调用到的,那么操作系统是怎么处理这一过程的呢?本文的环境是基于Linux 0.11,没有查证现代操作系统是否有所变化,不过基本思路应该差不多。

先来看一张图,有个大概的理解。

image.png

首先,应用程序能直接调用的是系统提供的API,这个在用户态(Ring3)下就可做到。

然后相应的API就会将相应的系统调用号保存到eax寄存器中(这一步通过内联汇编实现),之后就是使用int 0x80触发中断(内联汇编),进入到中断处理函数中(该函数是完全由汇编代码编写),这个时候就进入到了内核态(Ring0)了。

在中断处理函数中就会调用与系统调用号相对应的那个系统调用。在这个函数中,会把ds、es这两个寄存器设置为指向内核空间。这样一来,我们无法把数据从用户态中传到内核态啊(如open(const char * filename, int flag, ...)中,filename指针指向的字符串的地址是在用户空间中的,在内核空间相应的地方取的话根本没有该字符串),这该怎么办呢?中断处理函数中的fs寄存器被设置为指向了用户空间,所以问题得以解决。

在系统调用中就是进行相应的操作了,如打开文件、写文件等。

处理完后,将会返回到中断处理函数,返回值保存在eax寄存器中。

从中断处理函数中返回到API,依旧是把返回值保存到eax寄存器中。这个时候就从内核态恢复成用户态。

在API中从eax中取出值,做相应的判断返回不同的值,用以表示操作完成情况。

为什么使用int 0x80中断能调用那么多系统调用?

在保护模式下,有各种各样的中断,而系统调用就和0x80号中断绑定。当要调用系统调用时,就触发int 0x80,中断处理函数就通过eax获知想要调用的是哪一个系统调用。这样做的原因是系统调用数量太多,中断号会不够用,所以用一个来集中管理。

操作系统中有一个表,是用来保存各个系统调用函数的地址的。这个表是一个数组,所以通过下标就可以访问到不同函数的地址。故可以做到一个中断号+各样的系统调用号就管理多个系统调用。