linux-interface-02
The linux programming interface
系统编程概念
无论何时,执行了系统调用或者库函数,检查调用的返回状态以确定调用是否成功,是一条编程铁律。(消灭nil就好了)
系统调用
借助这一机制,进程可以请求内核以自己的名义去执行动作,以API 的形式,内核提供一系列服务供程序访问。(创建进程, IIO操作等)可以参考 csapp中的 异常控制流章节。
系统调用有以下特征:
- 系统调用将CPU 从用户态切换到 内核态,以便CPU访问受保护的内存等(越过保护机制)
- 系统调用的组成是固定的。每个系统调用都由一个唯一的数字来标识。(程序通过名称标识系统调用,对编号方案无需关心)
- 每个系统调用都有一套对应的参数,对用户态内核态的参数传递有一定规范
下面是一个系统调用的示例: - 应用程序调用C语言的函数库中的外壳(wrapper) 函数,来发起系统调用
- 外壳函数保证所有的系统调用参数可用,并将参数复制到寄存器
- 外壳函数会将系统调用编号复制到%eax中,用于区分不同的系统调用
- 外壳函数执行一条中断机器指令,引发CPU从用户态切换到内核态,并执行 todo
- 内核调用 system_call 来处理中断,
1) 在内核栈中保存寄存器数值
2)验证 系统调用的 编号有效性
3) 通过系统调用编号 发现对应的系统调用服务例程,检查参数的有效性,执行对应的代码逻辑。最后将结果状态返回给system_call
4) 从内核栈中回复各个寄存器值,并将系统调用返回值置于栈中
5) 返回值外壳函数,通知讲CPU切换到用户态 - 系统调用的服务例程返回值代表调用有误, 外壳函数会使用该值设定全局变量errno。外壳函数会返回到调用程序,并返回一个整数,标志系统调用是否成功。
为什么需要系统调用?
https://minnie.tuhs.org/CompArch/Lectures/week05.html
系统调用 与 用户空间的函数调用相比,会产生显著的开销,包括:用户态到内核态的切换,内核对参数的调用检查等。
库函数
库函数 的设计 是为了提供比底层系统 调用更为方便的调用接口,例如 printf函数 可提供格式化输出和数据缓存, 而write 系统调用只能输出 字节块, malloc, free 函数包装了 内存的释放和分配工作
处理错误
几乎所有的 系统调用都会返回某种类型的错误,用以表明 调用成功与否,要了解是否调用成功则必须坚持对状态进行检查。若调用失败则必须采取相应的行动,至少应该输出错误。 不检查状态,少写几行代码,听起来很诱人。实际上却会浪费掉大把的程序调试时间
这段陈述适用于 任何领域的编程工作, 简单的就是 人们常讲的 nil是一个百万的设计错误 一样。nil让他们忽略对他的检查,因为假定 变量不是nil的代码很清爽,可以减少很多的if判断,造成了nil是一个非常常见,频率高的错误。 那么正确的设计应该是什么样子呢? 答案或许是Option + 强制类型(弱类型语言不必要了,因为没有人可以阻止你不检查错误)
-
系统错误处理
通常返回值为-1 表示出错,系统调用失败后, 会将全局变量设定 errno 设定为一个正值来标记具体错误。但是如果系统调用和库函数成功,errno并不会被重置为0,所以单独的检查errno的设定来判断错误是错误的,因为可能是上个调用错误设定的数值。少数系统调用 在调用成功后(getpriority)依然返回-1, 要判断此类错误需要调用前将errno 设定为0, 然后根据errno判断是否错误。
打印错误, perror(“string”), char *strerror(int errorcode), strerror返回的字符串 指针是静态分配的,后续的调用会覆盖之前的调用。两个函数都是 locale-sensitive 语言环境敏感型,所以现实的是本地语言。 -
库函数的错误处理
不同的库函数在调用发生错误时候,返沪的数据类型和数值也各不相同,可以划分为几个类型:- 同系统调用完全相同, (remove 会调用unlink 或者rmdir)
- 出错时会返回-1之外的其他值,然后设定errno表明出错的具体情况 (fopen 出错返回 NULL 指针,同时设定errno)
- 根本不使用errno