Kernel Exploring
  • 前言
  • 支持
  • 老司机带你探索内核编译系统
    • 编译出你的第一个内核
    • 内核编译中的小目标
    • 可能是kbuild中最直接的小目标 – help
    • 使用了一个kbuild函数的目标 – cscope
    • 内核中单个.o文件的编译过程
    • 根目录vmlinux的编译过程
    • 启动镜像bzImage的前世今生
    • setup.bin的诞生记
    • 真假vmlinux–由vmlinux.bin揭开的秘密
    • bzImage的全貌
    • kbuild系统浅析
  • 启动时的小秘密
    • INIT_CALLS的秘密
    • 内核参数
  • 内核加载全流程
    • bootloader如何加载bzImage
    • 内核压缩与解压
    • 内核加载的几个阶段
    • 保护模式内核代码赏析
  • 内存管理
    • 内核页表成长记
      • 未解压时的内核页表
      • 内核早期的页表
      • cleanup_highmap之后的页表
      • 映射完整物理地址
      • 启用init_level4_pgt
    • 自底而上话内存
      • e820从硬件获取内存分布
      • 原始内存分配器--memblock
      • 页分配器
        • 寻找页结构体的位置
        • 眼花的页结构体
        • Node-Zone-Page
        • 传说的伙伴系统
        • Compound Page
        • GFP的功效
        • 页分配器的用户们
      • slub分配器
        • slub的理念
        • 图解slub
      • 内存管理的不同粒度
      • 挑战和进化
        • 扩展性的设计和实现
        • 减少竞争 per_cpu_pageset
        • 海量内存
        • 延迟初始化
        • 内存热插拔
        • 连续内存分配器
    • 虚拟内存空间
      • 页表和缺页中断
      • 虚拟地址空间的管家--vma
      • 匿名反向映射的前世今生
      • 图解匿名反向映射
      • THP和mapcount之间的恩恩怨怨
      • 透明大页的玄机
      • NUMA策略
      • numa balance
      • 老版vma
    • 内存的回收再利用
      • 水线
      • Big Picture
      • 手动触发回收
      • Page Fram Reclaim Algorithm
      • swapfile原理使用和演进
    • 内存隔离
      • memcg初始化
      • 限制memcg大小
      • 对memcg记账
    • 通用
      • 常用全局变量
      • 常用转换
    • 测试
      • 功能测试
      • 性能测试
  • 中断和异常
    • 从IDT开始
    • 中断?异常?有什么区别
    • 系统调用的实现
    • 异常向量表的设置
    • 中断向量和中断函数
    • APIC
    • 时钟中断
    • 软中断
    • 中断、软中断、抢占和多处理器
  • 设备模型
    • 总线
    • 驱动
    • 设备
    • 绑定
  • nvdimm初探
    • 使用手册
    • 上帝视角
    • nvdimm_bus
    • nvdimm
    • nd_region
    • nd_namespace_X
    • nd_dax
      • dev_dax
  • KVM
    • 内存虚拟化
      • Qemu内存模型
      • KVM内存管理
  • cgroup
    • 使用cgroup控制进程cpu和内存
    • cgroup文件系统
    • cgroup层次结构
    • cgroup和进程的关联
    • cgroup数据统计
  • 同步机制
    • 内存屏障
    • RCU
  • Trace/Profie/Debug
    • ftrace的使用
    • 探秘ftrace
    • 内核热补丁的黑科技
    • eBPF初探
    • TraceEvent
    • Drgn
  • 内核中的数据结构
    • 双链表
    • 优先级队列
    • 哈希表
    • xarray
    • B树
    • Maple Tree
    • Interval Tree
  • Tools
  • Good To Read
    • 内核自带文档
    • 内存相关
    • 下载社区邮件
Powered by GitBook
On this page
  • 全局观
  • 从def_idts开始
  • idtentry和异常处理函数
  • DO_ERROR和信号

Was this helpful?

  1. 中断和异常

异常向量表的设置

知道了IDT中前32个中断向量用来处理异常后,我就很想知道这些异常向量对应的IDT项是如何初始化的,如何对应到异常处理函数的。

这一小节我们就来解开这部分的谜团。

全局观

先来看看内核启动时,是在哪里初始化的异常向量表。

  start_kernel()
    trap_init()
      idt_setup_traps()
        idt_setup_from_table(idt_table, def_idts)

上面的流程中,基本看出了异常向量表初始化的位置。进一步从代码中可以看出,实际的工作就是把def_idts中的内容写到idt_table对应的异常向量中。

从def_idts开始

既然是将def_idts写到idt_table,那就来看看这个表的内容。

/* Interrupt gate */
#define INTG(_vector, _addr)				\
	G(_vector, _addr, DEFAULT_STACK, GATE_INTERRUPT, DPL0, __KERNEL_CS)

static const __initconst struct idt_data def_idts[] = {
	INTG(X86_TRAP_DE,		divide_error),
  ...
};

可以看到,这张表中的一项对应了一个异常处理。其中_addr就是异常处理函数了。

idtentry和异常处理函数

接着我们就要找到这个divide_error异常处理函数的定义了。开始我怎么也找不到,后来才发现这个divide_error的异常处理函数是在汇编代码中用idtentry来实现的。

idtentry divide_error			do_divide_error			has_error_code=0

.macro idtentry sym do_sym has_error_code:req paranoid=0 shift_ist=-1
ENTRY(\sym)
	UNWIND_HINT_IRET_REGS offset=\has_error_code*8

  ...

	call	\do_sym

  ...

END(\sym)
.endm

省略众多细节,突出大致结构。idtentry为每一个异常处理做了基本统一的处理,然后对应不同的异常再调用do_sym函数处理。对应divide_error,这个函数就是do_divide_error。

DO_ERROR和信号

内核为了代码简洁和统一,也用了一个宏DO_ERROR来定义统一的异常处理方式。

#define DO_ERROR(trapnr, signr, sicode, addr, str, name)		   \
dotraplinkage void do_##name(struct pt_regs *regs, long error_code)	   \
{									   \
	do_error_trap(regs, error_code, str, trapnr, signr, sicode, addr); \
}

DO_ERROR(X86_TRAP_DE,     SIGFPE,  FPE_INTDIV,   IP, "divide error",        divide_error)

从上面的代码片段可以看出,大家殊途同归,异常处理最后都走到了do_error_trap()函数,而这个函数最后又调用了do_trap()。

static void
do_trap(int trapnr, int signr, char *str, struct pt_regs *regs,
	long error_code, int sicode, void __user *addr)
{
	struct task_struct *tsk = current;


	if (!do_trap_no_signal(tsk, trapnr, str, regs, error_code))
		return;

	show_signal(tsk, signr, "trap ", str, regs, error_code);

	if (!sicode)
		force_sig(signr, tsk);
	else
		force_sig_fault(signr, sicode, addr, tsk);
}

所以异常处理的最后就是通过内核向该进程发送一个信号,由进程捕获该信号来处理。

从代码可以看到这个信号的值是signr,一路追踪divide_error对应的信号在DO_ERROR宏中定义为SIGFPE。到这里我们基本理清了异常向量初始化的内容,以及异常处理函数采用信号和进程通信。至于内核如何产生和发送信号,进程如何处理信号,那又是一个值得探索的话题了。

Previous系统调用的实现Next中断向量和中断函数

Last updated 3 years ago

Was this helpful?