Kernel Exploring
  • 前言
  • 支持
  • 老司机带你探索内核编译系统
    • 编译出你的第一个内核
    • 内核编译中的小目标
    • 可能是kbuild中最直接的小目标 – help
    • 使用了一个kbuild函数的目标 – cscope
    • 内核中单个.o文件的编译过程
    • 根目录vmlinux的编译过程
    • 启动镜像bzImage的前世今生
    • setup.bin的诞生记
    • 真假vmlinux–由vmlinux.bin揭开的秘密
    • bzImage的全貌
    • kbuild系统浅析
  • 启动时的小秘密
    • INIT_CALLS的秘密
    • 内核参数
  • 内核加载全流程
    • bootloader如何加载bzImage
    • 内核压缩与解压
    • 内核加载的几个阶段
    • 保护模式内核代码赏析
  • 内存管理
    • 内核页表成长记
      • 未解压时的内核页表
      • 内核早期的页表
      • cleanup_highmap之后的页表
      • 映射完整物理地址
      • 启用init_level4_pgt
    • 自底而上话内存
      • e820从硬件获取内存分布
      • 原始内存分配器--memblock
      • 页分配器
        • 寻找页结构体的位置
        • 眼花的页结构体
        • Node-Zone-Page
        • 传说的伙伴系统
        • Compound Page
        • GFP的功效
        • 页分配器的用户们
      • slub分配器
        • slub的理念
        • 图解slub
      • 内存管理的不同粒度
      • 挑战和进化
        • 扩展性的设计和实现
        • 减少竞争 per_cpu_pageset
        • 海量内存
        • 延迟初始化
        • 内存热插拔
        • 连续内存分配器
    • 虚拟内存空间
      • 页表和缺页中断
      • 虚拟地址空间的管家--vma
      • 匿名反向映射的前世今生
      • 图解匿名反向映射
      • THP和mapcount之间的恩恩怨怨
      • 透明大页的玄机
      • NUMA策略
      • numa balance
      • 老版vma
    • 内存的回收再利用
      • 水线
      • Big Picture
      • 手动触发回收
      • Page Fram Reclaim Algorithm
      • swapfile原理使用和演进
    • 内存隔离
      • memcg初始化
      • 限制memcg大小
      • 对memcg记账
    • 通用
      • 常用全局变量
      • 常用转换
    • 测试
      • 功能测试
      • 性能测试
  • 中断和异常
    • 从IDT开始
    • 中断?异常?有什么区别
    • 系统调用的实现
    • 异常向量表的设置
    • 中断向量和中断函数
    • APIC
    • 时钟中断
    • 软中断
    • 中断、软中断、抢占和多处理器
  • 设备模型
    • 总线
    • 驱动
    • 设备
    • 绑定
  • nvdimm初探
    • 使用手册
    • 上帝视角
    • nvdimm_bus
    • nvdimm
    • nd_region
    • nd_namespace_X
    • nd_dax
      • dev_dax
  • KVM
    • 内存虚拟化
      • Qemu内存模型
      • KVM内存管理
  • cgroup
    • 使用cgroup控制进程cpu和内存
    • cgroup文件系统
    • cgroup层次结构
    • cgroup和进程的关联
    • cgroup数据统计
  • 同步机制
    • 内存屏障
    • RCU
  • Trace/Profie/Debug
    • ftrace的使用
    • 探秘ftrace
    • 内核热补丁的黑科技
    • eBPF初探
    • TraceEvent
    • Drgn
  • 内核中的数据结构
    • 双链表
    • 优先级队列
    • 哈希表
    • xarray
    • B树
    • Maple Tree
    • Interval Tree
  • Tools
  • Good To Read
    • 内核自带文档
    • 内存相关
    • 下载社区邮件
Powered by GitBook
On this page
  • 全局流程
  • early param
  • 非early param

Was this helpful?

  1. 启动时的小秘密

内核参数

内核除了在编译时的配置选项,还可以在启动时根据不同的命令行参数调整运行时的行为。

比如加上memblock=debug可以打开memblock的调试功能,启动过程中可以看到各区域变化情况。

本节我们来看一下这部分在启动时是怎么处理的。

全局流程

start_kernel()
	parse_early_param();
		parse_early_options()
			parse_args("early options", cmdline, NULL, 0, 0, 0, NULL,
				   do_early_param);
	after_dashes = parse_args("Booting kernel",
				  static_command_line, __start___param,
				  __stop___param - __start___param,
				  -1, -1, NULL, &unknown_bootoption);
	print_unknown_bootoptions();
	if (!IS_ERR_OR_NULL(after_dashes))
		parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
			   NULL, set_init_arg);
	if (extra_init_args)
		parse_args("Setting extra init args", extra_init_args,
			   NULL, 0, -1, -1, NULL, set_init_arg);

从上面的流程可以看出,核心的函数就是parse_args()。

而根据不同的参数,形成了内核参数不同层级的解析过程。

early param

内核首先解析的是early_param,使用的函数是do_early_param。函数补偿,直接拿来放这里。

    const struct obs_kernel_param *p;
	for (p = __setup_start; p < __setup_end; p++) {
		if ((p->early && parameq(param, p->str)) ||
		    (strcmp(param, "console") == 0 &&
		     strcmp(p->str, "earlycon") == 0)
		) {
			if (p->setup_func(val) != 0)
				pr_warn("Malformed early option '%s'\n", param);
		}
	}

可以看到,这个是遍历__setup_start到__setup_end,根据情况调用setup_func。

举个例子,比如,memblock中的参数。

static int __init early_memblock(char *p)
{
	if (p && strstr(p, "debug"))
		memblock_debug = 1;
	return 0;
}
early_param("memblock", early_memblock);

这两个怎么关联上呢?对了,就是看是不是定义在指定的一个section里。

首先我们看__setup_start/__setup_end在哪里。这个东西有点隐藏,直接搜搜不到。打开看了一下才发现这个是由INIT_SETUP定义的。

最后展开长这个样子。

. = ALIGN(16); __setup_start = .; KEEP(*(.init.setup)) __setup_end = .;

这里就看到这个循环找的是.init.setup这个section里面的东西。

然后再看early_param的定义,摘出其中重要的部分

	static struct obs_kernel_param __setup_##unique_id		\
		__used __section(".init.setup")				\
		__aligned(__alignof__(struct obs_kernel_param))		\
		= { __setup_str_##unique_id, fn, early }

也就是定义了一个obs_kernel_param结构,而且还是放在.init.setup这个section的。

好了,这样就联系起来了。do_early_param会遍历.init.setup这个section中的数组,判断符合条件,就会运行对应的setup_func。对memblock来说,也就是early_memblock了。

非early param

在do_early_param中,我们看到只有p->early的内核参数才会在这里执行。但是用__setup()定义的结构early并没有置1,那问题来了,这部分的参数是怎么被解析的呢?

这个查找着实花了点时间,主要是因为当前内核认为这种参数是要淘汰的定义方式了。所以藏在了函数unknown_bootoption中的obsolete_checksetup()中。

其过程和之前一样,也是遍历__setup_start/__setup_end,但只运行early=0的结构。

PreviousINIT_CALLS的秘密Next内核加载全流程

Last updated 11 months ago

Was this helpful?