Per CPU变量
内核中通常会定义很多的pcpu变量,这样有几个好处
增加数据访问的并发量
减少数据访问的时延
从定义上就可以看出pcpu变量就是每个cpu都有某个变量的副本,各自访问各自的。那在实现上是怎么做的呢?我们今天就来看一下。
如何定义
我们先来看静态pcpu变量是如何定义的。
通常我们定义一个pcpu变量使用这样的语句。
DEFINE_PER_CPU(int, numa_node);这样就定义了一个int类型,名字为numa_node的变量。接下来就深入研究一下。
DEFINE_PER_CPU
#define DEFINE_PER_CPU(type, name) \
DEFINE_PER_CPU_SECTION(type, name, "")
#define DEFINE_PER_CPU_SECTION(type, name, sec) \
__PCPU_ATTRS(sec) PER_CPU_DEF_ATTRIBUTES \
__typeof__(type) name
#endif看最后一行,最终也就是定义了一个type类型,名字是name的变量。感觉和普通的变量没有什么区别。那区别在哪里呢?对了,就在上面那个宏里面。
__PCPU_ATTRS
好了,这个比较明确了,就是给定义的变量添加了一个section的修饰符。section是什么概念呢?你可以理解为同一个section的变量会放在同一块存储区。一会儿我们再来看这个概念。
展开后
这样看或许能够清楚一些。
pcpu变量和普通变量定义时的差别在于pcpu变量被安排在了一个指定的section中。
放在哪
已经看到变量定义在某一个section了,但是还是不死心,想要看看究竟是怎么放的。
好吧,我就带你来看看。
首先在[vmlinux.lds.h][1]中定义了PERCPU_INPUT。
你看,凡是.data..percpu开头的都包含在这个定义内了。
在同一个文件中又定义了一个包含这个定义的定义PERCPU_VARRD。
而这个PERCPU_VADDR定义最终包含在文件[arch/x86/kernel/vmlinux.lds.S][2]中。
这就是我们最后链接vmlinux时使用的脚本。
再详细就请大家自行看代码~
如何访问
定义看完了,来看看要怎么访问。
还是看刚才的numa_node变量,我们要访问某cpu上的变量时通过如下的语句。
好了,那来看看都是些什么吧
per_cpu()
卧槽,这么长。不着急,仔细看其实有的不用。比如这个__verif_pcpu_ptr(),一看就是用来检测了,就先跳过吧。关键是这个SHIFT_PERCPU_PTR。
SHIFT_PERCPU_PTR
嗯,这玩意也是写了老长了,不过你仔细一看其实就是带有两个参数的一个宏,RELOC_HIDE。分别传入了变量的一个指针,和一个offset。
好啦,那就再来看看这个宏。
RELOC_HIDE
又是一个很长,但是其实很简单的定义。是什么呢? 你看最后一行,其实就是一个指针加上了offset。
展开后
好了,这样看可能可以清楚一些。
但是呢,还是有点不清楚,让我再来把实现的细节讲一下。这样,我估计你就可以彻底理解了。
背后的实现
先透露一下,其实pcpu变量的实现就是给每个cpu都分配一块内存,并且记录下每块区域和原生区域之间的offset。所以访问的时候就是直接通过原生变量的地址加上目标cpu变量区域的offset就可以了。
貌似有点饶,来看一张图吧。
其中__per_cpu_start和__per_cpu_end就是刚才我们看到的那个section的定义。所有pcpu变量都会被保存在这个地址空间内。
在系统启动的时候,会给每一个cpu分配各自的pcpu变量内存空间。并计算出每个区域相对于__per_cpu_start的offset。
具体的代码在setup_per_cpu_areas()函数中,有兴趣的可以再深入研究。具体实现就不在这里展开了。
Last updated
Was this helpful?