Kernel Exploring
  • 前言
  • 支持
  • 老司机带你探索内核编译系统
    • 编译出你的第一个内核
    • 内核编译中的小目标
    • 可能是kbuild中最直接的小目标 – help
    • 使用了一个kbuild函数的目标 – cscope
    • 内核中单个.o文件的编译过程
    • 根目录vmlinux的编译过程
    • 启动镜像bzImage的前世今生
    • setup.bin的诞生记
    • 真假vmlinux–由vmlinux.bin揭开的秘密
    • bzImage的全貌
    • kbuild系统浅析
  • 启动时的小秘密
    • INIT_CALLS的秘密
    • 内核参数
  • 内核加载全流程
    • bootloader如何加载bzImage
    • 内核压缩与解压
    • 内核加载的几个阶段
    • 保护模式内核代码赏析
  • 内存管理
    • 内核页表成长记
      • 未解压时的内核页表
      • 内核早期的页表
      • cleanup_highmap之后的页表
      • 映射完整物理地址
      • 启用init_level4_pgt
    • 自底而上话内存
      • e820从硬件获取内存分布
      • 原始内存分配器--memblock
      • 页分配器
        • 寻找页结构体的位置
        • 眼花的页结构体
        • Node-Zone-Page
        • 传说的伙伴系统
        • Compound Page
        • GFP的功效
        • 页分配器的用户们
      • slub分配器
        • slub的理念
        • 图解slub
      • 内存管理的不同粒度
      • 挑战和进化
        • 扩展性的设计和实现
        • 减少竞争 per_cpu_pageset
        • 海量内存
        • 延迟初始化
        • 内存热插拔
        • 连续内存分配器
    • 虚拟内存空间
      • 页表和缺页中断
      • 虚拟地址空间的管家--vma
      • 匿名反向映射的前世今生
      • 图解匿名反向映射
      • THP和mapcount之间的恩恩怨怨
      • 透明大页的玄机
      • NUMA策略
      • numa balance
      • 老版vma
    • 内存的回收再利用
      • 水线
      • Big Picture
      • 手动触发回收
      • Page Fram Reclaim Algorithm
      • swapfile原理使用和演进
    • 内存隔离
      • memcg初始化
      • 限制memcg大小
      • 对memcg记账
    • 通用
      • 常用全局变量
      • 常用转换
    • 测试
      • 功能测试
      • 性能测试
  • 中断和异常
    • 从IDT开始
    • 中断?异常?有什么区别
    • 系统调用的实现
    • 异常向量表的设置
    • 中断向量和中断函数
    • APIC
    • 时钟中断
    • 软中断
    • 中断、软中断、抢占和多处理器
  • 设备模型
    • 总线
    • 驱动
    • 设备
    • 绑定
  • nvdimm初探
    • 使用手册
    • 上帝视角
    • nvdimm_bus
    • nvdimm
    • nd_region
    • nd_namespace_X
    • nd_dax
      • dev_dax
  • KVM
    • 内存虚拟化
      • Qemu内存模型
      • KVM内存管理
  • cgroup
    • 使用cgroup控制进程cpu和内存
    • cgroup文件系统
    • cgroup层次结构
    • cgroup和进程的关联
    • cgroup数据统计
  • 同步机制
    • 内存屏障
    • RCU
  • Trace/Profie/Debug
    • ftrace的使用
    • 探秘ftrace
    • 内核热补丁的黑科技
    • eBPF初探
    • TraceEvent
    • Drgn
  • 内核中的数据结构
    • 双链表
    • 优先级队列
    • 哈希表
    • xarray
    • B树
    • Maple Tree
    • Interval Tree
  • Tools
  • Good To Read
    • 内核自带文档
    • 内存相关
    • 下载社区邮件
Powered by GitBook
On this page
  • 基本使用
  • cgroup文件系统
  • cgroup树形结构
  • cgroup和进程的关联
  • cgroup数据统计

Was this helpful?

cgroup

PreviousKVM内存管理Next使用cgroup控制进程cpu和内存

Last updated 3 years ago

Was this helpful?

cgroup是计算机资源管理常用的管理设施,尤其是在云计算环境使用广泛。这里我们从cgroup的使用和架构上进行一次学习。

基本使用

对大多数人来说,接触cgroup还是使用cgroup来控制应用程序的资源。所以这一节,我们先来看看

cgroup文件系统

在上一节基本使用中,我们通过创建目录,向指定文件写入内容来使用cgroup。我想你也一定好奇,为什么这么操作就能达到这样的效果?

这一切都要归功于

cgroup树形结构

从用户使用的角度看过了cgroup后,终于是时候揭开cgroup真实的面纱了。

在开始之前,我们先来好好看看cgroup的定义。来个借花献佛,我搬运一下

Control Groups provide a mechanism for aggregating/partitioning sets of
tasks, and all their future children, into hierarchical groups with
specialized behaviour.

Definitions:

A *cgroup* associates a set of tasks with a set of parameters for one
or more subsystems.

A *subsystem* is a module that makes use of the task grouping
facilities provided by cgroups to treat groups of tasks in
particular ways. A subsystem is typically a "resource controller" that
schedules a resource or applies per-cgroup limits, but it may be
anything that wants to act on a group of processes, e.g. a
virtualization subsystem.

A *hierarchy* is a set of cgroups arranged in a tree, such that
every task in the system is in exactly one of the cgroups in the
hierarchy, and a set of subsystems; each subsystem has system-specific
state attached to each cgroup in the hierarchy.  Each hierarchy has
an instance of the cgroup virtual filesystem associated with it.

从上面的描述中可以看到cgroup有两个重要的概念:

  • 层次结构

  • 子系统

层次结构是对系统中进程的切分,而子系统则赋予了cgroup在不同层面对进程的切变控制的方法。

虽然会涉及到一些子系统的内容,但其其中具体的精妙细节将留给各个子系统描述。

cgroup和进程的关联

接下来我们需要了解的是cgroup和进程的关系。

从上面的定义中,我们看到cgroup联结了计算机系统中的两部分内容:

  • 进程

  • 系统资源

在上一节中,我们看到了cgroup的subsystem将系统的资源按照层次结构做了切分。(当然具体怎么切的需要看对应的subsystem,cgroup本身只提供了一种层次化结构框架。)那接下来就要看看内核是如何把进程和cgroup联系起来的。

cgroup数据统计

最后一个有意思的部分就是cgroup上如果做数据同步。当整个cgroup树变得庞大后,如何有效将子cgroup的信息同步收集到父cgroup,来保证cgroup能有效控制资源,这是一个非常有意思的问题。

每个子系统对系统的控制有着不同的方式,所以在本章我们主要讲述。

使用cgroup控制进程cpu和内存
cgroup文件系统
内核文档
cgroup的树形结构
cgroup和进程的关联
cgroup数据统计