Linux MMU Notifier 机制与应用系列目录

发布时间:2026/6/24 13:10:35
Linux MMU Notifier 机制与应用系列目录 本系列文档旨在帮助工作在异构计算领域的朋友们理解mmu notifier的原理和应用场景进而理解HMM的原理与应用。2026年01月月度专栏: 正文每周一和周四各放送两篇即每周四篇。2026/01/05: 第1、2章已上线。2026/01/08: 第3、4章已上线。2026/01/12: 第5、6章已上线。2026/01/15: 第7、8章已上线。2026/01/19: 第9、10章已上线。2026/01/21: 第11、12章已上线。专栏已审核校对完毕如有发现错误请反馈。后续linux内核有upstream的话会继续更新进展请持续关注。引文当SVM转角遇上Copy-on-Write (COW)第一部分基础概念与原理第1章 背景与问题域1.1 虚拟内存管理基础回顾1.2 设备与CPU地址空间协作的挑战1.3 为什么需要MMU Notifier机制1.4 典型应用场景概览虚拟化、GPU、RDMA第2章 MMU Notifier 全局通知2.1 设计目标与架构2.2 核心数据结构详解2.2.1mmu_notifier_ops回调接口2.2.2mmu_notifier订阅结构2.2.3mmu_notifier_range失效范围事件描述2.3 事件类型与触发时机2.3.1 事件类型枚举2.3.2 各事件详解与触发场景2.3.3 事件触发时机总结第3章 MMU Interval Notifier 区间级通知3.1 为什么需要Interval Notifier(区间级通知)3.2 核心数据结构3.2.1mmu_interval_notifier3.2.2 invalidate回调触发时机和调用路径3.3 序号同步机制详解3.3.1invalidate_seq的作用3.3.2 read-begin/read-retry模式3.3.3 如何保证一致性3.4 高并发场景下的性能优化第二部分内核实现分析第4章 内核实现机制4.1 数据结构组织4.1.1 per-mm notifier链表4.1.2 notifier的注册与注销实现4.2 常用事件触发路径分析4.2.1 unmap路径4.2.2 migration路径4.2.3 protection change路径4.3 核心API实现剖析4.3.1 失效通知流程4.3.2 序号更新机制第5章 使用模式与最佳实践5.1 基本使用流程5.2 回调函数实现要点5.3 错误处理与重试策略5.4 性能优化技巧5.4.1 区间粒度选择5.4.2 批量操作优化5.4.3 避免死锁5.5 常见陷阱与调试技巧第三部分应用案例深度分析第6章 KVM虚拟化中的应用6.1 KVM内存管理架构6.2 shadow page table同步6.3 EPT/NPT失效处理6.4 代码实现分析kvm_mmu_notifier_ops第7章 AMD GPU驱动中的应用7.1 AMDGPU内存管理概述7.2 HMM异构内存管理集成7.3amdgpu_hmm.c实现详解7.3.1 SVM区间管理7.3.2 GPU页表同步机制7.3.3 Page fault处理流程7.4 性能分析与优化案例第8章 NVIDIA GPU驱动应用8.1 NVIDIA UVMUnified Virtual Memory8.2 mmu_interval_notifier的使用8.3 CPU-GPU内存迁移8.4 与AMD方案的对比第9章 RDMA/InfiniBand应用9.1 RDMA内存注册机制9.2 用户空间DMA映射管理9.3 ODPOn-Demand Paging实现9.4 mmu_notifier在RDMA中的作用第四部分高级主题第10章 与HMM的协作10.1 HMM架构回顾10.2 HMM如何使用mmu_interval_notifier10.3 设备私有内存迁移10.4 完整的CPU-GPU共享内存方案第11章 性能分析与调优11.1 典型性能问题11.2 性能诊断方法11.3 优化策略11.4 实战案例11.5 性能调优清单第12章 内核演进与未来方向12.1 历史演进从mmu_notifier到mmu_interval_notifier12.2 当前内核版本的改进12.3 未来发展方向12.4 社区讨论与提案附录附录AAPI快速参考A.1 mmu_notifier API列表A.2 mmu_interval_notifier API列表A.3 常用辅助函数附录B数据结构速查B.1 核心结构体定义B.2 枚举类型说明B.3 结构体关系图附录C示例代码集C.1 基本使用示例C.2 完整驱动示例C.3 测试代码附录D调试技巧D.1 内核配置选项D.2 ftrace/tracepoint使用D.3 常见问题排查技术交流和投稿欢迎加入社区 GPUers。​