Linux 内存 Swappiness 和缓存行为调优最佳实践

Linux 系统动态管理内存，利用可用 RAM 为应用程序、文件系统缓存和内核操作提供支持。虽然这种灵活性是其优势，但配置不当的内存参数可能导致性能瓶颈，尤其是由于不必要的交换（swapping）或低效缓存而引起的过多的磁盘 I/O。

本指南将深入探讨控制 Linux 如何处理内存压力的两个关键内核参数：vm.swappiness 和 vfs_cache_pressure。理解和调优这些设置对于系统管理员来说至关重要，他们旨在最大限度地提高应用程序的响应能力，减少由磁盘访问引起的延迟，并确保服务器性能的稳定性。

理解 Linux 内存管理参数

当系统需要更多可用 RAM 时，Linux 使用启发式方法来决定要回收哪些内存页。由内核参数控制的两个主要区域是交换（swapping）（将不活跃的内存页移至磁盘）和缓存（caching）（将文件系统元数据和数据保留在 RAM 中）。

1. `vm.swappiness`

vm.swappiness 决定了内核将进程从物理内存移出并放入磁盘上的交换空间（swap space）的倾向。它的值介于 0 到 100 之间。

高值（例如 60，这是许多发行版的默认值）： 内核会积极地将不活跃的页交换出去，即使有充足的可用内存。这会优先保持页面缓存（page cache）的占用，但如果应用程序突然需要这些内存，则可能导致频繁的、引起延迟的交换。
低值（例如 10 或更低）： 内核倾向于在开始交换进程之前，优先从页面缓存中回收内存。这会使运行中的应用程序更长时间地保留在 RAM 中，从而提高响应能力，但如果系统频繁需要丢弃缓存页，可能会降低磁盘 I/O 性能。
值为 0： 在现代内核（2.6.32 之后）中，将 swappiness 设置为 0 会尝试完全避免交换，直到绝对必要时（即，发生内存不足情况），使系统首先依赖于从页面缓存回收内存。

`vm.swappiness` 的实际应用

最佳设置很大程度上取决于工作负载：

工作负载类型	推荐的 `swappiness` 范围	理由
数据库服务器、高性能计算 (HPC)	1 - 10	将活跃的数据库工作集保留在物理内存中，以避免磁盘延迟。
通用服务器、桌面	30 - 60 (默认)	在响应能力和磁盘缓存需求之间取得平衡。
严重依赖大文件缓存的服务器（例如，高磁盘流量的 Web 服务器）	60 - 80	优先保持磁盘缓存占用，以便更快地从 RAM 提供后续请求。

如何检查当前值：

cat /proc/sys/vm/swappiness

如何临时更改值（直到重启）：

将 swappiness 设置为 10：

sudo sysctl vm.swappiness=10

如何永久更改值：

编辑 /etc/sysctl.conf 文件并添加或修改以下行：

# /etc/sysctl.conf
vm.swappiness = 10

保存后，使用以下命令在不重启的情况下应用更改：

sudo sysctl -p

最佳实践提示： 对于运行数据库等内存密集型应用程序的现代服务器，通常将 vm.swappiness 设置在 1 到 10 之间是防止因交换而导致性能下降的最佳起点。

2. `vfs_cache_pressure`

vfs_cache_pressure 控制内核回收用于目录和 inode 元数据（VFS 缓存）的内存的激进程度。

该值范围为 0 到 1000。
默认值通常为 100。

在值为 100 时，内核在回收 VFS 缓存内存与回收页面缓存（磁盘数据）内存之间取得平衡。值为 100 意味着当存在内存压力时，内核会尝试每回收 1 部分页面缓存内存，就回收 1 部分 inode/dentry 缓存内存。

调整 `vfs_cache_pressure`

增加值（例如 > 100）： 使内核更积极地回收 VFS 缓存内存。这会更快地释放 RAM，但可能导致后续文件系统查找速度变慢，因为元数据需要重新从磁盘读取。
减小值（例如 < 100）： 使内核在回收 VFS 缓存时更加保守。这会使目录和 inode 信息更长时间地保留在内存中，从而加快重复的文件系统操作。

何时减小 vfs_cache_pressure：

如果您的系统频繁访问相同的大型目录结构（在复杂应用程序、容器编排或特定网络设置中很常见），将此值设置得更低（例如 50）可以通过将元数据保留在 RAM 中方便访问来提高性能。

何时增加 vfs_cache_pressure：

如果您的系统面临普遍的内存压力，并且您希望内核快速回收任何未使用的内存，则可以提高此值，但这比降低它更少见。

如何检查当前值：

cat /proc/sys/vm/vfs_cache_pressure

如何永久更改值：

编辑 /etc/sysctl.conf：

# /etc/sysctl.conf
vfs_cache_pressure = 50

使用 sudo sysctl -p 应用更改。

警告： 将 vfs_cache_pressure 设置为 0 会有效地阻止内核回收 VFS 缓存内存，这类似于将 vm.swappiness 设置为 0 以进行交换。这只应在具有大量 RAM 且需要绝对最高文件系统性能的系统上执行。

全面的调优场景

选择这些参数的正确组合可以优化应用程序稳定性和文件系统缓存之间的权衡。

场景 1：数据库服务器（内存优先）

目标：最大限度地提高应用程序内存驻留；不惜一切代价减少交换。

vm.swappiness = 5
vfs_cache_pressure = 50 （保持目录数据一定的缓存，但如果 RAM 变紧，优先考虑应用程序内存而不是 VFS 元数据）。

场景 2：高磁盘 I/O 服务器（缓存优先）

目标：通过将频繁访问的文件数据保留在页面缓存中来最大限度地提高磁盘性能。

vm.swappiness = 80 （允许更早地发生交换，为磁盘缓存扩展腾出 RAM）。
vfs_cache_pressure = 100 （inode 和页面缓存之间的标准平衡）。

场景 3：虚拟化主机或通用系统

目标：跨多种工作负载实现稳定性能。

vm.swappiness = 30 （一个中等设置，比默认的 60 稍微偏向于将活跃的虚拟机/进程更长时间地保留在 RAM 中，但仍允许受控交换）。
vfs_cache_pressure = 100 （默认值通常已足够）。

监控和验证

应用更改后，持续监控对于验证其影响至关重要。使用 free、vmstat 和系统性能监控仪表板等工具。

使用 vmstat：

监控 si（swap in）和 so（swap out）列。低 swappiness 的健康系统在正常负载下应显示 si 和 so 的值较低或为零。

vmstat 5 10

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----\ r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 0  0      0 123456 102400 5123456    0    0     0     5   40   70  1  1 98  0  0

如果在降低 swappiness 后 so 值仍然很高，这表明物理 RAM 确实不足以满足工作负载，增加 RAM 是唯一的永久解决方案。

结论

调优 vm.swappiness 和 vfs_cache_pressure 是 Linux 性能优化中的基本技术。通过为内存敏感型应用程序保守地降低 swappiness（例如，降至 10），可以确保关键进程保留在物理 RAM 中。同时，微调 vfs_cache_pressure 允许管理员指定内核在将文件系统元数据与应用程序数据存储在内存之间的偏好。始终在实际负载条件下测试更改，以确认期望的性能提升。