提升Nginx速度：缓冲区、压缩与缓存优化指南

Nginx开箱即用速度很快，但默认设置故意保守。它们适用于小型站点、测试服务器或流量适中的反向代理。一旦开始处理大型Cookie、慢速上游服务器、大型API响应或每小时被下载数千次的静态资源，默认设置往往不是最佳选择。

有用的调优通常归结为三个方面：缓冲区、压缩和缓存。缓冲区决定Nginx能否将请求和响应数据保存在内存中，还是必须溢出到临时文件。压缩决定通过网络发送多少基于文本的数据。缓存决定Nginx和浏览器能否避免重复执行相同的工作。这些设置没有魔法。糟糕的缓存规则可能泄露私有内容，过大的缓冲区可能浪费内存。目标是刻意调优，使用真实流量模式进行测试，并保持配置可读，以便其他人能够理解。

优化Nginx缓冲区以实现高效数据处理

Nginx使用各种缓冲区在请求和响应处理期间临时存储数据。正确调整这些缓冲区的大小对性能至关重要。错误调整的缓冲区可能导致内存消耗过多或频繁的磁盘写入（溢出），两者都会降低性能。我们将研究客户端相关缓冲区和代理/FastCGI缓冲区。

客户端相关缓冲区

这些缓冲区管理从客户端到Nginx的数据。

client_body_buffer_size：此指令设置用于读取客户端请求体的缓冲区大小。如果请求体超过此大小，将被写入磁盘上的临时文件。虽然这可以防止大上传导致内存耗尽，但频繁的磁盘写入会降低性能。
- 提示：对于不通过POST请求处理超大文件上传的典型Web应用程序，8k或16k通常足够。如果直接通过Nginx处理较大的表单或小文件上传，请增加此值。
```
http {
    client_body_buffer_size 16k;
    # ...
}
```
client_header_buffer_size：定义用于读取客户端请求头的缓冲区大小。每个连接分配一个缓冲区。
- 提示：1k是默认值，通常足以满足大多数头部。仅当遇到“client sent too large header”错误时才增加，这通常是由于许多Cookie或复杂的身份验证头引起的。
```
http {
    client_header_buffer_size 1k;
    # ...
}
```
large_client_header_buffers：此指令设置用于读取大型客户端请求头的最大缓冲区数量和大小。如果头部超过client_header_buffer_size，Nginx尝试使用此指令分配缓冲区。
- 提示：4 8k（4个8KB缓冲区）是常见设置。如果在增加client_header_buffer_size后仍然持续看到头部错误，请调整此值。
```
http {
    large_client_header_buffers 4 8k;
    # ...
}
```

代理和FastCGI缓冲区

当Nginx充当反向代理或与FastCGI后端（如PHP-FPM）通信时，这些缓冲区管理数据。

当Nginx代理请求时，它从后端服务器接收响应块，并在发送给客户端之前进行缓冲。这使得Nginx能够处理慢速后端响应，而不会阻塞客户端连接。

proxy_buffer_size：用于从代理服务器接收的响应第一部分的缓冲区大小。这通常包含响应头。
proxy_buffers：定义用于从代理服务器读取响应的缓冲区数量和大小。
proxy_busy_buffers_size：设置任何时候可以处于活动（忙碌）状态的缓冲区的最大大小，这些缓冲区要么向客户端发送数据，要么从后端读取数据。这有助于防止Nginx因长时间持有缓冲区而消耗过多内存。
- 代理传递示例：对于典型的Web应用程序，proxy_buffer_size可以匹配预期的头部大小，proxy_buffers可以设置为处理平均内容大小而无需写入磁盘。
```
http {
    proxy_buffer_size          128k;
    proxy_buffers              4 256k; # 4个缓冲区，每个256KB
    proxy_busy_buffers_size    256k;
    # ...
}
```
fastcgi_buffer_size、fastcgi_buffers、fastcgi_busy_buffers_size：这些指令的功能与其proxy_对应项相同，但专门适用于来自FastCGI服务器的响应。
- FastCGI示例：类似逻辑适用，根据您的PHP/FastCGI应用程序的响应大小进行调整。
```
http {
    fastcgi_buffer_size        128k;
    fastcgi_buffers            4 256k;
    fastcgi_busy_buffers_size  256k;
    # ...
}
```

警告：将缓冲区设置得过大将消耗每个连接更多的RAM，这可能在繁忙的服务器上迅速耗尽内存。设置得过小将导致Nginx将临时文件写入磁盘，导致I/O开销。监控服务器的内存和磁盘I/O以找到最佳平衡点。

使用Gzip实现有效压缩

内容压缩，主要使用Gzip，可以显著减少传输数据的大小，从而加快页面加载速度并降低带宽消耗。Nginx的gzip模块高度可配置。

基本Gzip指令

将这些指令添加到您的http块或特定的server或location块中。

gzip on;：激活Gzip压缩。
gzip_types：指定应压缩的MIME类型。只有某些基于文本的类型能从压缩中显著受益。
- 最佳实践：包括常见的Web类型，但避免压缩图像（image/*）、视频（video/*）和已压缩的文件（.zip、.rar、.gz），因为这会浪费CPU周期而没有任何收益。
```
gzip_types text/plain text/css application/json application/javascript text/xml application/xml application/xml+rss text/javascript image/svg+xml;
```
gzip_proxied：根据响应和请求条件启用对代理请求的压缩。当Nginx位于应用服务器或其他代理之前时，这主要很有用。
- any：压缩符合条件的代理响应。
- no-cache、no-store、private、expired、auth：仅在响应或请求匹配这些条件时压缩。这些标记不是“不压缩”标志；它们是允许对代理响应进行压缩的条件。
```
gzip_proxied any;
```
gzip_min_length：设置Nginx将压缩的响应体的最小长度。小文件从压缩中受益不大，甚至可能因压缩开销而变大。
- 提示：像1000字节（1KB）或256字节这样的值是一个好的起点。
```
gzip_min_length 1000;
```
gzip_comp_level：设置压缩级别（1-9）。更高的级别提供更好的压缩，但消耗更多CPU资源。更低的级别更快，但压缩效果较差。
- 提示：对于大多数服务器，4-6是压缩比和CPU使用率之间的良好平衡。
```
gzip_comp_level 5;
```
gzip_vary on;：告诉代理根据客户端发送的Accept-Encoding头缓存文件的压缩和未压缩版本。这对于正确的缓存和交付至关重要。
```
gzip_vary on;
```
gzip_disable：为可能对Gzip有问题的某些浏览器或用户代理禁用压缩。
```
gzip_disable "MSIE [1-6]\."; # 示例：为旧版Internet Explorer禁用
```

注意事项：虽然Gzip非常有益，但压缩消耗CPU周期。对于直接从磁盘提供的静态文件（例如预压缩的.gz文件），Nginx可以直接提供它们而无需重新压缩，这更加高效。对于动态内容，Gzip通常是有益的。

实施智能缓存策略

缓存可以说是提高Web服务器性能最有效的方法，因为它减少了重新生成或重新获取内容的需要。Nginx支持浏览器端（客户端）和服务器端（代理）缓存。

浏览器缓存（HTTP头）

浏览器缓存依赖HTTP头来指示客户端浏览器存储静态资源的时间。这防止了重复下载不变的资源，如图像、CSS和JavaScript文件。

expires：一个简单的指令，用于设置Expires和Cache-Control: max-age头。

location ~* \.(jpg|jpeg|gif|png|webp|ico|css|js|woff|woff2|ttf|otf|eot)$ {
    expires 365d; # 缓存一年
    add_header Cache-Control "public, no-transform";
    # 可选：禁用静态文件的日志
    access_log off;
    log_not_found off;
}

add_header Cache-Control：提供对缓存策略的更精细控制。常见值包括：
- public：任何缓存（浏览器、代理）都可缓存。
- private：仅客户端私有缓存（例如浏览器）可缓存。
- no-cache：使用前必须与服务器重新验证，但可以存储副本。
- no-store：根本不缓存。
- max-age=<seconds>：指定资源被视为新鲜的时间。
条件请求（Etag和If-Modified-Since）：Nginx自动处理静态文件的Etag和Last-Modified头，使浏览器能够发送条件请求（If-None-Match或If-Modified-Since）。如果内容未更改，Nginx响应304 Not Modified，节省带宽。

Nginx代理缓存

Nginx可以充当强大的缓存反向代理。启用后，Nginx存储来自后端服务器的响应副本，并直接提供给客户端，显著减少后端负载。

1. 定义缓存区域

这需要在http块中完成。proxy_cache_path定义缓存目录、内存区域参数和其他设置。

http {
    proxy_cache_path /var/cache/nginx levels=1:2 keys_zone=my_cache:10m inactive=60m max_size=1g;
    # levels=1:2：为缓存文件创建两级目录层次结构（例如 /var/cache/nginx/c/29/...）。有助于分发文件。
    # keys_zone=my_cache:10m：定义一个名为'my_cache'的10MB共享内存区域，用于存储缓存键和元数据。这对于快速查找至关重要。
    # inactive=60m：60分钟未访问的缓存项将从磁盘中删除。
    # max_size=1g：设置磁盘上缓存的最大大小。超过时，Nginx删除最近最少使用的数据。
    # ...
}

2. 为位置启用缓存

在server或location块中，启用缓存并定义其行为。

server {
    listen 80;
    server_name example.com;

    location / {
        proxy_pass http://backend_upstream; # 或 http://127.0.0.1:8000;
        proxy_cache my_cache; # 使用上面定义的缓存区域
        proxy_cache_valid 200 302 10m; # 缓存成功响应（200, 302）10分钟
        proxy_cache_valid 404 1m;      # 缓存404响应1分钟
        proxy_cache_revalidate on;     # 使用If-Modified-Since和If-None-Match头进行重新验证
        proxy_cache_min_uses 1;       # 仅当项目至少被请求一次时才缓存
        proxy_cache_use_stale error timeout updating http_500 http_502 http_503 http_504;
                                       # 如果后端宕机或正在更新，提供过时内容

        # 添加一个头以查看响应是否被缓存
        add_header X-Cache-Status $upstream_cache_status;

        # 可选：为特定条件绕过缓存
        # proxy_cache_bypass $http_pragma $http_authorization;
        # proxy_no_cache $http_pragma $http_authorization;
    }
}

重要缓存指令

proxy_cache_valid：根据HTTP状态码和持续时间定义缓存规则。可以指定多个规则。
proxy_cache_revalidate on;：允许Nginx在检查缓存内容是否仍然新鲜时使用If-Modified-Since和If-None-Match头。这比简单地让缓存过期更高效。
proxy_cache_use_stale：一个强大的指令，告诉Nginx在后端不可用或缓慢时从缓存提供过时（过期）内容。这大大改善了后端问题期间的用户体验。

proxy_cache_bypass / proxy_no_cache：使用这些来定义应绕过缓存的条件（例如，对于经过身份验证的请求或特定查询参数）。

# 示例：不缓存具有特定查询参数或Cookie的请求
# if ($request_uri ~* "(\?|&)nocache") { set $no_cache 1; }
# if ($http_cookie ~* "SESSIONID") { set $no_cache 1; }
# proxy_cache_bypass $no_cache;
# proxy_no_cache $no_cache;

缓存清除

要手动清除Nginx缓存，只需删除proxy_cache_path目录中的文件。对于更受控制的失效，考虑使用像ngx_cache_purge这样的模块或配置特定的location来处理缓存失效请求。

警告：配置错误的代理缓存可能导致用户看到过时内容。始终在暂存环境中彻底测试您的缓存策略，然后再部署到生产环境。确保频繁更改或特定于用户的动态内容不被积极缓存。

实际部署计划

调优Nginx最安全的方法是每次更改一层。从头文件和静态资源开始，因为风险低且收益容易看到。仅为版本化文件添加较长的浏览器缓存生命周期，例如/app.8f3a2c.js或/styles.2025-11-02.css。如果您的资产名称在文件更改时不改变，不要缓存它们一年。使用较短的expires值或先修复构建管道。

接下来，为文本格式启用Gzip并确认其工作：

curl -I -H 'Accept-Encoding: gzip' https://example.com/app.js

对于可压缩的响应，您应该看到Content-Encoding: gzip和Vary: Accept-Encoding。如果图像或ZIP文件显示为压缩，收紧gzip_types；这些格式已经压缩，通常会浪费CPU。

之后，查看缓冲。检查错误日志中有关上游响应被缓冲到临时文件的消息。这些消息不一定是灾难，但它们告诉您Nginx正在将响应数据写入磁盘。如果这在正常页面加载或API响应期间发生，您的代理缓冲区可能对于工作负载来说太小。如果这只发生在大型导出或下载期间，接受磁盘溢出可能比为每个请求路径分配大型缓冲区更好。

代理缓存应该最后进行。它有最大的上行潜力和最容易的故障模式。从明显安全的内容开始：公共文档页面、匿名产品目录页面、图像转换响应、包元数据或对每个访问者相同的API响应。避免缓存与会话Cookie、Authorization头、购物车、用户仪表板、管理页面或个性化推荐相关的任何内容，除非您的应用程序已为此明确设计。

这是一个比您经常看到的简短示例更谨慎的缓存绕过模式：

map $http_authorization $skip_cache_auth {
    default 1;
    ""      0;
}

map $http_cookie $skip_cache_cookie {
    default 0;
    ~*"(session|sid|auth|token)" 1;
}

server {
    location / {
        proxy_pass http://backend_upstream;
        proxy_cache my_cache;
        proxy_cache_valid 200 10m;
        proxy_cache_bypass $skip_cache_auth $skip_cache_cookie;
        proxy_no_cache $skip_cache_auth $skip_cache_cookie;
        add_header X-Cache-Status $upstream_cache_status always;
    }
}

这仍然需要匹配您的应用程序，但它明确了重要观点：经过身份验证和看起来像会话的请求不应静默进入共享缓存。

更改后要观察什么

不要仅通过单个基准测试来判断Nginx调优。观察服务器几个正常的流量周期。有用的信号包括/var/lib/nginx或/var/cache/nginx下的磁盘写入、上游响应时间、缓存命中率、启用压缩后的CPU使用率、499/502/504错误以及每个工作进程的内存使用率。如果启用Gzip后CPU飙升但带宽几乎没有变化，降低gzip_comp_level或限制MIME类型。如果缓存命中率低，缓存可能被Cookie、查询字符串或应用程序的响应头绕过。

还要测试故障行为。在暂存环境中停止或减慢上游，并确认proxy_cache_use_stale按预期工作。在后端短暂中断期间，提供过时的公共页面可能没问题。但提供过时的账户余额、发票或管理页面则不行。

最终说明

良好的Nginx性能工作主要是细心的内务管理。使用足够大的缓冲区以避免不必要的磁盘I/O，但不要大到每个忙碌的工作进程都变得昂贵。压缩文本，而不是已经压缩的资产。首先缓存公共、可重复的响应，并让私有内容明确选择退出。然后持续测量，因为适合小型PHP应用程序、静态文档站点和繁忙API网关的正确设置不会相同。