Kafka压缩编解码器对比：Zstd vs. Snappy vs. Gzip

Kafka压缩改变了瓶颈所在：减少网络和磁盘流量，增加生产者和消费者的CPU工作。虽然Kafka擅长处理海量数据，但优化性能通常需要调整几个关键参数。在需要高吞吐量或网络受限的环境中，消息压缩是最关键的调优领域之一。

最佳的Kafka压缩编解码器取决于你的瓶颈是CPU、网络带宽、代理磁盘还是消费者容量。

理解Kafka中的压缩

Kafka允许生产者在将消息发送到代理之前对其进行压缩。代理存储压缩后的批次，消费者检索并解压数据。这个过程将计算负载从网络/磁盘层转移到CPU层。编解码器的选择至关重要，因为它决定了这些资源之间的平衡。

Kafka通常支持none、gzip、snappy、lz4和zstd，但具体支持取决于代理和客户端版本。

压缩通常在生产者端通过compression.type属性进行配置。代理必须能够读取生产者使用的编解码器。

# 示例生产者配置
compression.type=zstd

我们将根据典型的性能特征比较三种主要且常用的编解码器：Gzip、Snappy和Zstd。

Gzip是一种成熟的通用压缩算法，基于DEFLATE算法。它通常提供强大的压缩能力，但在许多事件负载上，Zstd可以根据级别和数据形状与之匹配或超越。

最佳用途： 当存储节省和网络带宽节约至关重要，且CPU资源充足，或消息吞吐量要求相对较低的场景。

Snappy由Google开发，旨在追求速度而非最大压缩比。它优先考虑非常快的压缩和解压速度，即使生成的文件大小比Gzip或Zstd更大。

最佳用途： 高吞吐量系统中，低延迟是绝对首要任务。它通常是许多Kafka部署的默认选择，因为它最小化了计算瓶颈，同时仍提供一些网络节省。

Zstandard最初由Facebook（Meta）开发，是现代竞争者。Zstd旨在提供优于Snappy的性能，同时实现接近或优于Gzip的压缩比，具体取决于所选的压缩级别。

Zstd支持可调的压缩级别。Kafka客户端通过支持它的客户端中的编解码器特定配置来暴露这一点。

最佳用途： 几乎所有现代Kafka部署。Zstd提供了精确调整平衡的灵活性。如果需要低延迟，使用级别1或3。如果需要存储节省，使用更高级别（例如9或11）。

最佳编解码器完全取决于特定集群架构中的瓶颈。

编解码器	压缩比	压缩速度	解压速度	CPU开销	理想用例
Snappy	低	非常快	非常快	最低	延迟敏感、高吞吐量
Zstd（级别1-3）	中等	快	非常快	非常低	现代、平衡性能
Zstd（级别5-11）	高	中等	快	中等	灵活的存储/性能权衡
Gzip	最高	慢	慢	最高	存储归档、低吞吐量

使用以下指南将你的需求映射到编解码器：

如果你使用Zstd并希望获得接近Snappy的性能和稍好的压缩，可以在生产者配置中显式设置级别：

# 使用Zstd优先考虑速度的生产者配置
compression.type=zstd
compression.zstd.level=3

关于压缩级别的警告： Kafka客户端在支持的情况下暴露编解码器特定的级别设置，如compression.zstd.level和compression.gzip.level；Snappy不能以相同方式调整级别。请注意，增加级别会显著增加压缩时间，这发生在批次发送之前。

务必记住，压缩影响连接的两端：

生产者必须等待整个记录批次准备好，然后压缩并发送。如果压缩时间超过linger.ms，生产者可能会过早或过晚发送批次。非常慢的压缩（如高级别Gzip）可能迫使生产者更频繁地发送更小的批次，增加请求开销。

消费者必须在处理数据之前花费CPU周期解压数据。如果消费者CPU满载，解压可能成为瓶颈，导致消费者滞后，即使网络吞吐量足够。解压速度通常比压缩速度更关键，因为它直接影响消费者延迟。

因此，像Snappy和Zstd（具有异常快速的解压例程）这样的编解码器比Gzip更受青睐，因为Gzip的解压例程相对较慢。

对于新的Kafka工作负载，从Zstd的低或中等级别开始，然后用实际负载进行基准测试。当生产者或消费者CPU紧张且延迟最重要时，使用Snappy。仅在兼容性或存储减少超过额外CPU成本时使用Gzip。