一、gzip介绍

Gzip是一种流行的文件压缩算法,现在的应用十分广泛,尤其是在Linux平台。

当应用Gzip压缩到一个纯文本文件时,效果是非常明显的,大约可以减少70%以上的文件大小,这取决于文件中的html、xml、css、js内容。 

利用Apache中的Gzip模块,我们可以使用Gzip压缩算法来对Apache服务器发布的网页内容进行压缩后再传输到客户端浏览器。

这样经过压缩后实际上降低了网络传输的字节数,最明显的好处就是可以加快网页加载的速度。

网页加载速度加快的好处不言而喻,除了节省流量,改善用户的浏览体验外,另一个潜在的好处是Gzip与搜索引擎的抓取工具有着更好的关系。

 

二、Web服务器处理

HTTP压缩的过程如下:

Web服务器接收到浏览器的HTTP请求后,检查浏览器是否支持HTTP压缩(Accept-Encoding 信息);

如果浏览器支持HTTP压缩,Web服务器检查请求文件的后缀名;

如果请求文件是HTML、CSS等静态文件,Web服务器到压缩缓冲目录中检查是否已经存在请求文件的最新压缩文件;

如果请求文件的压缩文件不存在,Web服务器向浏览器返回未压缩的请求文件,并在压缩缓冲目录中存放请求文件的压缩文件;

如果请求文件的最新压缩文件已经存在,则直接返回请求文件的压缩文件;

如果请求文件是动态文件,Web服务器动态压缩内容并返回浏览器,压缩内容不存放到压缩缓存目录中。

 

三、开启Gzip

Apache利用Gzip压缩算法进行压缩的模块有两种:mod_gzip mod_deflate

现在浏览器本身也自动Gzip压缩功能,支持 Accept-Encoding: gzip, deflate, br ,这里 firefox 或 chrome 浏览器下测试。

通过查看HTTP头,我们可以快速判断使用的客户端浏览器是否支持接受gzip压缩。

若发送的HTTP头中出现以下信息,则表明你的浏览器支持接受相应的gzip压缩:

Accept-Encoding: gzip 支持mod_gzip

Accept-Encoding: deflate 支持mod_deflate

Accept-Encoding: gzip,deflate  同时支持mod_gzip 和mod_deflate

Apache内置有mod_deflate模块来启用gzip功能,但假如安装apache的时候没有编译相关模块,就需要你手动安装一次,以启用它:

首先到你的apache源码目录,查找到mod_deflate.c文件,通常位置:apache httpd源码目录/modules/filters/mod_deflate.c,进入上面找到的目录运行下面的命令:

/usr/local/apache2/bin/apxs -i -c -a mod_deflate.c

注:apxs目录请参照您自己的机器,通常在apache安装目录的bin目录下。

安装完成,到apache的modules目录看看是不是有了mod_deflates.so,httpd.conf中打开deflate_Module和headers_Module模块:

LoadModule deflate_module modules/mod_deflate.so

 

最新版的 apche 2.4.x 中,需要修改 httpd.conf中打开deflate_Module和headers_Module模块,具体做法为将

如下两句前面的#去掉:

LoadModule deflate_module modules/mod_deflate.so

LoadModule headers_module modules/mod_headers.so

 

加载mod_deflate.so模块,默认安装会自动写入httpd.conf。

如果服务器开启了对Gzip组件的支持,那么我们就可以在http.conf定制文件压缩,下面是一个配置的简单实例:

1、mod_gzip方式

# mod_gzip

<ifModule mod_gzip.c>

mod_gzip_on Yes

mod_gzip_dechunk Yes

mod_gzip_item_include file \.(html?|txt|css|js|php|pl)$

mod_gzip_item_include handler ^cgi-script$

mod_gzip_item_include mime ^text/.*

mod_gzip_item_include mime ^application/x-javascript.*

mod_gzip_item_exclude rspheader ^Content-Encoding:.*gzip.*

<ifModule>

 

2、deflate_Module方式 (推荐

(1) 严格匹配文件类型(二选一)

# mod_deflate:

<ifmodule mod_deflate.c>

DeflateCompressionLevel 6 #压缩率, 6是建议值.

AddOutputFilterByType DEFLATE text/plain

AddOutputFilterByType DEFLATE text/html

AddOutputFilterByType DEFLATE text/php

AddOutputFilterByType DEFLATE text/xml

AddOutputFilterByType DEFLATE text/css

AddOutputFilterByType DEFLATE text/javascript

AddOutputFilterByType DEFLATE application/xhtml+xml

AddOutputFilterByType DEFLATE application/xml

AddOutputFilterByType DEFLATE application/rss+xml

AddOutputFilterByType DEFLATE application/atom_xml

AddOutputFilterByType DEFLATE application/x-javascript

AddOutputFilterByType DEFLATE application/x-httpd-php

AddOutputFilterByType DEFLATE image/svg+xml

AddOutputFilterByType DEFLATE image/gif image/png  image/jpe image/swf image/jpeg image/bmp

# Don’t compress images and other  #排除不需要压缩的文件

BrowserMatch ^Mozilla/4 gzip-only-text/html

BrowserMatch ^Mozilla/4\.0[678] no-gzip

BrowserMatch \bMSIE !no-gzip !gzip-only-text/html

SetEnvIfNoCase Request_URI .(?:html|htm)$ no-gzip dont-varySetEnvIfNoCase

SetEnvIfNoCase Request_URI .(?:gif|jpe?g|png)$ no-gzip dont-vary

SetEnvIfNoCase Request_URI .(?:exe|t?gz|zip|bz2|sit|rar)$ no-gzip dont-vary

SetEnvIfNoCase Request_URI .(?:pdf|doc)$ no-gzip dont-vary

</ifmodule>

 

(2) 过滤文件类型(二选一)

# mod_deflate:

<ifmodule mod_deflate.c>

DeflateCompressionLevel 6   # 压缩比取值 1 - 9,数值越大压缩比越大,压缩后的文件越小,占用CPU越多

SetOutputFilter DEFLATE    #压缩所有文件

#Don’t compress images and other  #过滤不需要压缩文件

#SetEnvIfNoCase Request_URI .(?:gif|jpe?g|png)$ no-gzip dont-vary

SetEnvIfNoCase Request_URI .(?:html|htm)$ no-gzip dont-vary

SetEnvIfNoCase Request_URI .(?:exe|t?gz|zip|bz2|sit|rar)$ no-gzip dont-vary

SetEnvIfNoCase Request_URI .(?:pdf|doc)$ no-gzip dont-vary

</IfModule>

文件MIME类型可以根据自己情况添加,也可以通过浏览器查看connect-type:

如上图,访问 html 网页,Content-Type: text/html

 

如上图,访问 xml 网页,Content-Type: application/xml

 

四、mod_gzip 和mod_deflate的主要区别是什么?(来自互联网)

第一个区别是安装它们的Apache Web服务器版本的差异。

Apache 1.x系列没有内建网页压缩技术,所以才去用额外的第三方mod_gzip 模块来执行压缩。

Apache 2.x官方在开发的时候,就把网页压缩考虑进去,内建了mod_deflate 这个模块,用以取代mod_gzip。

虽然两者都是使用的Gzip压缩算法,它们的运作原理是类似的。 

 

第二个区别是压缩质量。mod_deflate 压缩速度略快而mod_gzip 的压缩比略高。

一般默认情况下,mod_gzip 会比mod_deflate 多出4%~6%的压缩量。 那么,为什么使用mod_deflate?

 

第三个区别是对服务器资源的占用。 一般来说mod_gzip 对服务器CPU的占用要高一些。

mod_deflate 是专门为确保服务器的性能而使用的一个压缩模块,mod_deflate 需要较少的资源来压缩文件。

这意味着在高流量的服务器,使用mod_deflate 可能会比mod_gzip 加载速度更快。

 

五、验证压缩效果

firefox 浏览器查看: F12 ——》调试模式 ——》 网络 

没有启动Gzip压缩,原始 html 网页大小为 102.91 KB

启用了Gzip压缩,压缩比 DeflateCompressionLevel = 1时,网页大小,如下图

启用了Gzip压缩,压缩比 DeflateCompressionLevel = 6时,网页大小,如下图

启用了Gzip压缩,压缩比 DeflateCompressionLevel = 9时,网页大小,如下图

 

压缩比一览表,综合压缩比和CPU,推荐压缩数值 DeflateCompressionLevel = 6

压缩数值 网页大小(KB) 压缩比 说明
0 102.91 100.00 没有压缩
1 26.09 25.35 压缩后大小减少3/4
6 23.17 22.51 进一步压缩效果
9 23.02 22.37 压缩不再明显

 

最后,查看下 html、css、js 压缩效果还是很明显的,但 gif、png 没有压缩,因为图片已经是压缩过的,没必要再压缩

 

 

参考推荐:

WordPress:开启gzip压缩方法

WordPress:博客访问速度优化

Apache 中配置 expires

实用 .htaccess 用法大全

Apache启用GZIP压缩网页传输方法

php gzip压缩输出的实现方法

Ubuntu配置Apache

 

原文: Apache启用GZIP压缩网页传输方法