利用.htaccess的URL重写(url rewriting)功能实现网站页面伪静态-Apache HTTP Server

URL重写 (URL Rewriting) 是一种REST的相关技术,它可以在 Web Server 中,针对用户所提供的 URL 进行转换后,再传入 Web Server 中的程序处理器.

最常见的用法,就是将一组 URL 层次结构字符串,转换成带有 query string 的 URL,例如:

lihttp://www.renniaofei.com/single.php?cat=code&name=url-rewriting

经过 URL 重写后,可以变成:

http://www.renniaofei.com/code/url-rewriting/

URL重写 (URL Rewriting)的优点:

  1. URL友好,方便用户使用,提高用户体验。
  2. 有利于搜索引擎的优化,并且比生成静态更加方便。
  3. 应用程序开发者可以利用这个机制来将参数隐藏起来,可避免让网络上的恶意用户收集到利于发动攻击的信息。

URL重写 (URL Rewriting)的一个简单示例

将product.php?id=12 重写为 product-12.html

.htaccess代码如下:

RewriteEngine on
RewriteRule ^product-([0-9]+)\.html$ product.php?id=$1

URL重写 (URL Rewriting)模块说明

Apache HTTP Server / Module mod_rewrite
/ URL Rewriting Engine

具体配置说明(Configuration Directives)请参考官方网站(http://httpd.apache.org),具体包括下面9个方面(一般情况下只需要配置粗体字部分即可):

  1. RewriteEngine
  2. RewriteOptions
  3. RewriteLog
  4. RewriteLogLevel
  5. RewriteLock
  6. RewriteMap
  7. RewriteBase
  8. RewriteCond
  9. RewriteRule

下面对上面粗体字部分做简单说明:

1. rewriteEngine: On | Off ,默认值为Off,打开或关闭rewrite功能。

rewrite configurations 不会继承,所以你得给每个你想用 rewrite功能的virtual host加上这个指令。

7. RewriteBase URL-path ,显式地设置了目录级重写的基准URL。

RewriteRule可以用于目录级的配置文件中(.htaccess)并在局部范围内起作用,即规则实际处理的只是剥离了本地路径前缀的一部分。处理结束后,这个路径会被自动地附着回去。默认值是”RewriteBase physical-directory-path”。
在对一个新的URL进行替换时,此模块必须把这个URL重新注入到服务器处理中。为此,它必须知道其对应的URL前缀或者说URL基准。通常,此前缀就是对应的文件路径。但是,大多数网站URL不是直接对应于其物理文件路径的,因而一般不能做这样的假定! 所以在这种情况下,就必须用RewriteBase指令来指定正确的URL前缀。
如果你的网站服务器URL不是与物理文件路径直接对应的,而又需要使用RewriteBase指令,则必须在每个对应的.htaccess文件中指定 RewriteRule 。

8. RewriteCond TestString CondPattern ,定义了一个规则的条件。

9. RewriteRule Pattern Substitution [flags]

正则表达式常用语法(regular expressions):

Text:
  .           任何单字符
  [chars]     Character class: One  of chars
  [^chars]    Character class: None of chars
  text1|text2 两者选一个: text1 or text2

Quantifiers:量词
  ?           0 or 1 of the 前面的 text
  *           0 or N of the 前面的 text (N > 0)
  +           1 or N of the 前面的 text (N > 1)

Grouping:
  (text)      Grouping of text

可用$N来得到()中的内容:
 ( (a|b) | (c|d))
$1 $2      $3  

Anchors:
  ^           Start of line anchor
  $           End   of line anchor

Escaping:
  \char       escape that particular char
              (for instance to specify the chars ".[]()" etc.)

注意:没有并且&

flags

  1. ‘redirect|R [=code]‘ (强制重定向 redirect)

    以http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的), permanent, seeother. 用它可以把规范化的URL反馈给客户端,如, 重写“/~”为 “/u/”,或对/u/user加上斜杠,等等。

    注意: 在使用这个标记时,必须确保该替换字段是一个有效的URL! 否则,它会指向一个无效的位置! 并且要记住,此标记本身只是对URL加上 http://thishost[:thisport]/的前缀,重写操作仍然会继续。 通常,你会希望停止重写操作而立即重定向,则还需要使用’L'标记.

  2. ‘forbidden|F’ (强制URL为被禁止的 forbidden)

    强制当前URL为被禁止的,即,立即反馈一个HTTP响应代码403(被禁止的)。 使用这个标记,可以链接若干RewriteConds以有条件地阻塞某些URL。

  3. ‘gone|G’ (强制URL为已废弃的 gone)

    强制当前URL为已废弃的,即,立即反馈一个HTTP响应代码410(已废弃的)。 使用这个标记,可以标明页面已经被废弃而不存在了.

  4. ‘proxy|P’ (强制为代理 proxy)

    此标记使替换成分被内部地强制为代理请求,并立即(即, 重写规则处理立即中断)把处理移交给代理模块。 你必须确保此替换串是一个有效的(比如常见的以 http://hostname开头的)能够为Apache代理模块所处理的URI。 使用这个标记,可以把某些远程成分映射到本地服务器名称空间, 从而增强了ProxyPass指令的功能。
    注意: 要使用这个功能,代理模块必须编译在Apache服务器中。 如果你不能确定,可以检查“httpd -l”的输出中是否有mod_proxy.c。 如果有,则mod_rewrite可以使用这个功能; 如果没有,则必须启用mod_proxy并重新编译“httpd”程序。

  5. ‘last|L’ (最后一个规则 last)

    立即停止重写操作,并不再应用其他重写规则。 它对应于Perl中的last命令或C语言中的break命令。 这个标记可以阻止当前已被重写的URL为其后继的规则所重写。 举例,使用它可以重写根路径的URL(‘/’)为实际存在的URL, 比如, ‘/e/www/’.

  6. ‘next|N’ (重新执行 next round)

    重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。 它对应于Perl中的next命令或C语言中的continue命令。 此标记可以重新开始重写操作,即, 立即回到循环的头部。
    但是要小心,不要制造死循环!

  7. ‘chain|C’ (与下一个规则相链接 chained)

    此标记使当前规则与下一个(其本身又可以与其后继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, 即,这个标记不起作用;如果规则不能被匹配, 则其后继的链接的规则会被忽略。比如,在执行一个外部重定向时, 对一个目录级规则集,你可能需要删除“.www” (此处不应该出现“.www”的)。

  8. ‘type|T=MIME-type’ (强制MIME类型 type)

    强制目标文件的MIME类型为MIME-type。 比如,它可以用于模拟mod_alias中的ScriptAlias指令, 以内部地强制被映射目录中的所有文件的MIME类型为“application/x-httpd-cgi”.

  9. ‘nosubreq|NS’ (仅用于不对内部子请求进行处理 no internal sub-request)

    在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。 比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用, 它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。

    根据你的需要遵循以下原则: 如果你使用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理, 而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。

  10. ‘nocase|NC’ (忽略大小写 no case)

    它使Pattern忽略大小写,即, 在Pattern与当前URL匹配时,’A-Z’ 和’a-z’没有区别。

  11. ‘qsappend|QSA’ (追加请求串 query string append)

    此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。

  12. ‘noescape|NE’ (在输出中不对URI作转义 no URI escaping)

    此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(如’%', ‘$’, ‘;’等)会被转义为等值的十六进制编码。 此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,如:
    RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]

    可以使’/foo/zed’转向到一个安全的请求’/bar?arg=P1=zed’.

  13. ‘passthrough|PT’ (移交给下一个处理器 pass through)

    此标记强制重写引擎将内部结构request_rec中的uri字段设置为 filename字段的值,它只是一个小修改,使之能对来自其他URI到文件名翻译器的 Alias,ScriptAlias, Redirect 等指令的输出进行后续处理。举一个能说明其含义的例子: 如果要通过mod_rewrite的重写引擎重写/abc为/def, 然后通过mod_alias使/def转变为/ghi,可以这样:
    RewriteRule ^/abc(.*) /def$1 [PT]

    Alias /def /ghi

    如果省略了PT标记,虽然mod_rewrite运作正常, 即, 作为一个使用API的URI到文件名翻译器, 它可以重写uri=/abc/…为filename=/def/…, 但是,后续的mod_alias在试图作URI到文件名的翻译时,则会失效。

    注意: 如果需要混合使用不同的包含URI到文件名翻译器的模块时, 就必须使用这个标记。混合使用mod_alias和mod_rewrite就是个典型的例子。

    For Apache hackers

    如果当前Apache API除了URI到文件名hook之外,还有一个文件名到文件名的hook, 就不需要这个标记了! 但是,如果没有这样一个hook,则此标记是唯一的解决方案。 Apache Group讨论过这个问题,并在Apache 2.0 版本中会增加这样一个hook。

  14. ‘skip|S=num’ (跳过后继的规则 skip)

    此标记强制重写引擎跳过当前匹配规则后继的num个规则。 它可以实现一个伪if-then-else的构造: 最后一个规则是then从句,而被跳过的skip=N个规则是else从句. (它和’chain|C’标记是不同的!)

  15. ‘env|E=VAR:VAL’ (设置环境变量 environment variable)

    此标记使环境变量VAR的值为VAL, VAL可以包含可扩展的反向引用的正则表达式$N和%N。 此标记可以多次使用以设置多个变量。 这些变量可以在其后许多情况下被间接引用,但通常是在XSSI (via or CGI (如 $ENV{‘VAR’})中, 也可以在后继的RewriteCond指令的pattern中通过%{ENV:VAR}作引用。 使用它可以从URL中剥离并记住一些信息。

  16. ‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]’ (设置cookie)

    它在客户端浏览器上设置一个cookie。 cookie的名称是NAME,其值是VAL。 domain字段是该cookie的域,比如’.apache.org’, 可选的lifetime是cookie生命期的分钟数, 可选的path是cookie的路径。

Url Rewriting 实例:

1. 下载链接伪静态

RewriteEngine on
          RewriteRule ^files/([^/]+)/([^/]+).zip   /download.php?section=$1&file=$2 [NC]
       重写后的url:http://mysite/files/games/hoopy.zip

2. url简化

 RewriteEngine On
          RewriteRule ^grab /public/files/download/download.php

服务器端地址:http://mysite/public/files/download/download.php?file=my.zip

转化后url:http://mysite/grab?file=my.zip

3. $_GET变量捕捉更换

RewriteEngine On
          RewriteCond %{QUERY_STRING} foo=(.*)
          RewriteRule ^grab(.*) /page.php?bar=%1

服务器端地址:

http://domain.com/page.php?bar=bar

URL转化后:

http://domain.com/grab?foo=bar

4. 域名指向新文件

RewriteEngine On
          RewriteCond %{HTTP_HOST} ^test\.com$ [OR]
          RewriteCond %{HTTP_HOST} ^www\.test\.com$
          RewriteCond %{REQUEST_URI} !^/new/
          RewriteRule (.*)   /new/$1 

当网站改版时,可直接使用上面代码将域名指向新版完站的文件夹。

5. 将不带www的URL请求转向到带www的URL

RewriteEngine On
          RewriteCond %{HTTP_HOST} ^renniaofei\.com$
          RewriteRule (.*) http://www.renniaofei.com/$1 [R=301,L]

6. 防盗链功能

RewriteEngine On
       RewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC]
       RewriteCond %{HTTP_REFERER} !^$
       RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L] 

Url rewriting 在线工具:http://www.iwebtool.com/htaccess_url_rewrite

2 Comments

  1. deli says:

    写得不错,正好搜索到这篇,用的着。

  2. Pingback: 网站可以正常访问,但header却返回 HTTP/1.1 404 Not Found,导致搜索引擎收录减少 | 任鸟飞网站设计博客 | 海阔凭鱼跃,天高任鸟飞!

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

:wink: :-| :-x :twisted: :) 8-O :( :roll: :-P :oops: :-o :mrgreen: :lol: :idea: :-D :evil: :cry: 8) :arrow: :-? :?: :!:

无觅相关文章插件,快速提升流量

任鸟飞网页设计博客 谜题推理 No.1 Web Design Gallery IndustryIdea LookForDesign AWebGallery Mobile Web Template iDesign Wallpaper Big Funny Picture iPhone Faves iPhone Mobi iPad Faves Android Faves BlackBerry Faves Best Design Magazine All Banner Templates Blog Earn Tips 是谁啊 只爱美人 家乡美 唯美爱 美人衣妆 AutoCAD 2D | Pro/E 3D江苏名企The HTML5 Templates