0元购京东自营斐讯K2路由器返399元活动
置顶

利用.htaccess的URL重写(url rewriting)功能实现网站页面伪静态-Apache HTTP Server

作者:     目录: 小代码 & 网页设计软件及工具     发表: 2010年02月19日

URL重写 (URL Rewriting) 是一种REST的相关技术,它可以在 Web Server 中,针对用户所提供的 URL 进行转换后,再传入 Web Server 中的程序处理器.

最常见的用法,就是将一组 URL 层次结构字符串,转换成带有 query string 的 URL,例如:

lihttp://renniaofei.com/single.php?cat=code&name=url-rewriting

经过 URL 重写后,可以变成:

http://renniaofei.com/code/url-rewriting/

URL重写 (URL Rewriting)的优点:

  1. URL友好,方便用户使用,提高用户体验。
  2. 有利于搜索引擎的优化,并且比生成静态更加方便。
  3. 应用程序开发者可以利用这个机制来将参数隐藏起来,可避免让网络上的恶意用户收集到利于发动攻击的信息。

URL重写 (URL Rewriting)的一个简单示例

将product.php?id=12 重写为 product-12.html

.htaccess代码如下:

RewriteEngine on
RewriteRule ^product-([0-9]+)\.html$ product.php?id=$1

URL重写 (URL Rewriting)模块说明

Apache HTTP Server / Module mod_rewrite
/ URL Rewriting Engine

具体配置说明(Configuration Directives)请参考官方网站(http://httpd.apache.org),具体包括下面9个方面(一般情况下只需要配置粗体字部分即可):

  1. RewriteEngine
  2. RewriteOptions
  3. RewriteLog
  4. RewriteLogLevel
  5. RewriteLock
  6. RewriteMap
  7. RewriteBase
  8. RewriteCond
  9. RewriteRule

下面对上面粗体字部分做简单说明:

1. rewriteEngine: On | Off ,默认值为Off,打开或关闭rewrite功能。

rewrite configurations 不会继承,所以你得给每个你想用 rewrite功能的virtual host加上这个指令。

7. RewriteBase URL-path ,显式地设置了目录级重写的基准URL。

RewriteRule可以用于目录级的配置文件中(.htaccess)并在局部范围内起作用,即规则实际处理的只是剥离了本地路径前缀的一部分。处理结束后,这个路径会被自动地附着回去。默认值是”RewriteBase physical-directory-path”。
在对一个新的URL进行替换时,此模块必须把这个URL重新注入到服务器处理中。为此,它必须知道其对应的URL前缀或者说URL基准。通常,此前缀就是对应的文件路径。但是,大多数网站URL不是直接对应于其物理文件路径的,因而一般不能做这样的假定! 所以在这种情况下,就必须用RewriteBase指令来指定正确的URL前缀。
如果你的网站服务器URL不是与物理文件路径直接对应的,而又需要使用RewriteBase指令,则必须在每个对应的.htaccess文件中指定 RewriteRule 。

8. RewriteCond TestString CondPattern ,定义了一个规则的条件。

9. RewriteRule Pattern Substitution [flags]

正则表达式常用语法(regular expressions):

Text:
  .           任何单字符
  [chars]     Character class: One  of chars
  [^chars]    Character class: None of chars
  text1|text2 两者选一个: text1 or text2

Quantifiers:量词
  ?           0 or 1 of the 前面的 text
  *           0 or N of the 前面的 text (N > 0)
  +           1 or N of the 前面的 text (N > 1)

Grouping:
  (text)      Grouping of text

可用$N来得到()中的内容:
 ( (a|b) | (c|d))
$1 $2      $3  

Anchors:
  ^           Start of line anchor
  $           End   of line anchor

Escaping:
  \char       escape that particular char
              (for instance to specify the chars ".[]()" etc.)

注意:没有并且&

flags

  1. ‘redirect|R [=code]’ (强制重定向 redirect)

    以http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的), permanent, seeother. 用它可以把规范化的URL反馈给客户端,如, 重写“/~”为 “/u/”,或对/u/user加上斜杠,等等。

    注意: 在使用这个标记时,必须确保该替换字段是一个有效的URL! 否则,它会指向一个无效的位置! 并且要记住,此标记本身只是对URL加上 http://thishost[:thisport]/的前缀,重写操作仍然会继续。 通常,你会希望停止重写操作而立即重定向,则还需要使用’L’标记.

  2. ‘forbidden|F’ (强制URL为被禁止的 forbidden)

    强制当前URL为被禁止的,即,立即反馈一个HTTP响应代码403(被禁止的)。 使用这个标记,可以链接若干RewriteConds以有条件地阻塞某些URL。

  3. ‘gone|G’ (强制URL为已废弃的 gone)

    强制当前URL为已废弃的,即,立即反馈一个HTTP响应代码410(已废弃的)。 使用这个标记,可以标明页面已经被废弃而不存在了.

  4. ‘proxy|P’ (强制为代理 proxy)

    此标记使替换成分被内部地强制为代理请求,并立即(即, 重写规则处理立即中断)把处理移交给代理模块。 你必须确保此替换串是一个有效的(比如常见的以 http://hostname开头的)能够为Apache代理模块所处理的URI。 使用这个标记,可以把某些远程成分映射到本地服务器名称空间, 从而增强了ProxyPass指令的功能。
    注意: 要使用这个功能,代理模块必须编译在Apache服务器中。 如果你不能确定,可以检查“httpd -l”的输出中是否有mod_proxy.c。 如果有,则mod_rewrite可以使用这个功能; 如果没有,则必须启用mod_proxy并重新编译“httpd”程序。

  5. ‘last|L’ (最后一个规则 last)

    立即停止重写操作,并不再应用其他重写规则。 它对应于Perl中的last命令或C语言中的break命令。 这个标记可以阻止当前已被重写的URL为其后继的规则所重写。 举例,使用它可以重写根路径的URL(‘/’)为实际存在的URL, 比如, ‘/e/www/’.

  6. ‘next|N’ (重新执行 next round)

    重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。 它对应于Perl中的next命令或C语言中的continue命令。 此标记可以重新开始重写操作,即, 立即回到循环的头部。
    但是要小心,不要制造死循环!

  7. ‘chain|C’ (与下一个规则相链接 chained)

    此标记使当前规则与下一个(其本身又可以与其后继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, 即,这个标记不起作用;如果规则不能被匹配, 则其后继的链接的规则会被忽略。比如,在执行一个外部重定向时, 对一个目录级规则集,你可能需要删除“.www” (此处不应该出现“.www”的)。

  8. ‘type|T=MIME-type’ (强制MIME类型 type)

    强制目标文件的MIME类型为MIME-type。 比如,它可以用于模拟mod_alias中的ScriptAlias指令, 以内部地强制被映射目录中的所有文件的MIME类型为“application/x-httpd-cgi”.

  9. ‘nosubreq|NS’ (仅用于不对内部子请求进行处理 no internal sub-request)

    在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。 比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用, 它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。

    根据你的需要遵循以下原则: 如果你使用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理, 而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。

  10. ‘nocase|NC’ (忽略大小写 no case)

    它使Pattern忽略大小写,即, 在Pattern与当前URL匹配时,’A-Z’ 和’a-z’没有区别。

  11. ‘qsappend|QSA’ (追加请求串 query string append)

    此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。

  12. ‘noescape|NE’ (在输出中不对URI作转义 no URI escaping)

    此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(如’%’, ‘$’, ‘;’等)会被转义为等值的十六进制编码。 此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,如:
    RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]

    可以使’/foo/zed’转向到一个安全的请求’/bar?arg=P1=zed’.

  13. ‘passthrough|PT’ (移交给下一个处理器 pass through)

    此标记强制重写引擎将内部结构request_rec中的uri字段设置为 filename字段的值,它只是一个小修改,使之能对来自其他URI到文件名翻译器的 Alias,ScriptAlias, Redirect 等指令的输出进行后续处理。举一个能说明其含义的例子: 如果要通过mod_rewrite的重写引擎重写/abc为/def, 然后通过mod_alias使/def转变为/ghi,可以这样:
    RewriteRule ^/abc(.*) /def$1 [PT]

    Alias /def /ghi

    如果省略了PT标记,虽然mod_rewrite运作正常, 即, 作为一个使用API的URI到文件名翻译器, 它可以重写uri=/abc/…为filename=/def/…, 但是,后续的mod_alias在试图作URI到文件名的翻译时,则会失效。

    注意: 如果需要混合使用不同的包含URI到文件名翻译器的模块时, 就必须使用这个标记。混合使用mod_alias和mod_rewrite就是个典型的例子。

    For Apache hackers

    如果当前Apache API除了URI到文件名hook之外,还有一个文件名到文件名的hook, 就不需要这个标记了! 但是,如果没有这样一个hook,则此标记是唯一的解决方案。 Apache Group讨论过这个问题,并在Apache 2.0 版本中会增加这样一个hook。

  14. ‘skip|S=num’ (跳过后继的规则 skip)

    此标记强制重写引擎跳过当前匹配规则后继的num个规则。 它可以实现一个伪if-then-else的构造: 最后一个规则是then从句,而被跳过的skip=N个规则是else从句. (它和’chain|C’标记是不同的!)

  15. ‘env|E=VAR:VAL’ (设置环境变量 environment variable)

    此标记使环境变量VAR的值为VAL, VAL可以包含可扩展的反向引用的正则表达式$N和%N。 此标记可以多次使用以设置多个变量。 这些变量可以在其后许多情况下被间接引用,但通常是在XSSI (via or CGI (如 $ENV{‘VAR’})中, 也可以在后继的RewriteCond指令的pattern中通过%{ENV:VAR}作引用。 使用它可以从URL中剥离并记住一些信息。

  16. ‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]’ (设置cookie)

    它在客户端浏览器上设置一个cookie。 cookie的名称是NAME,其值是VAL。 domain字段是该cookie的域,比如’.apache.org’, 可选的lifetime是cookie生命期的分钟数, 可选的path是cookie的路径。

Url Rewriting 实例:

1. 下载链接伪静态

RewriteEngine on
          RewriteRule ^files/([^/]+)/([^/]+).zip   /download.php?section=$1&file=$2 [NC]
       重写后的url:http://mysite/files/games/hoopy.zip

2. url简化

 RewriteEngine On
          RewriteRule ^grab /public/files/download/download.php

服务器端地址:http://mysite/public/files/download/download.php?file=my.zip

转化后url:http://mysite/grab?file=my.zip

3. $_GET变量捕捉更换

RewriteEngine On
          RewriteCond %{QUERY_STRING} foo=(.*)
          RewriteRule ^grab(.*) /page.php?bar=%1

服务器端地址:
http://domain.com/page.php?bar=bar

URL转化后:
http://domain.com/grab?foo=bar

4. 域名指向新文件

RewriteEngine On
          RewriteCond %{HTTP_HOST} ^test\.com$ [OR]
          RewriteCond %{HTTP_HOST} ^www\.test\.com$
          RewriteCond %{REQUEST_URI} !^/new/
          RewriteRule (.*)   /new/$1 

当网站改版时,可直接使用上面代码将域名指向新版完站的文件夹。

5. 将不带www的URL请求转向到带www的URL

RewriteEngine On
          RewriteCond %{HTTP_HOST} ^renniaofei\.com$
          RewriteRule (.*) http://renniaofei.com/$1 [R=301,L]

6. 防盗链功能

RewriteEngine On
       RewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC]
       RewriteCond %{HTTP_REFERER} !^$
       RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L] 

Url rewriting 在线工具:http://www.iwebtool.com/htaccess_url_rewrite

标签: .

deli进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注