语法规则: location [=|~|~*|^~] /uri/ { … }

= 开头表示精确匹配
^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可。nginx不对url做编码,因此请求为/static/20%/aa,可以被规则^~ /static/ /aa匹配到(注意是空格)。
~ 开头表示区分大小写的正则匹配
~* 开头表示不区分大小写的正则匹配
!~和!~*分别为区分大小写不匹配及不区分大小写不匹配 的正则
/ 通用匹配,任何请求都会匹配到。
多个location配置的情况下匹配顺序为(参考资料而来,还未实际验证,试试就知道了,不必拘泥,仅供参考):
首先匹配 =,其次匹配^~, 其次是按文件中顺序的正则匹配,最后是交给 / 通用匹配。当有匹配成功时候,停止匹配,按当前匹配规则处理请求。
例子,有如下匹配规则:
location = / {
  #规则A
}
location = /login {
  #规则B
}
location ^~ /static/ {
  #规则C
}
location ~ \.(gif|jpg|png|js|css)$ {
  #规则D
}
location ~* \.png$ {
  #规则E
}
location !~ \.xhtml$ {
  #规则F
}
location !~* \.xhtml$ {
  #规则G
}
location / {
  #规则H
}
那么产生的效果如下:
访问根目录/, 比如将匹配规则A
访问 将匹配规则B,则匹配规则H
访问 将匹配规则C
访问 ,将匹配规则D和规则E,但是规则D顺序优先,规则E不起作用,而 则优先匹配到规则C
访问 则匹配规则E,而不会匹配规则D,因为规则E不区分大小写。
访问 不会匹配规则F和规则G,不会匹配规则G,因为不区分大小写。规则F,规则G属于排除法,符合匹配规则但是不会匹配到,所以想想看实际应用中哪里会用到。
访问 则最终匹配到规则H,因为以上规则都不匹配,这个时候应该是nginx转发请求给后端应用服务器,比如FastCGI(php),tomcat(jsp),nginx作为方向代理服务器存在。

所以实际使用中,个人觉得至少有三个匹配规则定义,如下:
#直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,官网如是说。
#这里是直接转发给后端应用服务器了,也可以是一个静态首页
# 第一个必选规则
location = / {
   proxy_pass
}
# 第二个必选规则是处理静态文件请求,这是nginx作为http服务器的强项
# 有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
   root /webroot/static/;
}
location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
   root /webroot/res/;
}
#第三个规则就是通用规则,用来转发动态请求到后端应用服务器
#非静态文件请求就默认是动态请求,自己根据实际把握
#毕竟目前的一些框架的流行,带.php,.jsp后缀的情况很少了
location / {
   proxy_pass
}

三、ReWrite语法

last – 基本上都用这个Flag。
break – 中止Rewirte,不在继续匹配
redirect – 返回临时重定向的HTTP状态302
permanent – 返回永久重定向的HTTP状态301
1、下面是可以用来判断的表达式:
-f和!-f用来判断是否存在文件
-d和!-d用来判断是否存在目录
-e和!-e用来判断是否存在文件或目录
-x和!-x用来判断文件是否可执行
2、下面是可以用作判断的全局变量
例:
$host:localhost
$server_port:88
$request_uri:
$document_uri:/test1/test2/test.php
$document_root:D:\nginx/html
$request_filename:D:\nginx/html/test1/test2/test.php
四、Redirect语法
server {
listen 80;
server_name start.igrow.cn;
index index.html index.php;
root html;
if ($http_host !~ “^star\.igrow\.cn$&quot {
rewrite ^(.*) redirect;
}
}
五、防盗链
location ~* \.(gif|jpg|swf)$ {
valid_referers none blocked start.igrow.cn sta.igrow.cn;
if ($invalid_referer) {
rewrite ^/ ;
}
}
六、根据文件类型设置过期时间
location ~* \.(js|css|jpg|jpeg|gif|png|swf)$ {
if (-f $request_filename) {
expires 1h;
break;
}
}
七、禁止访问某个目录
location ~* \.(txt|doc)${
root /data/www/wwwroot/linuxtone/test;
deny all;
}
一些可用的全局变量:
$args
$content_length
$content_type
$document_root
$document_uri
$host
$http_user_agent
$http_cookie
$limit_rate
$request_body_file
$request_method
$remote_addr
$remote_port
$remote_user
$request_filename
$request_uri
$query_string
$scheme
$server_protocol
$server_addr
$server_name
$server_port
$uri

 

在实际配置中,有的地方用last并不能工作,换成break就可以,其中的原理是对于根目录的理解有所区别,按我的测试结果大致是这样的。

#location / {
#proxy_pass http://test;
#alias /home/html/;
#root /home/html;
#rewrite "^/a/(.*)/.html$" /1.html last;
#}
在#location / { 配置里:
1、使用root指定源:使用last和break都可以
2、使用proxy_pass指定源:使用last和break都可以
3、使用alias指定源:必须使用last
在location /a/或使用正则的location ~ ^/a/里:
1、使用root指定源:使用last和break都可以
2、使用proxy_pass指定源:使用break和last结果有所区别
3、使用alias指定源:必须使用last
其中区别主要在proxy_pass这个标签上,再看看几个测试结果:
location / {
root /home/html;
}
location /a/ {
proxy_pass http://test;
rewrite "^/a/(.*)/.html$" /1.html last;
}
在这段配置里,使用last访问是可以访问到东西的,不过,它出来的结果是:/home/html/1.html;可我需要的是http://test/1.html?使用break就可以了。
location / {
root /home/html;
}
location /a/ {
proxy_pass http://test;
rewrite "^/a/(.*)/.html$" /a/1.html last;
}
在这段配置里,返回错误,因为last会重新发起请求匹配,所以造成了一个死循环,使用break就可以访问到http://test/a/1.html。
所 以,使用last会对server标签重新发起请求,而break就直接使用当前的location中的数据源来访问,要视情况加以使用。一般在非根的 location中配置rewrite,都是用的break;而根的location使用last比较好,因为如果配置了fastcgi或代理访问jsp 文件的话,在根location下用break是访问不到。测试到rewrite有问题的时候,也不妨把这两者换换试试。
至于使用alias时为什么必须用last,估计是nginx本身就限定了的,怎么尝试break都不能成功。

正则表达式:

昨天碰到的问题,在BBs问了得出的答应如下./(.+?)b/is  是非贪婪模式 匹配ab /(.*)b/is 是贪婪模式 匹配abb,

那么我们来看看基本的符号说明:

*                                0次、1次或多次匹配其前的原子

+                                1次或多次匹配其前的原子
?                                0次或1次匹配其前的原子
.                                匹配除换行之外的任何一个字符

再看看简单的例子:

你测试.+?和.*当然看不出区别了

测试这个字符串看看
'aaa<div style="font-color:red;">123456</div>bbb'
<.+?>会匹配<div style="font-color:red;">和</div>
<.*>会匹配<div style="font-color:red;">123456</div>

最后看看高手怎么说的.

(.+)默认这是贪婪匹配

贪婪是先看整个字符串是否匹配, 如果不匹配,它会去掉字符串的最后一个字符, 并再次尝式, 如果还不匹配, 那么再去掉当前最后一个, 直到发现匹配或不剩任何字符.
过程大概这样:
$str='abcdabceba'
/.+b/  // 匹配一个或多个任意字符后面跟一个字母 b
第一次(先看整个字符串是否是一个匹配) abcdabceba 不匹配,然后去掉最后一个字符 a
第二次(去掉最后一个字符后再匹配) abcdabceb  正确退出
惰性是从左侧第一个字符开始向右匹配, 先看第一个字符是不是一个匹配, 如果不匹配就加入下一个字符再尝式匹配, 直到发现匹配...
过程大概这样
$str='abcdabceba'
/.+?b/ // 同样匹配一个或多个任意字符后面跟一个字母 b
第一次(读入左侧第一个字符) a 不匹配加一个再式
第二次 ab  匹配记录下来,继续(如果匹配所有的话,比如 preg_match_all, 或preg_replace, 不是所有到这儿就停了
第三次 c
...
cdab  匹配记录下来,继续
...
ceb  匹配记录下来,继续
a 到最后了没有了退出
简单例子:
<?php
//这里因为没有用all, .+?只匹配一次
        
$str='abcdabceba';
        
preg_match('/.+b/', $str, $s);
        echo
$s[0]; // abcdabceb
        
        
echo"   ";
        
preg_Match('/.+?b/', $str, $s);
        echo
$s[0]; // ab
        
        
echo"   ";
        
preg_Match('/.+b/U', $str, $s); //等同于 /.+?b/
        
echo $s[0]; //ab
?>