Nginx反向代理配置

反向代理（reverse proxy）是指用代理服务器来接受外部的访问请求，然后将请求转发给内网的上游服务器，并将从上游服务器上得到的结果返回外部客户端。作为反向代理是 Nginx 的一种常见用法。

reverse proxy

这里的负载均衡是指选择一种策略，尽量把请求平均地分布到每一台上游服务器上。下面介绍负载均衡的配置项。

# upstream

作为反向代理，一般都需要向上游服务器的集群转发请求。upstream 块定义了一个上游服务器的集群，便于反向代理中的 proxy_pass使用。

1
2
3
4
5
6
7


http {
    ...
    upstream backend {
        server 127.0.0.1:8080;
    }
    ...
}

upstream 定义了一组上游服务器，并命名为 backend。

# proxy_pass

proxy_pass 指令设置代理服务器的协议和地址。协议可以指定 “http “或 “https”。地址可以指定为域名或IP地址，也可以配置为 upstream 定义的上游服务器：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


http {
    server {
        listen       6888;
        server_name  localhost;

        location / {
            proxy_pass http://backend;
        }
    }
}

# proxy_set_header

在传递给上游服务器的请求头中，可以使用proxy_set_header 重新定义或添加字段。一般我们使用 proxy_set_header 向上游服务器传递一些必要的信息。

1
2
3
4
5
6


location / {
    proxy_set_header Host $http_host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_pass http://backend;
}

上面的配置使用 proxy_set_header 添加了三个 HTTP header：

Host

Host 是表明请求的主机名。默认情况下，Nginx 向上游服务器发送请求时，请求头中的 Host 字段是上游真实服务器的IP和端口号。如果我们想让传递给上游服务器的 Host 字段，包含的是用户访问反向代理时使用的域名，就需要通过 proxy_set_header 设置 Host 字段，值可以为 $host 或 $http_host，区别是前者只包含IP，而后者包含IP和端口号。

X-Real-IP

经过反向代理后，上游服务器无法直接拿到客户端的 ip，也就是说，在应用中使用request.getRemoteAddr() 获得的是 Nginx 的地址。通过 proxy_set_header X-Real-IP $remote_addr;，将客户端的 ip 添加到了 HTTP header中，让应用可以使用 request.getHeader(“X-Real-IP”) 获取客户端的真实ip。

X-Forwarded-For

如果配置了多层反向代理，当一个请求经过多层代理到达上游服务器时，上游服务器通过 X-Real-IP 获得的就不是客户端的真实IP了。那么这个时候就要用到 X-Forwarded-For ，设置 X-Forwarded-For 时是增加，而不是覆盖，从客户的真实IP为起点，穿过多层级代理，最终到达上游服务器，都会被记录下来。

# proxy_cache

Nginx 作为反向代理支持的所有特性和内置变量都可以在 ngx_http_proxy_module 的文档页面找到：

ngx_http_proxy_module

其中一个比较重要的特性是 proxy cache，对访问上游服务器的请求进行缓存，极大减轻了对上游服务的压力。

配置示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


http {
    ...
    proxy_cache_path /tmp/nginx/cache levels=1:2 keys_zone=myzone:10m inactive=1h max_size=10g use_temp_path=off;
    server {
        ...
        location / {
            ...
            proxy_cache myzone;
            proxy_cache_key $host$uri$is_args$args;
            proxy_cache_valid 200 304 302 12h;
        }
    }
}

配置说明：

proxy_cache_path 缓存路径，要把缓存放在哪里
- levels=1:2：缓存的目录结构
- keys_zone=myzone:10m：定义一块用于存放缓存key的共享内存区，命名为myzone，并分配 10MB 的内存；配至10MB的zone 大约可以存放 80000个key。
- inactive=1d：不活跃的缓存文件 1 小时后将被清除
- max_size=10g：缓存所占磁盘空间的上限
- use_temp_path=off：不另设临时目录
proxy_cache myzone;：代表要使用上面定义的 myzone
proxy_cache_key：用于生成缓存键，区分不同的资源。key 是决定缓存命中率的因素之一。
- $host：request header中的 Host字段
- $uri：请求的uri
- $is_args 反映请求的 URI 是否带参数，若没有即为空值。
- $args：请求中的参数
proxy_cache_valid：控制缓存有效期，可以针对不同的 HTTP 状态码可以设定不同的有效期。示例针对 200，304，302 状态码的缓存有效期为12小时。

检验缓存配置的效果。

首先查看缓存路径，没有存放任何内容：

1
2
3
4


$ tree /tmp/nginx/cache/
/tmp/nginx/cache/

0 directories, 0 files

然后访问Nginx反向代理服务器：

1
2
3


❯ curl -v http://172.21.32.84:6888/

...

再次查看缓存路径：

1
2
3
4
5
6
7


$ tree /tmp/nginx/cache/
/tmp/nginx/cache/
└── 6
    └── ed
        └── 5e9596b7783c532f541535dd1a60eed6

2 directories, 1 file

经过请求后，缓存路径中已经有内容，并且目录结构是我们配置的 level=1:2。