何为反向代理?
在介绍反向代理之前,先来了解一下正向代理。
正向代理:如果把局域网外的Internet想象成一个巨大的资源库,则局域网中的客户端要访问Internet,则需要通过代理服务器来访问,这种代理服务就称为正向代理,下面是正向代理的原理图。
由于工作环境原因,日常工作只能局限于单位的局域网,如果想要访问互联网,怎么办呢?这就需要用到正向代理,本人经常用正向代理来进行上网
反向代理:
看下面原理图,就一目了然。其实客户端对代理是无感知的,因为客户端不需要任何配置就可以访问,我们只需要将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后,在返回给客户端,此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器 IP地址。
正向代理和反向代理的区别,一句话就是:如果我们客户端自己用,就是正向代理。如果是在服务器用,用户无感知,就是反向代理。
Nginx配置文件
在学习 Nginx之前,要熟知它的配置文件,毕竟,下面需要做的所有配置(反向代理、负载均衡、动静分离等),都是基于它的配置文件。
Nginx默认的配置文件是在安装目录下的 conf目录下,后续对 Nginx的使用基本上都是对此配置文件进行相应的修改。完整的配置文件,可以看一下文章最后。修改过nginx.conf配置文件,记得要重启Nginx服务
配置文件中有很多#号,该符号表示注释内容,去掉所有以 #开头的段落,精简之后的配置文件内容如下(PS:其实注释掉的地方,都是一些功能的使用代码,需要用到的时候,取消注释即可):
# 主进程叫master,负责管理子进程,子进程叫worker
# worker_processes配置项表示开启几个业务进程,一般和cpu核数有关
worker_processes 1;
events {
worker_connections 1024;
}
http {
# include表示可以引入其他文件,此处表示引入http mime类型
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
# 虚拟主机,可以配置多个
server {
listen 80;
server_name localhost;
location / {
# 路径匹配之后,哪个目录下去匹配相应的网页,html是相对路径
root html;
index index.html index.htm;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
去掉注释信息后,可以将 nginx.conf
配置文件分为三部分
第一部分:全局块
worker_processes 1024;
从配置文件开始到events块之间的内容,主要会设置一些影响Nginx服务器整体运行的配置指令,主要包括:配置运行Nginx服务器的用户(组)、允许生成的 worker process 数,进程PID存放路径、日志存放路径和类型以及配置文件的引入等。
上面这行 worker_processes 配置,是 Nginx 服务器并发处理服务的关键配置,该值越大,可以支持的并发处理量也越多,但是会受到硬件、软件等设备的约束。
第二部分:events 块
events {
worker_connections 1024;
}
events 块涉及的指令主要影响Nginx服务器与用户的网络连接,常用的设置包括:是否开启对多 work process下的网络连接进行序列化,是否允许同时接收多个网络连接,选取哪种事件驱动模型来处理连接请求,每个 work process 可以同时支持的最大连接数等
上述例子就表示每个 work process 支持的最大连接数为 1024。这部分的配置对Nginx的性能影响较大,在实际中应该灵活配置。
第三部分:http 块
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name localhost;
location / {
root html;
index index.html index.htm;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
这部分是 Nginx
服务器配置中最频繁的部分,代理、缓存和日志定义等绝大多数功能和第三方模块的配置都在这里。需要注意的是:http
块也可以包括 http
全局块、server
块。下面的反向代理、动静分离、负载均衡都是在这部分中配置
- http 全局块:
http
全局块配置的指令包括:文件引入、MIME-TYPE
定义、日志自定义、连接超时时间、单链接请求数上限等。 - server 块:这块和虚拟主机有密切关系,从用户角度看,虚拟主机和一台独立的硬件主机是完全一样的,该技术的产生是为了节省互联网服务器硬件成本。
每个http
块可以包括多个server
块,而每个server
块就相当于一个虚拟主机。而每个server
块也分为全局server
块,以及可以同时包含多个locaton
块。
全局 server 块
最常见的配置是本虚拟机主机的监听配置和本虚拟主机的名称或`IP`配置。
location 块
一个 server 块可以配置多个 location 块。
这块的主要作用是:基于 Nginx 服务器接收到的请求字符串(例如 server_name/uri-string),对虚拟主机名称(也可以是 IP 别名)之外的字符串(例如 前面的 /uri-string)进行匹配,对特定的请求进行处理。地址定向、数据缓存和应答控制等功能,还有许多第三方模块的配置也在这里进行。
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name localhost;
# 若请求路径像这样:www.xxxx/img/example.png
# 则访问/img/目录下的文件时,nginx会去/var/www/image/img/目录下找文件
location /img/ {
root /var/www/image;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
反向代理如何配置
反向代理实例一
实现效果:使用 Nginx
反向代理,访问www.123.com
直接跳转到127.0.0.1:8080
注意:此处如果要想从www.123.com
跳转到本机指定的ip
,需要修改本机的hosts
文件。此处略过
配置代码:
server {
listen 80;
server_name 192.168.17.129;
location / {
root html;
index index.html index.htm;
proxy_pass http://127.0.0.1:8080
}
}
如上配置,Nginx
监听 80
端口,访问域名为www.123.com
(不加端口号时默认为 80
端口),故访问该域名时会跳转到 127.0.0.1:8080
路径上。
此处的意思为:nginx 反向代理服务监听 192.168.17.129的80端口,如果有请求过来,则转到proxy_pass配置的对应服务器上,仅此而已。
在location下,同时配置root和proxy_pass选项时,两个选项只会二选一执行
此处不能配置https反向代理
反向代理实例二
实现效果:使用 Nginx 反向代理,根据访问的路径跳转到不同端口的服务中,Nginx 监听端口为 9001
访问http://192.168.17.129/edu/直接跳转到 127.0.0.1:8080
访问http://192.168.17.129/vod/直接跳转到 127.0.0.1:8081
第一步,需要准备两个 tomcat,一个 8080 端口,一个 8081 端口,并准备好测试的页面
第二步,修改 nginx 的配置文件,在 http 块中配置 server
server {
listen 9001;
server_name 192.168.17.129;
location ~ /edu/ {
proxy_pass http://127.0.0.1:8080
}
location ~ /vod/ {
proxy_pass http://127.0.0.1:8081
}
}
根据上面的配置,当请求到达 Nginx 反向代理服务器时,会根据请求路径不同进行分发到不同的服务上
实验结果:
补充:location 指令说明
该指令用于匹配 URL
, 语法如下
location [ = | ~ | ~* | ^~] uri {
}
- = :用于不含正则表达式的 uri 前,要求请求字符串与 uri 严格匹配,如果匹配成功,就停止继续向下搜索并立即处理该请求
- ~:用于表示 uri 包含正则表达式,并且区分大小写
- ~*:用于表示 uri 包含正则表达式,并且不区分大小写
- ^~:用于不含正则表达式的 uri 前,要求 Nginx 服务器找到标识 uri 和请求。字符串匹配度最高的 location 后,立即使用此 location 处理请求,而不再使用 location块中的正则 uri 和请求字符串做匹配。
注意:如果 uri 包含正则表达式,则必须要有 ~ 或者 ~* 标识
Nginx反向代理场景实践
环境准备:
主机名 | 内网IP | 外网IP | 环境 |
---|---|---|---|
lb01 | 172.16.1.5 | 10.0.0.5 | nginx |
web01 | 172.16.1.7 | 10.0.0.7 | nginx |
web01部署:
#配置需求
web01服务器,配置一个网站,监听在8080此时网站仅172网段的用户能访问
[root@web01 ~]# vim /etc/nginx/conf.d/web.conf
server {
listen 8080;
server_name localhost;
location / {
root /code_8080;
index index.html;
deny 10.0.0.0/24;
allow all;
}
}
[root@web01 conf.d]# mkdir /code_8080
[root@web01 conf.d]# echo "hellojiujiu" >/code_8080/index.html
[root@web01 conf.d]# systemctl restart nginx
lb01部署:
[root@lb01 ~]# cd /etc/nginx/conf.d/
[root@lb01 conf.d]# cat proxy_web_node1.conf
server {
listen 80;
server_name nginx.dl.com;
location / {
proxy_pass http://172.16.1.7:8080;
}
}
[root@lb01 conf.d]# systemctl enable nginx
[root@lb01 conf.d]# systemctl start nginx
#本地域名解析
10.0.0.5 nginx.dl.com
#浏览器访问,出现web01内容即可
Nginx常用优化配置详解
1. `proxy_set_header Host $http_host;`
#该指令设置传递给后端服务器的请求头中的Host字段。$http_host变量是从客户端请求中自动提取的主机名部分。
2. `proxy_set_header X-Real-IP $remote_addr;`
#该指令设置传递给后端服务器的请求头中的X-Real-IP字段。$remote_addr变量由客户端IP地址填充,但在存在代理服务器的情况下可能不一定准确,此时通过此指令设置的X-Real-IP字段可以传递客户端的真实IP地址。
3. `proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;`
#该指令设置传递给后端服务器的请求头中的X-Forwarded-For字段。类似于上面的X-Real-IP字段,该字段也允许将请求发送者的IP地址传递给后端服务器,但此处使用的是$proxy_add_x_forwarded_for变量,它将前面发送者的IP地址附加到现有的X-Forwarded-For头中。
4. `proxy_connect_timeout 30;`
#该指令设置连接到后端服务器的超时时间。如果nginx在这个时间内无法与后端服务器建立连接,代理请求将被中止。
5. `proxy_send_timeout 60;`
#该指令设置向后端服务器发送数据的超时时间。如果nginx在这个时间内无法将所有报文发送到后端服务器,则请求将被中止。
6. `proxy_read_timeout 60;`
#该指令设置从后端服务器读取数据的超时时间。如果nginx在这个时间内没有读取到所有数据,则请求将被中止。
7. `proxy_buffering on;`
#该指令设置代理服务器是否缓冲响应。当设置为“on”时,响应将被缓冲,否则将不被缓冲。
8. `proxy_buffer_size 32k;`
#该指令设置单个缓冲区的大小。这个数字越大,代理服务器可以缓冲更多数据,但是设置一个过大的缓冲区可能会导致服务器内存使用过多。
9. `proxy_buffers 4 128k;`
#该指令设置Nginx代理服务器应该分配多少个缓冲区、以及每个缓冲区的大小,这里设置了4个缓冲区,每个缓冲区的大小为128k。这个参数和上面的`proxy_buffer_size`都关系到Nginx代理服务器缓存响应数据时所用的缓冲区。