一、简介 | 牛初九博客

# 一、简介

上一篇文章我们介绍了nginx的基础应用，其中讲到了nginx作为代理服务器的使用，但是漏了一个重要的，也是使用非常普遍的特性——负载均衡。今天，我们将这段内容补上。

通过多个实例进行负载均衡是一个比较常用的技术，它用来是资源利用最大化、提高通过率、降低延迟响应、确保容灾等。

# 二、负载均衡的方法

轮询——应用服务器间的请求按照轮询的方式分配；
最小连接数——下一个请求将会分配给当前连接数最小的服务器；
ip哈希——以一种哈希的方式决定下一个请求分配到哪个服务器上（基于客户端的ip进行哈希）。

# 三、默认的负载均衡配置

nginx最简单的负载均衡配置如下：

http {
    upstream myapp1 {
        server srv1.example.com;
        server srv2.example.com;
        server srv3.example.com;
    }

    server {
        listen 80;

        location / {
            proxy_pass http://myapp1;
        }
    }
}

上面的例子中，有3个相同的实例运行在srv1-srv3上。当负载均衡的方法没有特别指定时，它将默认使用轮询的方式。所有的请求都会被代理到服务组myapp1上，nginx将应用HTTP的负载均衡分配请求。

nginx的反向代理实现包含负载均衡的种类：HTTP、HTTPS、FastCGI、uwsgi、SCGI和缓存等。

如果要用HTTPS的负载均衡，只需要使用HTTPS的协议即可。

当为FastCGI、uwsgi、SCGI和缓存设置负载均衡时，使用相应的fastcgi_pass、uwsgi_pass、scgi_pass和memcached_pass的指令集即可，这里不做详细介绍。

# 四、最小连接负载均衡

另外一个负载连接方式是最小连接。最小连接的方式可以使应用实例间的负载更公平，例如在一些请求需要花费更长时间去完成的情况。

使用最小连接的方式，nginx不会将过多的请求分配到一个比较忙的应用服务上，它将把请求分配到相对不忙的应用服务上。

最小连接的负载均衡方式在nginx中的配置如下，它作为服务组中的一个配置出现：

upstream myapp1 {
        least_conn;
        server srv1.example.com;
        server srv2.example.com;
        server srv3.example.com;
    }

# 五、会话保持的方式

在介绍这种方式之前，大家先记住，使用轮询和最小连接的负载均衡方式，同一客户端的下一个请求有可能分配到不同的应用服务上。这两种方式不能保证同一客户端的请求总是分配到同一个服务上。

如果需要将一个客户端绑定到一个特殊的应用服务上，换句话说，使客户端的会话“粘连”或“保持”，就要使用“ip-hash”的负载均衡机制了。

使用ip-hash，客户端的ip用来做哈希的key，决定着选择服务组中的哪个应用服务这个客户端的请求。这种方法决定了相同客户端的请求总是分配给相同的服务，除非这个服务不可用了。

配置ip-hash的负载均衡，只需要将ip-hash指令添加到服务组（upstream）中，如下：

upstream myapp1 {
    ip_hash;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

# 六、负载均衡的权重

通过使用服务权重，可以进一步影响负载均衡的逻辑。上面的例子中，没有配置权重的意思是，所有指定的服务将被看做有相同的权重。

采用轮询的方式，如果有足够的请求，并且请求通过统一的方式处理并且快速的完成的情况下，它仍然意味着在服务之间或多或少的公平的分配。

当weight参数为一个服务指定时，它将是负载均衡过程中的一部分。

upstream myapp1 {
        server srv1.example.com weight=3;
        server srv2.example.com;
        server srv3.example.com;
    }

上面的配置中，每5个应用请求将分配如下：3个请求分配个srv1，1个请求分配给srv2，另一个请求分配给srv3。在nginx最近的版本中，在最小连接和ip-hash的负载均衡方式中使用权重（weight）也是有可能的。

# 七、健康检查

nginx的反向代理包括带内（或被动）的健康检查。如果一个服务的响应是失败的，nginx将会标记这个服务是失败的，并且在短暂的时间内，避免为下一个请求选择这个服务。

max_fails指令设置是，在fail_timeout时间内，尝试和这台服务连续通信失败的次数。默认情况下，max_fails设置为1，当设置为0时，这个服务的健康检查将失效。fail_timeout参数定义了这个服务多长时间会被标记为失效，在服务失败的fail_timeout间隔后，nginx使用活的客户端请求优雅的探测服务，如果探测成功了，这个服务将会标记为成功的。

至此，nginx用的最多的，也是最常用的部分——负载均衡讲完了，欢迎大家拍砖~~

← Nginx简介（一） String是值传递还是引用传递 →