Docker Swarm概念与基本用法

Docker Swarm是Docker公司开发的容器集群管理服务。 从1.12.0版本开始,已经是Docker安装后自带的一部分(捆绑软件)了,又称为Swarm Mode,无需额外安装。

与Kubernetes相比,Docker Swarm是一个简单的软件,似乎不堪大用。 但是它与docker-compose兼容的优点,可以弥补一切。 对于没有集群使用经验的小白,用Docker Swarm起步,是一个很好的选择。

概念

Docker Swarm,主要包含以下概念:

Swarm本身就是“群”的意思,人群、蜂群。 这里就是指计算机集群(cluster)在用Docker连接后的状态。 docker swarm命令可以创建、加入、离开一个集群。

Node就是计算机节点,也可以认为是一个Docker节点。 Node分为两类:Manager和Worker。 一个Swarm至少要有一个Manager,部分管理命令只有在Manager上才能使用。 两类Node都可以运行Service,但只有Manager上才能执行运行命令。 比如,在Manager才能使用docker node命令可以查看、配置、删除Node。

Stack是一组Service,和docker-compose类似。 默认情况下,一个Stack共用一个Network,相互可访问,与其它Stack网络隔绝。 这个概念只是为了编排的方便。 docker stack命令可以方便地操作一个Stack,而不用一个一个地操作Service。

Service是一类容器。 对用户来说,Service就是与Swarm交互的最核心内容。 Service有两种运行模式,一是replicated,指定一个Service运行容器的数量; 二是global,在所有符合运行条件的Node上,都运行一个这类容器。 docker service命令可以操作Swarm中的Service。

Task就是指运行一个容器的任务,是Swarm执行命令的最小单元。 要成功运行一个Service,需要执行一个或多个Task(取决于一个Service的容器数量),确保每一个容器都顺利启动。 通常用户操作的是Service,而非Task。

Load balancing即负载均衡,也包含反向代理。 Swarm使用的是Ingress形式的负载均衡,即访问每个节点的某个Published端口,都可自动代理到真正的服务。 大致原理如下图所示。

ingress network

Replicated Mode

services:
  some-serivce:
    ...
    deploy:
      mode: replicated
      replicas: 3

默认情况下,mode就是replicated,所以这行可以省略。 默认replicas数目为1,代表这个Service只启动1个容器。 这个模式,可以按需启动多个服务,Swarm会自动调节,有时一个Node会启动多个容器。

Global Mode

services:
  some-serivce:
    ...
    deploy:
      mode: global
      placement:
        ...

所有可部署的Node,都部署一个。 通过placement,可以限定满足条件的Node,而避免在不合适的Node进行部署。

操作

这里列出一些常用的具体操作。

创建第一个Node

docker swarm init --advertise-addr $IP

$IP是当前Node的外部可访问IP,便于其它Node寻址。

这样,一个Swarm就被初始化完成了,它仅有一个Manager节点。

添加新的Node到Swarm

在Manager节点,执行以下命令可查看到如何加入一个Node:

$ docker swarm join-token manager
To add a manager to this swarm, run the following command:

    docker swarm join --token SWMTKN-1-2zspelk468gb6wgw5adea4wlbw4kfy3q1uhr86zpafl9m5a3ho-ezs4fylj526e801b3cl0pojr5 10.174.28.52:2377

$ docker swarm join-token worker
To add a worker to this swarm, run the following command:

    docker swarm join --token SWMTKN-1-2zspelk468gb6wgw5adea4wlbw4kfy3q1uhr86zpafl9m5a3ho-164iqklrfv8o3t55g088hylyk 10.174.28.52:2377

在一个未加入任何Swarm的机器上,执行以上显示的命令docker swarm join --token ..., 即可成为这个Swarm的Manage或Worker节点。

设置节点Label

在Manager节点,可以对任意节点设置标签:

docker node update $node_name --label-add main=true

$node_name就是要设置节点的ID或HOSTNAME。 Label是键值对形式,main=true中的main就是键、true就是值。

设置了Label以后,在Compose文件中就可以用placement中的constraints来对可用节点作出限制。

services:
  some-serivce:
    ...
    deploy:
      placement:
        constraints:
          - node.labels.main == true
      ...

以上配置,让some-service仅在Label被设置为main=true的节点,才能使用。

启动、停止服务

docker stack deploy $stack_name -c docker-compose.yaml -c other.yaml ...

$stack_name是Stack名称。 可以用-c指定多个docker-compose文件,也可在相同Stack下分批次deploy多个文件。 这些YAML文件的写法,和原先用docker-compose命令执行的没有本质区别,只是多加了以下独特配置,并且会忽略一些Swarm场景下不支持的配置。

推荐使用docker-compose文件来编排Stack,而非直接用docker service create来手工创建。 详细配置项,可参考《Compose file version 3 reference | Docker Documentation》。

需要停止Stack的所有服务时,可以执行以下命令。

docker stack rm $stack_name

更新已运行服务的镜像

docker service update --image $image:$tag $service_name

参考


相关笔记