Week 03: 变量优先级与 Jinja2 渲染引擎

深入剖析 Ansible 的 22 层变量覆盖逻辑, 掌握 Jinja2 引擎的高级动态生成能力.

1. 变量优先级 (Precedence Logic)

Ansible 的变量可以在全量、分组、主机、角色、Playbook 等多处定义. 理解 "谁覆盖谁" 是解决复杂故障的核心.

1.1 22 层优先级深度解析

Ansible 的变量覆盖逻辑非常复杂, 共有 22 层. 在冲突时, 编号大的覆盖编号小的. 以下是简化后的关键路径:

优先级	变量来源 (由低到高)	说明
1	role defaults	角色默认值, 最易被覆盖
2-5	inventory group_vars / host_vars	清单定义的全局/组/主机变量
6-10	playbook group_vars / host_vars	Playbook 目录下的变量
11	host facts / registered vars	系统发现的事实 or 任务结果注册
12-14	playbook vars / vars_files	Play 级别定义的静态变量
15	role vars	角色内部定义的变量 (不同于 defaults)
16	include_vars	任务中通过模块动态加载的变量
17	set_fact	运行时动态创建的主机变量
18	extra vars (`-e`)	命令行强制指定, 绝对最高级

核心提示: 永远不要试图记住所有 22 层. 生产中只需遵循: 默认值放 Role, 环境差异放 Inventory, 临时覆盖用 -e.

1.2 作用域 (Scopes)

Host: 与特定主机绑定的变量 (如 Facts).

1.3 变量合并行为 (Merging Behavior)

在默认配置下, 当同一变量名在不同层级定义时, Ansible 采用 "替换 (Replace)" 策略.

1.3.1 Replace vs Merge

Replace (默认): 高优先级的变量会完全替换掉低优先级的变量. 如果变量是字典 (Dictionary), 低优先级字典中的 Key 将全部丢失.
Merge: 高优先级的字典会与低优先级的字典进行递归合并.

示例:

# group_vars/all.yml
user_profile:
  name: admin
  shell: /bin/bash

# host_vars/web01.yml
user_profile:
  shell: /bin/zsh

默认行为 (Replace): user_profile 变为 {'shell': '/bin/zsh'} ( name 丢失).
开启 Merge: user_profile 变为 {'name': 'admin', 'shell': '/bin/zsh'}.

底层建议: 虽然 ansible.cfg 中可以设置 hash_behaviour=merge, 但 强烈建议保持默认的 replace. merge 会导致自动化逻辑难以通过静态代码追踪, 增加调试负担. 推荐通过分层定义不同的 Key (如 user_profile_default 和 user_profile_override) 并在模板中手动合并.

2. 变量分类与生成方式

变量不仅仅是简单的 key: value, Ansible 提供了多种机制来生成、发现和管理数据. 理解这些机制的执行时机、作用域和性能影响是运维自动化的基础.

2.1 自定义变量 (Custom Variables)

自定义变量是运维人员直接控制的数据源, 根据定义位置和加载时机分为多种类型.

2.1.1 静态定义 (Static Variables)

最常见的变量定义方式, 在 Play 或角色中直接声明:

# Play 级别变量
- hosts: web_servers
  vars:
    http_port: 80
    app_env: production
  tasks:
    - debug:
        msg: "Port: {{ http_port }}, Env: {{ app_env }}"

文件引用模式:

当变量数量较多时, 使用 vars_files 实现关注点分离:

- hosts: all
  vars_files:
    - vars/common.yml
    - vars/{{ ansible_facts['os_family'] }}.yml  # 动态路径
  tasks:
    - debug: var=app_version

原理要点: vars_files 在 Play 初始化阶段被解析, 这意味着你可以在路径中使用 Facts, 但无法使用 register 注册的运行时变量.

2.1.2 注册变量 (Register Variables)

注册变量捕获任务执行的输出, 是实现条件逻辑和故障处理的核心机制.

基础结构:

- name: Check if service exists
  command: systemctl status nginx
  register: nginx_status
  ignore_errors: yes

- name: Display full register output
  debug:
    var: nginx_status

输出示例:

{
    "changed": false,
    "cmd": ["systemctl", "status", "nginx"],
    "rc": 0,
    "stdout": "● nginx.service - A high performance web server",
    "stderr": "",
    "stdout_lines": ["● nginx.service - A high performance web server"],
    "failed": false
}

关键字段解析:

字段	说明	典型用途
`rc`	返回码 (Return Code)	判断命令是否成功 (`rc == 0`)
`stdout`	标准输出 (字符串)	提取命令输出内容
`stdout_lines`	标准输出 (列表)	按行遍历输出
`stderr`	标准错误输出	诊断失败原因
`changed`	是否产生变更	幂等性判断
`failed`	是否失败	与 `ignore_errors` 配合使用

高级应用 - 条件执行:

- name: Detect if database is initialized
  stat:
    path: /var/lib/mysql/ibdata1
  register: mysql_data

- name: Initialize database (only if not exists)
  command: mysql_install_db
  when: not mysql_data.stat.exists

- name: Get disk usage
  shell: df -h / | tail -1 | awk '{print $5}' | sed 's/%//'
  register: disk_usage

- name: Trigger cleanup if disk > 80%
  include_tasks: cleanup.yml
  when: disk_usage.stdout | int > 80

性能考量: 注册变量会将整个输出存储在内存中. 对于产生大量输出的命令 (如日志导出), 建议使用 changed_when: false 和 no_log: true 减少内存占用.

2.1.3 运行时动态加载 (`include_vars`)

include_vars 模块允许在任务执行期间根据条件加载特定的变量文件, 实现高度灵活的配置管理.

基础用法:

- name: Load environment-specific variables
  include_vars:
    file: "vars/{{ env_type }}.yml"
  when: env_type is defined

目录批量加载:

- name: Load all YAML files from directory
  include_vars:
    dir: vars/components
    extensions:
      - yml
      - yaml
    ignore_files:
      - secrets.yml  # 排除敏感文件

条件过滤 - 基于主机特征:

- name: Load OS-specific package lists
  include_vars: "{{ item }}"
  with_first_found:
    - "vars/packages_{{ ansible_facts['distribution'] }}_{{ ansible_facts['distribution_major_version'] }}.yml"
    - "vars/packages_{{ ansible_facts['os_family'] }}.yml"
    - "vars/packages_default.yml"

原理深度: include_vars 是一个任务 (Task), 而不是指令 (Directive). 这意味着:

它在任务执行时才加载变量, 而非 Play 初始化阶段
可以使用 register 变量和 Facts 构造动态路径
支持条件判断 (when), 可以跳过不必要的加载

2.1.4 运行时事实设定 (`set_fact`)

set_fact 用于在 Play 执行期间动态计算和设置变量, 常用于复杂逻辑处理.

基础用法:

- name: Calculate derived values
  set_fact:
    total_memory_mb: "{{ ansible_facts['memtotal_mb'] }}"
    available_memory_mb: "{{ ansible_facts['memfree_mb'] + ansible_facts['mem_buffers'] + ansible_facts['cached'] }}"
    memory_usage_percent: "{{ ((ansible_facts['memtotal_mb'] - ansible_facts['memfree_mb']) / ansible_facts['memtotal_mb'] * 100) | int }}"

复杂数据结构构造:

- name: Build cluster node map
  set_fact:
    cluster_map: |
      {% set result = {} %}
      {% for host in groups['cluster'] %}
      {%   set _ = result.update({
             host: {
               'ip': hostvars[host]['ansible_facts']['default_ipv4']['address'],
               'role': hostvars[host].get('node_role', 'worker')
             }
           }) %}
      {% endfor %}
      {{ result }}

- debug:
    var: cluster_map

缓存与持久化: set_fact 设置的变量仅在当前 Play 生命周期内有效. 如果需要跨 Play 持久化, 需要使用 cacheable: yes 参数 (需要配置 Fact Cache 后端如 Redis/Memcached).

2.2 系统观测: Ansible Facts

Facts 是 Ansible 通过 setup 模块自动收集的远程主机系统信息. 理解 Facts 的收集机制和数据结构对于编写健壮的 Playbook 至关重要.

2.2.1 Facts 收集机制

默认行为: 每个 Play 开始时, Ansible 会隐式执行 setup 模块收集 Facts:

# 等效于在每个 Play 开始时自动执行:
- name: Gathering Facts
  setup:

禁用方式 (提升性能):

- hosts: all
  gather_facts: no  # 跳过自动收集
  tasks:
    - name: Manually gather facts if needed
      setup:
      when: some_condition

子集收集 (减少网络开销):

- hosts: all
  gather_facts: yes
  gather_subset:
    - '!all'  # 排除所有
    - '!min'  # 排除最小集
    - network  # 仅收集网络信息
    - virtual  # 仅收集虚拟化信息

完整子集列表:

hardware: CPU, 内存, 磁盘
network: 网卡, IP, 路由
virtual: 虚拟化类型 (KVM, VMware, Docker)
ohai: Chef Ohai 兼容数据 (如果安装)
facter: Puppet Facter 兼容数据 (如果安装)

2.2.2 Facts 数据结构

新旧命名空间:

Ansible 2.5+ 引入了新的 ansible_facts 命名空间, 将所有 Facts 归集到一个字典中:

# 旧式访问 (仍然支持, 但不推荐)
{{ ansible_eth0.ipv4.address }}
{{ ansible_hostname }}

# 新式访问 (推荐)
{{ ansible_facts['eth0']['ipv4']['address'] }}
{{ ansible_facts['hostname'] }}

推荐使用新式的原因:

避免与用户自定义变量冲突 (旧式会占用全局命名空间)
显式表明数据来源是 Facts 而非自定义变量
在 gather_facts: no 时不会抛出未定义错误 (可配合 default 过滤器)

常用 Facts 清单:

# 系统识别
ansible_facts['distribution']           # CentOS, Ubuntu, Debian
ansible_facts['distribution_version']   # 7.9, 20.04, 10
ansible_facts['os_family']              # RedHat, Debian, Suse
ansible_facts['kernel']                 # 5.4.0-42-generic

# 硬件信息
ansible_facts['processor_cores']        # CPU 核心数
ansible_facts['memtotal_mb']            # 总内存 (MB)
ansible_facts['devices']                # 磁盘设备字典
ansible_facts['mounts']                 # 挂载点列表

# 网络信息
ansible_facts['default_ipv4']['address']    # 主 IP
ansible_facts['default_ipv4']['interface']  # 主网卡名
ansible_facts['all_ipv4_addresses']         # 所有 IPv4 列表
ansible_facts['interfaces']                 # 所有网卡名称列表

# 虚拟化
ansible_facts['virtualization_type']    # kvm, vmware, docker, lxc
ansible_facts['virtualization_role']    # guest, host

实战案例 - 自适应软件包安装:

- name: Install web server based on OS
  package:
    name: |
      {% if ansible_facts['os_family'] == 'Debian' %}
      apache2
      {% elif ansible_facts['os_family'] == 'RedHat' %}
      httpd
      {% endif %}
    state: present

2.2.3 自定义 Facts

除了系统 Facts, 可以在远程主机上部署自定义 Facts 脚本, 用于暴露应用级别的元数据.

部署位置: /etc/ansible/facts.d/*.fact

格式要求: JSON 或 INI 格式, 文件必须可执行

JSON 格式示例 (/etc/ansible/facts.d/app_info.fact):

#!/bin/bash
cat << EOF
{
  "version": "2.1.4",
  "build_date": "2024-01-15",
  "environment": "production"
}
EOF

INI 格式示例 (/etc/ansible/facts.d/database.fact):

[main]
engine=postgresql
version=14.2
port=5432

[replication]
enabled=true
role=master

访问方式:

- debug:
    msg: |
      App Version: {{ ansible_facts['ansible_local']['app_info']['version'] }}
      DB Engine: {{ ansible_facts['ansible_local']['database']['main']['engine'] }}

应用场景:

应用版本检测 (避免重复部署)
数据库主从角色判定
许可证信息查询
业务标签管理 (如 IDC 机房位置, 业务线归属)

2.3 魔法变量 (Magic Variables)

魔法变量是 Ansible 运行时自动提供的元数据, 用于实现跨主机数据共享和环境感知.

2.3.1 `hostvars` - 全局主机变量字典

hostvars 是一个包含所有主机变量的全局字典, 允许在任意主机的任务中访问其他主机的数据.

数据结构:

hostvars = {
    'web01': {
        'ansible_facts': {...},
        'custom_var': 'value',
        ...
    },
    'db01': {
        'ansible_facts': {...},
        ...
    }
}

典型用例 - 获取后端数据库 IP:

# 在 web 服务器上配置应用连接字符串
- hosts: web_servers
  tasks:
    - name: Configure app database connection
      template:
        src: app_config.j2
        dest: /etc/app/config.ini

模板内容 (app_config.j2):

[database]
host = {{ hostvars['db_primary']['ansible_facts']['default_ipv4']['address'] }}
port = {{ hostvars['db_primary']['db_port'] | default(5432) }}

高级应用 - 动态服务发现:

# 生成所有 web 服务器的 IP 列表
- set_fact:
    web_backends: |
      {% set ips = [] %}
      {% for host in groups['web_servers'] %}
      {%   if hostvars[host]['ansible_facts'] is defined %}
      {%     set _ = ips.append(hostvars[host]['ansible_facts']['default_ipv4']['address']) %}
      {%   endif %}
      {% endfor %}
      {{ ips }}

性能陷阱: hostvars 访问会触发该主机的 Facts 收集 (如果尚未收集). 在大规模环境 (1000+ 主机) 中, 应避免在循环中频繁访问 hostvars[host]['ansible_facts'].

2.3.2 `groups` 和 `group_names`

groups: Inventory 中所有组的字典, 值为主机名列表

group_names: 当前主机所属的组名列表

实战案例 - HAProxy 后端配置:

# templates/haproxy.cfg.j2
backend web_cluster
    balance roundrobin
    {% for host in groups['web_servers'] %}
    server {{ host }} {{ hostvars[host]['ansible_facts']['default_ipv4']['address'] }}:80 check
    {% endfor %}

backend api_cluster
    balance leastconn
    {% for host in groups['api_servers'] %}
    server {{ host }} {{ hostvars[host]['ansible_facts']['default_ipv4']['address'] }}:8080 check
    {% endfor %}

条件执行 - 基于组成员身份:

- name: Install monitoring agent only on production
  package:
    name: datadog-agent
    state: present
  when: "'production' in group_names"

- name: Configure firewall for database servers
  firewalld:
    port: 5432/tcp
    permanent: yes
    state: enabled
  when: "'database_servers' in group_names"

高级技巧 - 跨组数据聚合:

- name: Generate complete service mesh map
  set_fact:
    service_mesh: |
      {% set mesh = {} %}
      {% for group in groups.keys() %}
      {%   if group not in ['all', 'ungrouped'] %}
      {%     set hosts = [] %}
      {%     for host in groups[group] %}
      {%       set _ = hosts.append({
                 'name': host,
                 'ip': hostvars[host]['ansible_facts']['default_ipv4']['address']
               }) %}
      {%     endfor %}
      {%     set _ = mesh.update({group: hosts}) %}
      {%   endif %}
      {% endfor %}
      {{ mesh | to_nice_json }}

2.3.3 `inventory_hostname` vs `ansible_hostname`

核心区别:

变量	来源	值示例	用途
`inventory_hostname`	Inventory 文件	`web01.prod`	Ansible 内部识别符
`ansible_facts['hostname']`	远程主机 Facts	`web01`	实际主机名 (hostname 命令输出)
`ansible_facts['fqdn']`	远程主机 Facts	`web01.example.com`	完全限定域名

典型场景 - Inventory 使用 IP:

# inventory
[web]
192.168.1.10  hostname=web01
192.168.1.11  hostname=web02

此时:

inventory_hostname = 192.168.1.10
ansible_facts['hostname'] = 远程主机的实际主机名
hostname (自定义变量) = web01

推荐实践: 在模板中引用主机名时, 应明确需求:

配置文件需要稳定标识符: 使用 inventory_hostname
日志输出需要可读名称: 使用 hostname 变量或 ansible_facts['hostname']

2.4 外部数据源: Lookup 插件

Lookup 插件允许 Ansible 从控制节点的文件系统、环境变量、外部 API 甚至数据库中检索数据, 是实现配置集中管理的关键机制.

2.4.1 核心概念

执行位置: Lookup 始终在控制节点执行, 而非远程主机

执行时机: 在 Jinja2 模板渲染阶段执行, 早于任务执行

返回值: 默认返回字符串或列表

2.4.2 文件系统 Lookup

file - 读取文本文件:

- name: Deploy SSH public key
  authorized_key:
    user: deploy
    key: "{{ lookup('file', '~/.ssh/id_rsa.pub') }}"

- name: Inject CA certificate
  copy:
    content: "{{ lookup('file', '/etc/ssl/certs/ca-bundle.crt') }}"
    dest: /usr/local/share/ca-certificates/internal-ca.crt

fileglob - 批量文件匹配:

- name: Deploy all configuration snippets
  copy:
    src: "{{ item }}"
    dest: "/etc/app/conf.d/{{ item | basename }}"
  loop: "{{ lookup('fileglob', 'config-snippets/*.conf', wantlist=True) }}"

template - 在控制节点渲染模板:

- name: Generate complex config and store as variable
  set_fact:
    nginx_config: "{{ lookup('template', 'nginx.conf.j2') }}"

- name: Deploy pre-rendered config
  copy:
    content: "{{ nginx_config }}"
    dest: /etc/nginx/nginx.conf

2.4.3 环境与Shell Lookup

env - 读取环境变量:

- name: Use secret from environment
  uri:
    url: https://api.example.com/deploy
    headers:
      Authorization: "Bearer {{ lookup('env', 'API_TOKEN') }}"
    method: POST

- name: Get current user
  debug:
    msg: "Running as {{ lookup('env', 'USER') }}"

pipe - 执行 Shell 命令:

- name: Get Git commit hash
  set_fact:
    git_commit: "{{ lookup('pipe', 'git rev-parse --short HEAD') }}"

- name: Generate unique deployment ID
  set_fact:
    deploy_id: "{{ lookup('pipe', 'date +%Y%m%d%H%M%S') }}_{{ lookup('pipe', 'uuidgen | cut -d- -f1') }}"

- name: Tag deployed artifact
  copy:
    src: app.jar
    dest: "/opt/releases/app_{{ git_commit }}.jar"

2.4.4 KV 存储与密码管理

password - 生成和存储随机密码:

# 首次运行生成密码, 后续运行读取相同密码
- name: Ensure database password exists
  set_fact:
    db_password: "{{ lookup('password', '/dev/null length=32 chars=ascii_letters,digits') }}"

# 持久化到文件
- name: Generate and persist MySQL root password
  set_fact:
    mysql_root_password: "{{ lookup('password', 'credentials/mysql_root_pass length=20') }}"

ini - 解析 INI 文件:

- name: Read from app.ini
  debug:
    msg: "DB Host: {{ lookup('ini', 'host section=database file=app.ini') }}"

csvfile - 查询 CSV 数据:

# servers.csv:
# hostname,ip,role
# web01,192.168.1.10,frontend
# db01,192.168.1.20,database

- name: Get IP for web01
  debug:
    msg: "{{ lookup('csvfile', 'web01 file=servers.csv delimiter=, col=1') }}"
  # 输出: 192.168.1.10

2.4.5 高级 Lookup - URL 与 API

url - HTTP/HTTPS 请求:

- name: Fetch external configuration
  set_fact:
    external_config: "{{ lookup('url', 'https://config-server/api/app/prod') }}"

- name: Get public IP from service
  debug:
    msg: "Public IP: {{ lookup('url', 'https://ifconfig.me/ip') }}"

dig - DNS 查询:

- name: Resolve load balancer IP
  set_fact:
    lb_ip: "{{ lookup('dig', 'lb.example.com') }}"

- name: Get all A records
  debug:
    var: lookup('dig', 'example.com', 'qtype=A', wantlist=True)

2.4.6 性能优化与错误处理

默认值处理:

# 如果环境变量不存在, 使用默认值
- set_fact:
    api_key: "{{ lookup('env', 'API_KEY') | default('default-key-for-dev', true) }}"

错误忽略:

# 如果文件不存在, 返回空字符串而非失败
- set_fact:
    optional_config: "{{ lookup('file', '/etc/optional.conf', errors='ignore') | default('') }}"

缓存控制:

# 强制重新查询 (跳过缓存)
- debug:
    msg: "{{ lookup('pipe', 'date', cache=False) }}"

2.5 综合实战案例

场景: 多环境微服务部署系统

- name: Deploy microservice with dynamic configuration
  hosts: app_servers
  vars:
    # Lookup: 从 Git 获取版本信息
    git_branch: "{{ lookup('pipe', 'git rev-parse --abbrev-ref HEAD') }}"
    git_commit_short: "{{ lookup('pipe', 'git rev-parse --short HEAD') }}"
    
    # Lookup: 从环境变量获取敏感信息
    docker_registry_token: "{{ lookup('env', 'DOCKER_REGISTRY_TOKEN') }}"
    deployment_env: "{{ lookup('env', 'DEPLOY_ENV') | default('staging', true) }}"
    
    # Lookup: 从外部 API 获取配置
    service_discovery: "{{ lookup('url', 'https://consul.internal/v1/catalog/services') }}"
    
  tasks:
    - name: Load environment-specific variables
      include_vars:
        file: "vars/{{ deployment_env }}.yml"
    
    - name: Check current application version
      shell: cat /opt/app/version.txt 2>/dev/null || echo 'none'
      register: current_version
      changed_when: false
    
    - name: Determine if deployment needed
      set_fact:
        should_deploy: "{{ current_version.stdout != git_commit_short }}"
        deployment_timestamp: "{{ lookup('pipe', 'date +%s') }}"
    
    - name: Build service mesh configuration
      set_fact:
        service_endpoints: |
          {% set endpoints = {} %}
          {% for svc_type in ['api', 'worker', 'cache'] %}
          {%   set hosts = [] %}
          {%   for host in groups[svc_type + '_servers'] | default([]) %}
          {%     if hostvars[host]['ansible_facts'] is defined %}
          {%       set host_info = {
                     'hostname': host,
                     'ip': hostvars[host]['ansible_facts']['default_ipv4']['address'],
                     'cpu_cores': hostvars[host]['ansible_facts']['processor_cores'],
                     'healthy': hostvars[host].get('health_check_passed', true)
                   } %}
          {%       if host_info.healthy %}
          {%         set _ = hosts.append(host_info) %}
          {%       endif %}
          {%     endif %}
          {%   endfor %}
          {%   set _ = endpoints.update({svc_type: hosts}) %}
          {% endfor %}
          {{ endpoints }}
    
    - name: Deploy application configuration
      template:
        src: app-config.json.j2
        dest: /opt/app/config.json
      when: should_deploy | bool
    
    - name: Tag deployment metadata
      copy:
        content: |
          {
            "version": "{{ git_commit_short }}",
            "branch": "{{ git_branch }}",
            "environment": "{{ deployment_env }}",
            "deployed_at": "{{ deployment_timestamp }}",
            "deployed_by": "{{ lookup('env', 'USER') }}",
            "inventory_group": {{ group_names | to_json }}
          }
        dest: /opt/app/version.txt
      when: should_deploy | bool

配置模板 (app-config.json.j2):

{
  "app": {
    "name": "{{ app_name }}",
    "version": "{{ git_commit_short }}",
    "environment": "{{ deployment_env }}"
  },
  "database": {
    "primary": {
      "host": "{{ hostvars[groups['database_primary'][0]]['ansible_facts']['default_ipv4']['address'] }}",
      "port": {{ db_port | default(5432) }},
      "name": "{{ db_name }}"
    },
    "replicas": [
      {% for host in groups['database_replicas'] | default([]) -%}
      {
        "host": "{{ hostvars[host]['ansible_facts']['default_ipv4']['address'] }}",
        "port": {{ db_port | default(5432) }}
      }{{ ',' if not loop.last else '' }}
      {% endfor %}
    ]
  },
  "service_mesh": {{ service_endpoints | to_nice_json }},
  "feature_flags": {
    "enable_cache": {{ 'redis_servers' in groups }},
    "enable_async_workers": {{ (groups['worker_servers'] | default([]) | length) > 0 }}
  }
}

3. 动态心脏: Jinja2 渲染引擎

Ansible 的核心逻辑不仅仅是 YAML, 更是嵌入其中的 Jinja2 模板引擎. 掌握逻辑控制语句是实现环境自适应配置的关键.

3.1 语法核心: 语句 vs 表达式

{{ ... }} (Expressions): 用于变量渲染和属性访问.
{% ... %} (Statements): 用于执行逻辑控制 (如 if, for).
{# ... #} (Comments): 模板内部注释, 不会被渲染到最终文件中.

3.2 逻辑控制结构

3.2.1 条件判断 (`if / elif / else`)

常用于根据操作系统的不同生成差异化的配置指令.

{% if ansible_facts['os_family'] == "RedHat" %}
# RHEL Specific Config
Listen 80
{% elif ansible_facts['os_family'] == "Debian" %}
# Debian Specific Config
Port 80
{% else %}
# Default
ListenAddress 0.0.0.0:80
{% endif %}

3.2.2 循环迭代 (`for`)

常用于遍历主机组变量或复杂字典. Jinja2 提供了 loop 对象来获取当前的迭代状态 (如 loop.index, loop.first).

# Upstream Servers
{% for host in groups['web_servers'] %}
server {{ hostvars[host]['ansible_facts']['default_ipv4']['address'] }}:80 check;
{% endfor %}

3.3 深度优化: 空白控制 (Whitespace Control)

在 Jinja2 中, 默认情况下, 如果控制语句 (如 {% for %}) 独自占一行, 它在渲染时会留下一个空行. 虽然这对于 HTML 可能无所谓, 但在生成 Nginx 或 HAProxy 这种对格式敏感的配置文件时, 可能会产生大量无意义的空行, 甚至破坏语法结构.

3.3.1 剥离原理

通过在标签中添加 - 符号, 可以手动指示搜索引擎删除与之相邻的空白字符 (包括空格、制表符和换行符):

{%- ... %}: 剥离该标签 左侧 (上方) 的所有空白.
{% ... -%}: 剥离该标签 右侧 (下方) 的所有空白.
{{- ... -}}: 同样适用于变量渲染, 确保变量值与前后内容无缝衔接.

3.3.2 对比演练

场景: 遍历主机组生成列表.

未优化模板:

Host List:
{% for h in groups['web'] %}
  - {{ h }}
{% endfor %}

渲染结果会包含大量空行.

优化后的模板 (紧凑模式):
```
Host List:
{% for h in groups['web'] -%}
  - {{ h }}
{% endfor -%}
```
渲染结果将严格按行排列, 无意外空行.

底层提示: 在编写配置文件模板时, 建议在循环和条件判断的结束标签 (-%}) 使用剥离符, 以获得最干净的输出结果.

3.4 增强处理: 过滤器链 (Filter Chains)

过滤器通过 | 管道符进行链式调用, 实现复杂的数据转换.

默认值处理: {{ my_var | default('default_value') }}.
数据塑形: {{ list_var | unique | sort }}.
JSON 提取: {{ complex_json | json_query('users[*].name') }}.
状态转换: {{ my_bool | bool }} (确保严格的逻辑判定).

3.5 进阶: 自定义 Filter 插件

当内置过滤器无法满足特殊的数据清洗需求时, 可以编写 Python 脚本进行扩展.

存放路径: 在 Playbook 同级目录下创建 filter_plugins/ 文件夹.
代码实现: 创建 my_custom_filters.py.

class FilterModule(object):
    def filters(self):
        return {
            'hex_convert': self.to_hex,
        }

    def to_hex(self, value):
        return hex(int(value))

使用: {{ 255 | hex_convert }} -> 0xff.

3.6 综合实战: 动态负载均衡配置

展示如何结合魔法变量、循环和条件判断生成一个 HAProxy 后端配置:

# HAProxy Backend Config
backend dynamic_web
    balance roundrobin
    {% for host in groups['web_servers'] -%}
    # Node: {{ host }} ({{ loop.index }}/{{ loop.length }})
    server {{ host }} {{ hostvars[host]['ansible_facts']['default_ipv4']['address'] }}:80 check {{ 'backup' if hostvars[host]['is_backup'] | default(false) else '' }}
    {% endfor %}

多级提取: json_query('nodes[*].interfaces[0].ip')
带过滤条件的提取: json_query('nodes[?status==ready].hostname')
多字段转换 (投影): json_query('nodes[*].{Name: hostname, State: status}')
排序与限制: json_query('sort_by(nodes, &cpu_usage)[-1].hostname') (获取 CPU 使用率最高的主机名)

底层提示: json_query 需要在控制节点安装 jmespath Python 库. 它是构建自愈系统 (Self-healing systems) 提取关键指标的首选工具.

4. 安全性: Ansible Vault

在源码管理 (Git) 中, 严禁明文存储密码、秘钥等敏感信息. Ansible Vault 提供了基于 AES-256 的全链路加密方案.

4.1 加密原理 (Under the Hood)

Ansible Vault 的安全性并非简单的密码替换, 其背后有着严密的密码学设计:

对称加密 (AES-256): 使用相同的密钥进行加解密. 性能极高, 足以保障大规模文件的加密需求.
密钥派生 (PBKDF2): 为了防止暴力破解, Vault 不会直接使用你的原始密码. 它通过 PBKDF2 算法, 结合 盐值 (Salt) 和数万次哈希迭代, 从你的密码中派生出一个 256 位的二进制密钥.
完整性校验 (HMAC): 加密数据中包含了一个消息认证码 (MAC). 在解密时, Ansible 会验证数据的完整性. 如果文件被手动篡改 (即便没有密码), 解密也会报错, 防止中间人攻击.
文件头结构: 加密文件的首行标记 (如 $ANSIBLE_VAULT;1.1;AES256) 定义了版本和算法, 确保控制节点能识别并调用正确的解密逻辑.

4.2 核心 CLI 操作

掌握以下指令即可覆盖 90% 的加解密场景:

任务	命令示例
创建加密文件	`ansible-vault create secrets.yml`
加密现有文件	`ansible-vault encrypt vars.yml`
编辑加密文件	`ansible-vault edit secrets.yml`
临时查看内容	`ansible-vault view secrets.yml`
重置加密密码	`ansible-vault rekey secrets.yml`
解密文件 (永久)	`ansible-vault decrypt secrets.yml`

4.3 加密粒度选择

4.3.1 文件级加密 (File-level)

直接加密整个 YAML 文件. 优点是操作简单, 缺点是在 Git 中无法查看非敏感字段的变更.

# 运行 Playbook 时需提供密码过关
ansible-playbook site.yml --ask-vault-pass

4.3.2 变量级加密 (Variable-level)

使用 encrypt_string 仅加密特定的 Value. 优点是配置文件保持明文可读, 仅敏感值被 !vault 标记包裹.

# 生成加密字符串
ansible-vault encrypt_string 'my_super_password' --name 'db_password'

YAML 表现形式:

db_user: admin
db_password: !vault |
          $ANSIBLE_VAULT;1.1;AES256
          363836336137666231313331...

4.4 自动化配置: 避免手动输入密码

在 CI/CD 或频繁本地调试时, 每次输入密码非常低效.

保存密码至文件: echo 'your_password' > ~/.vault_pass chmod 600 ~/.vault_pass

配置 ansible.cfg:

[defaults]
vault_password_file = ~/.vault_pass

环境变量 (更高优先级): export ANSIBLE_VAULT_PASSWORD_FILE=~/.vault_pass

4.5 生产最佳实践

分离策略: 不要加密整个项目, 而是将敏感项提取到 secrets.yml 中并加密.

vars/main.yml: 存放普通配置.
vars/secrets.yml: 存放加密后的密码.

在 Playbook 中同时引用:

vars_files:
  - vars/main.yml
  - vars/secrets.yml

4.6 进阶架构: SOPS 与 GitOps 流水线

在现代 GitOps (如 ArgoCD) 架构中, Ansible Vault 的对称加密可能在多团队协作时产生密钥分发瓶颈.

SOPS (Secrets Operations): 允许利用 AWS KMS、GCP KMS 或 PGP 进行非对称加密.
优势: 在 Git 中仅加密 Value, Key 保持明文. 这使得版本对比 (Diff) 更加清晰, 且在 CI/CD 中可以通过 IAM 角色直接解密, 无需手动传递密码文件.

5. 本周实战任务

5.1 多维变量优先级验证

创建名为 variable-war.yml 的 Playbook.
分别在 group_vars/all.yml (低优先级), host_vars/<host>.yml (中优先级) 和 Play 内部的 vars: (高优先级) 定义同一个变量 env_type.
运行并观测输出, 最后通过命令行 -e "env_type=emergency" 尝试最终覆盖, 验证 "22层堆栈" 的逻辑死角.

5.2 动态负载均衡器模板 (含 Lookup)

编写一个 HAProxy 模板任务:

数据获取: 使用 lookup('file', ...) 读取内部的授权证书作为变量.
逻辑生成: 在 .j2 模板中使用 for 循环遍历 groups['web_nodes'].
Facts 联动: 从 hostvars 中动态提取每个 web 节点的私有 IP, 并通过 default 过滤器处理缺失 IP 的异常情况.
空白控制: 使用 {%- 和 -%} 符号确保生成的配置文件没有多余空行.

5.3 Vault 加密实战

配置 ansible.cfg 使用 .vault_pass 文件, 实现 Playbook 在不加参数的情况下能同时解密上述两种不同粒度的信息.

5.4 进阶挑战: 复杂数据清洗与合并

JMESPath: 使用 json_query 从一个包含 10 个节点的复杂 JSON 字典中, 提取出所有 CPU 核心数 > 4 且操作系统为 Ubuntu 的节点清单.
合并策略: 模拟 hash_behaviour=replace 的场景, 验证如何在不修改全局配置的情况下, 利用 Jinja2 的 combine 过滤器手动合并两个不同层级的字典变量.

变量是 Ansible 的血液. 掌握了优先级和 Jinja2, 你就拥有了构建自动化逻辑的 "外科手术刀".

Week 03: 变量优先级与 Jinja2 渲染引擎

On this page