Glittering's blog Glittering's blog
Home
  • 学习手册

    • 《TypeScript教程》
    • 《Git》
    • 《Vite》
    • 《Vue3》
    • 《React18》
    • 《CSS》
    • 《Tailwind CSS》
  • 技术文档
  • 算法
  • 工作总结
  • 实用技巧
  • collect
About
  • Classification
  • Label
GitHub (opens new window)

Glitz Ma

前端开发工程师
Home
  • 学习手册

    • 《TypeScript教程》
    • 《Git》
    • 《Vite》
    • 《Vue3》
    • 《React18》
    • 《CSS》
    • 《Tailwind CSS》
  • 技术文档
  • 算法
  • 工作总结
  • 实用技巧
  • collect
About
  • Classification
  • Label
GitHub (opens new window)
  • 技术文档

  • 算法

  • 工作总结

    • 时区校正
    • 上传下载文件方式总结
    • web异常监控和分析
    • 前端优化指南
    • http缓存机制
    • 静态资源灰度发布
    • 浏览器原理及渲染机制
    • Chrome DevTools 渲染分析实战
    • Layout Thrashing(布局抖动)
    • Composite Layer(合成层)
    • 全局设置滚动条样式好吗?
    • 虚拟列表如何避免Layout和Paint
    • 前端安全知识
    • 安全(同源策略 / CSP / CORS)
    • 浏览器安全模型
    • 从chrome v8 讲安全
    • WebAssembly(Wasm)
    • XSS → JIT → 沙箱逃逸
    • 微前端总结
    • websocket聊天
    • Uni-app基础知识
    • react16高级特性
    • react16基础知识总结
    • vue2常见原理总结
    • vue2基础知识总结
    • webpack优化实践
    • webpack基础应用知识总结
    • Agent Skills是什么?跟MCP Workflow Command Prompt的关系。
    • 从cnn到transformer全解大模型
    • 什么是 Encoder 和 Decoder 结构
    • GPT 为什么能“看懂”问题
    • GPT 是怎么学会数学的
    • RAG 和 Agent的区别
    • context engineering 技术介绍
    • HarnessEngineering 驾驭工程的概念
      • 一、为什么会出现 Harness Engineering
      • 二、一句话理解
      • 三、Harness Engineering 的核心目标
        • 1 控制输出格式
        • 2 任务流程控制
        • 3 自动验证结果
        • 4 Tool 调用管理
        • 5 结果评估(Evaluation)
      • 四、Harness Engineering 的典型架构
      • 五、Harness Engineering 常见技术
        • 1 Structured Output
        • 2 Guardrails
        • 3 Retry & Self-healing
        • 4 Multi-pass Reasoning
        • 5 Workflow orchestration
      • 六、RAG / Context / Harness 的关系
      • 七、一个真实例子
      • 八、为什么这个概念很重要
      • 九、前端工程师能参与什么
        • 1 Tool UI
        • 2 Conversation State
        • 3 Agent 任务状态
        • 4 Streaming
      • 十、什么是 Harness Engineering?
    • GIS 基础三件套
    • GIS必会知识点
    • 100 万点地图怎么渲染?
    • GIS空间索引的实现
    • Cesium 从入门到精通:实战指南
    • OpenLayers 从零到精通:2025-2026实战指南
    • Mapbox GL JS 从零到精通:2025-2026实战指南
    • Cesium、OpenLayers 和 Mapbox GL JS 的关系、区别
    • 容器领域必学的黄金组合
    • 小程序笔记
    • 小程序工程模板设计
    • 地图标绘--射线法来计算点在多边形内
  • 实用技巧

  • 收藏夹

  • 技术
  • 工作总结
mamingjuan
2026-03-07
目录

HarnessEngineering 驾驭工程的概念

Harness Engineering(驾驭工程) 是 AI 工程领域最近逐渐被提出的一个概念,主要强调:

如何“控制、编排、约束”大模型,让它稳定地为系统工作。

可以理解为:

Harness = Harness the model(驾驭模型能力)

它关注的是 如何把一个“不可控的大模型”变成“可控的软件组件”。


# 一、为什么会出现 Harness Engineering

大模型有几个天然问题:

  • 输出不稳定
  • 幻觉(Hallucination)
  • 不遵守格式
  • 推理过程不可控
  • 无法保证业务规则

所以 AI 应用开发的核心挑战变成:

如何让模型稳定、可预测地完成任务。

Harness Engineering 就是解决这个问题。


# 二、一句话理解

可以这样理解三层关系:

Prompt Engineering → 写提示词
Context Engineering → 构造输入上下文
Harness Engineering → 控制模型行为
1
2
3

也可以理解为:

LLM能力
   ↑
Harness Engineering(控制)
   ↑
Context Engineering(信息输入)
   ↑
Prompt Engineering(指令)
1
2
3
4
5
6
7

# 三、Harness Engineering 的核心目标

通常有 5 个目标:

# 1 控制输出格式

例如要求模型输出 JSON:

{
  "title": "",
  "summary": "",
  "tags": []
}
1
2
3
4
5

如果模型输出不合法:

  • 自动重试
  • 自动修复

# 2 任务流程控制

例如:

Step1 解析用户需求
Step2 检索知识
Step3 生成答案
Step4 评估结果
1
2
3
4

LLM 只是其中一环。


# 3 自动验证结果

例如:

  • JSON schema 校验
  • 单元测试
  • 规则校验

示例:

LLM输出 → Validator → 不通过 → 重新生成
1

# 4 Tool 调用管理

Agent 会调用很多工具:

  • API
  • 数据库
  • 搜索
  • 代码执行

Harness 需要:

  • 决定是否允许调用
  • 控制调用顺序
  • 防止死循环

# 5 结果评估(Evaluation)

例如:

  • 自动评分
  • 自我反思(Self-Reflection)
  • 多模型投票

# 四、Harness Engineering 的典型架构

一个成熟 AI 系统通常是:

User Request
     │
     ▼
Harness Layer
 ┌───────────────────┐
 │ Prompt Builder     │
 │ Context Builder    │
 │ Tool Router        │
 │ Validator          │
 │ Retry Controller   │
 │ Evaluation         │
 └───────────────────┘
     │
     ▼
     LLM
     │
     ▼
  Final Result
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

这里的 Harness Layer 就是驾驭层。


# 五、Harness Engineering 常见技术

# 1 Structured Output

例如:

  • JSON schema
  • function calling

示例:

{
  "name": "create_ticket",
  "parameters": {
    "title": "string",
    "priority": "string"
  }
}
1
2
3
4
5
6
7

# 2 Guardrails

限制模型行为:

  • 敏感词过滤
  • 格式校验
  • 安全检查

很多框架提供:

  • Guardrails AI
  • Pydantic validation

# 3 Retry & Self-healing

模型出错自动修复:

LLM输出错误
   ↓
检测失败
   ↓
重新生成
1
2
3
4
5

# 4 Multi-pass Reasoning

多轮推理:

Draft → Critique → Improve
1

# 5 Workflow orchestration

任务编排:

LLM → Tool → LLM → Tool
1

常见框架:

  • LangGraph
  • CrewAI
  • Semantic Kernel

# 六、RAG / Context / Harness 的关系

完整 AI 系统其实是:

             Agent
               │
               ▼
       Harness Engineering
               │
        ┌──────┴──────┐
        ▼             ▼
Context Engineering   Tools
        │
        ▼
       RAG
        │
        ▼
        LLM
1
2
3
4
5
6
7
8
9
10
11
12
13
14

解释:

  • RAG → 提供知识
  • Context Engineering → 构造输入
  • Harness Engineering → 控制流程
  • Agent → 做任务决策

# 七、一个真实例子

用户说:

帮我总结这个 PDF 并生成 5 条结论。

Harness 系统会:

1 解析用户请求
2 调用PDF解析
3 构造Context
4 调用LLM生成总结
5 校验输出格式
6 如果不符合 → 重试
7 返回结果
1
2
3
4
5
6
7

LLM 只是其中一步。


# 八、为什么这个概念很重要

很多人误以为 AI 开发是:

用户 → Prompt → LLM
1

实际上真正系统是:

用户
  │
  ▼
Harness System
  │
  ▼
LLM
1
2
3
4
5
6
7

LLM只是一个推理引擎。


# 九、前端工程师能参与什么

在 AI 产品前端中,常见职责:

# 1 Tool UI

例如:

  • 文件上传
  • 搜索
  • 数据展示

# 2 Conversation State

维护:

messages
tools
context
1
2
3

# 3 Agent 任务状态

例如:

thinking
calling tool
generating
finished
1
2
3
4

# 4 Streaming

SSE / WebSocket。


# 十、什么是 Harness Engineering?

Harness Engineering 指的是在 AI 系统中通过一层控制和编排机制来“驾驭”大语言模型的工程方法。

它主要负责控制模型行为,例如任务流程编排、工具调用管理、输出格式校验、结果评估以及自动重试等。

在实际 AI 应用架构中,Harness 层通常位于 LLM 之上,通过 Prompt 构造、Context 管理和 Validator 等组件,将大模型从一个不可控的生成工具变成一个稳定可靠的系统组件。

上次更新: 2026/03/07, 10:29:53
context engineering 技术介绍
GIS 基础三件套

← context engineering 技术介绍 GIS 基础三件套→

Copyright © 2015-2026 Glitz Ma
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式