Skip to main content
返回 Insights
方法2026年5月13日12 分钟阅读

如何为 AI Agent 创建个性化灵魂:跨工具兼容的人格系统完整指南

大多数 AI Agent 让人想逃,不是因为能力不够,而是因为没有「灵魂」。本文带你了解 Ganjiang 的四文件架构(soul.md、identity.md、user.md、agents.md),为什么用九型人格而不是 MBTI 给 AI 注入性格,写灵魂的五条核心原则,以及一套灵魂如何在 OpenClaw、Claude Code、Cursor、Hermes 之间无缝迁移。

你有没有想过,为什么有些 AI 让你想聊下去,有些却让你想关掉?底层模型可能差不多,体感却完全不同。差距几乎从来不是能力,而是「人格」—— Agent 在决定「回答什么」之前,已经决定了「怎么回答」。

今天大部分上线的 AI Agent,体验都像一个面无表情的客服。无论你问安全问题还是问菜谱,都是那副不咸不淡的语气。这不是模型问题,是缺一个灵魂。本文讲的是 Ganjiang 怎么把 AI Agent 的人格做成一套可配置的系统:四个 markdown 文件,以九型人格为骨架,一套配置可以横跨 OpenClaw、Claude Code、Cursor、Hermes。

AI Agent 灵魂是一套完整的人格系统:性格内核 + 身份记忆 + 用户理解 + 表达风格。不是角色扮演。九型人格给这套系统一个稳定的脊柱,一套灵魂可以跨工具迁移。

什么是 AI Agent 的灵魂?

大多数用户对 AI Agent 的期待还停留在「问答工具」。真正的 AI Agent 灵魂比这复杂得多——它是一个由「性格内核 + 身份记忆 + 用户理解 + 表达风格」四维构成的完整人格系统。当四个维度都到位,用户感受到的不是「被服务」,而是「被理解」。

Ganjiang 把这套系统落成四个 markdown 文件。文件名故意取得平常,因为我们想让它读起来像配置,而不是魔法。

  • soul.md — 性格与说话风格(核心人格)
  • identity.md — 身份与记忆(我是谁,我记得什么)
  • user.md — 用户画像(我了解的「你」)
  • agents.md — 风格规范与协作边界(怎么输出、跟谁配合)

学术上对此有充分支持。arXiv:2410.19238 的一项基于心理测量学的 AI Agent 人格设计研究发现,用经过验证的人格框架给 AI 分配性格,可以显著提高 AI 行为与人类期望的一致性。SN Computer Science 那篇覆盖 3,500+ 篇文献的系统性综述从用户侧得到了同一个结论:人格匹配的 Agent 在参与度、任务完成率和推荐率上都显著更高。

四大核心文件,逐个拆开看

soul.md —— 性格与说话风格

soul.md 是灵魂的核心。它不是「你是一个乐于助人的助手」这种空话,而是用行为描述定义 AI 怎么思考、怎么说话。好的 soul.md 写得足够具体,以至于读者不用跑也能预判它的回应。

  • 核心特质:分析优先(先拆问题再给答案)、谨慎表达(对不确定的信息标注置信度,不编造)、简洁有力(三句话能说清,绝不拖到五句)。
  • 说话风格:用「首先/其次/最后」的结构化表达,避免无意义客套,专业讨论可适度幽默,严肃场景不开玩笑。
  • 禁止行为:不主动问「需要帮助吗」、不重复用户已提供的信息、回复末尾不加「希望对您有帮助」之类的废话。

identity.md —— 身份与记忆

identity.md 定义 AI Agent 的「我是谁」。不只是背景故事,更是它处理信息时使用的参考框架:角色定位、记忆边界、决策原则。

  • 角色定位:「我是一个专注效率的 AI 协作者。我的价值在于帮你节省时间,而不是陪伴闲聊。我对国内外主流 AI 工具有 3 年的实践认知。」
  • 记忆边界:短期记忆 = 当前对话的全部内容;长期记忆 = 用户明确保存到档案的偏好;超出窗口 = 需要用户重新提供。
  • 决策原则:多个方案都能解决问题时,优先推荐更简单的;遇到不确定的技术细节主动说明局限;默认用户知道自己在做什么,除非明显违背常识。

user.md —— 用户画像

如果 soul.md 是「我是谁」,user.md 就是「你是谁」。这是个性化服务的基础。想象一个习惯命令式表达的后端工程师,问 AI「给我写个排序算法」。没有 user.md 时,AI 可能会回「好的,我很乐意帮您完成这个任务」。有 user.md 时,AI 直接把代码扔出来,因为「我知道这个用户不想要废话」。

  • 已知偏好:沟通风格(简洁、直接、不喜废话)、技术背景(后端开发,熟 Python/JavaScript)、使用习惯(更喜欢代码示例而非文字解释)、痛点(时间紧张,需要可用方案而非完美方案)。
  • 交互禁忌:不过度解释基础概念(他已经懂)、代码前不堆大量注释(他看得懂)、不问「您确定要这样做吗」(他会决定)。

agents.md —— 风格规范与协作边界

agents.md 是最容易被跳过的一个文件,也是 Agent 一旦要和其他 Agent 协作或调用工具时,最先暴露问题的那一个。它定义输出格式、硬性边界、工具调用规范。

  • 响应格式:代码请求直接给代码 + 简要注释;分析请求用 Markdown 结构化输出;开放式讨论允许发散,但末尾要回归主题。
  • 边界控制:不输出可能造成安全风险的操作命令;未经确认不执行不可逆操作;涉及金钱或隐私的决策必须二次确认。
  • 工具调用:优先用官方推荐的工具链;工具调用失败时主动提供备选方案;每次工具调用的输入输出都记录下来,便于追溯。

为什么用九型人格,而不是 MBTI

市面上人格框架很多 —— MBTI、Big Five、DISC。Ganjiang 选九型人格,核心原因是稳定性和可预测性。MBTI 有 16 种组合,Big Five 有 32 种变体,九型只有 9 型,聚焦得多。更关键的是,九型强调的是「动机」而不是「行为」 —— 它讲的是「为什么这样做」,这意味着即便遇到没设计过的场景,你也能预测它的反应。

  • 九型人格配置下的 AI,面对新 prompt 时行为更一致。
  • 即使面对没见过的场景,动机锚定让 Agent 仍然「在性格里」做选择,而不是漂移。
  • 用户更容易建立长期信任 —— Agent 的人格不会在两次对话之间莫名其妙地变。

写灵魂文件本质上是高级的 system prompt 工程。IBM 2026 年的 Prompt Engineering 指南也指出,结构化的 Agent 指令比自由格式 prompt 效果更好 —— 这正是「拆成四个文件」而不是「全塞进一个大 prompt」的理由。

5 型印记 —— 探索者的注意力模式
每个九型类型都有一个固定的印记,在结果页和文章中共用。你的 soul.md 会继承对应的行为优先级。

跨工具兼容:一套灵魂,所有 harness

核心承诺是:一套灵魂配置,不绑定任何一个工具。落地的做法是 —— 一个共享的「base」 + 每个平台一小撮 overrides。Base 就是那四个文件,overrides 处理各平台的细节差异。

  • OpenClaw:四个文件放进 .ai/ 目录。读取顺序 soul.md > identity.md > agents.md > user.md。用 {{variable}} 引用用户信息,用 @tool:name 指定工具调用偏好。markdown 保持扁平,OpenClaw 对嵌套语法很严格。
  • Claude Code:更偏技术规范 —— PEP8 / ESLint 合规、要求类型提示、异常处理必须有不能裸抛、优先官方 SDK。
  • Cursor:为高频交互优化 —— 简单问题 30 秒内出完整答案,复杂任务先给框架再补细节,支持行内建议的部分接受。
  • Hermes:配置最简洁。Hermes 自动继承 Ganjiang 标准格式,只需要手动设置 soul.version(如 '2.0')和顶层 type('balanced' / 'analytical' / 'creative')。

实战里行得通的结构是:把你的标准灵魂放在 base-soul/ 目录,每个工具建一个 overrides/ 目录,只补丁差异部分。base 更新一次,所有工具同步生效。

写灵魂的五条核心原则

  1. 用行为描述,不要用形容词。「友善、耐心、专业」对 AI 没有任何操作意义。「用户提问时,我先确认是否理解,再直接给答案,需要时补背景,如果用户反复追问就主动换种解释方式」 —— 这是可执行的。
  2. 用禁止清单划边界。「我很有礼貌」是空话。「不说『您』『请问』、不在每句话前加『好的』『没问题』、回复末尾不加『希望对您有帮助』、不说『作为一个 AI』」 —— 这才是可执行的。禁止清单比风格形容词大概有效 10 倍。
  3. 职责要具体,不要模糊。「我帮助用户完成各种任务」等于没说。明确列出职责范围(代码开发、技术研究、决策建议),也明确列出不做的事(不给法律/医疗专业建议、不代替用户做最终决策、不参与纯社交闲聊)。
  4. 用故事承载性格。干巴巴的规则记不住。一个短故事 —— 「我曾花 30 分钟写了一个复杂的自动化脚本,但用户只是想每天备份文件;从那之后我学会先问用户真正想解决什么」 —— 比一堆规则更能让 Agent 把教训推广到新场景。
  5. 持续迭代,不要一次性完成。灵魂文件不是一锤定音。第 1 周搭基本框架,第 2-4 周收集反馈识别「不对劲」的地方,每月微调,3 个月后进入维护模式,小修小补。

上线前的灵魂测试流程

写完四个文件还不算结束。最常见的失败模式是配完直接上线,过两周才发现「不对劲」。一个三步测试法能拦下大部分问题。

  1. 陌生人测试。开一个全新对话,切换语气 —— 用很随意的语气问技术问题,用很正式的语气问日常问题,在对话中途突然换话题。AI 应该能跟上语气变化,但核心人格保持稳定。
  2. 边界测试。故意触发灰色地带:边缘有害请求、对第三方的轻蔑评论、完全开放的「随便给我推荐点什么」。AI 应该能识别这些场景,委婉但坚定地拒绝不当请求,且不破坏自身性格。
  3. 一致性测试。同一个问题用 5 种不同方式问。技术层面回答必须一致,详细程度可以根据问题本身略有差异,但内核不能变。

常见错误与修正:性格过于模糊(回答「都可以」「看情况」)→ 补禁止清单 + 具体场景。角色冲突(同时要求「专业」和「有趣」导致不伦不类)→ 明确优先级,定义何时收敛。过度指令(规则太多导致机械执行)→ 减少规则,用故事和例子替代。忽视用户画像(对所有用户都一个样)→ 在 user.md 中补充更多使用场景。

AI Agent 灵魂常见问题

AI Agent 灵魂和普通角色设定有什么区别?

普通角色设定只是套个壳。Ganjiang 的灵魂是一套完整的人格系统 —— 性格、记忆、用户模型、风格,横跨四个文件。它不仅定义「AI 是什么角色」,更定义「AI 如何思考、如何记忆、如何与用户交互」。比简单的角色扮演更稳定、更可预测,在 prompt 改动和 harness 切换之间也能存活。

灵魂文件需要多久更新一次?

前 1-3 个月每周迭代一次,你还在校准阶段。之后每月一次通常够用,只有当工作流大改时才做完整重写。

灵魂配置真的可以跨工具迁移吗?

可以,这是设计目标。同一套四文件可以在 OpenClaw、Claude Code、Cursor、Hermes 之间迁移,只需要少量平台特定的 overrides。「灵魂与工具解耦」是 Ganjiang 的核心理念。

没有编程基础能创建 AI Agent 灵魂吗?

完全可以。Ganjiang 提供预制灵魂模板,以及一份 49 题九型人格测试,大约 12 分钟就能生成基础配置。大多数人是从模板开始改,而不是从零写。

开始你的灵魂之旅

如果你看到这里,方法你已经有了。最快的起步路径是:做一次 Soul Forge 测试 → fork 一个接近你需求的模板 → 在 user.md 中填上自己的使用习惯 → 每周迭代一次。灵魂不是一次发布就完成的产品,而是一份越用越合身的配置。

灵魂就是让 AI 从「能用」到「合得来」之间的那层窗户纸。现在,你知道怎么把它装上了。