prompt-engineering on

prompt-engineering on /tags/prompt-engineering/ Recent content in prompt-engineering on Hugo -- gohugo.io en Thu, 21 May 2026 22:00:00 +0800 读《Structured Prompt-Driven Development》：把 prompt 当一级交付物的几点笔记 /reading/martinfowler/structured-prompt-driven-spdd/ Thu, 21 May 2026 22:00:00 +0800 /reading/martinfowler/structured-prompt-driven-spdd/ Wei Zhang 和 Jessie Jie Xia（两位都来自 Thoughtworks）2026-04-28 在 Martin Fowler 网站发表了 Structured Prompt-Driven Development。核心主张比较干脆：把 prompt 当成与代码同级的工程工件管理——版本化、评审、复用、迭代。这条主张不新，但作者把它具体化成了一组流程、一份七维度模板（REASONS Canvas）和一套配套 CLI（gszhangwei/open-spdd），外加一个完整示例项目（gszhangwei/token-billing）。 SPDD 与 PDD、Spec Kit、PromptOps 这些相邻概念的差别，另起了一篇速写：prompt-driven vs spec-driven：把 PDD、SPDD、Spec Kit 几支理清楚。本文只聚焦 SPDD 这一篇文章本身。文章主张：prompt 是一级交付物文章开头给的一句话很直接： Instead of relying on ad hoc chats, SPDD turns prompts into assets that can be: version controlled, reviewed, reused, and improved over time. 这句话把 SPDD 和临时 chat 式交互区分开来：prompt 不只是一次性输入，而是可以被版本化、评审、复用和持续改进的资产。SPDD 想解决的问题文章写得很具体：模糊的需求被快速翻译成代码，误解随之扩散评审里要处理的改动越来越多集成 / 测试问题增加难以推理生产风险它给出的答案是：把"意图"从 chat 历史里拎出来，写成可追溯的工件。我怎么理解 AI Agent Skills：规范、实证，以及落地时的取舍 /posts/agent-skills-spec-and-evals/ Wed, 06 May 2026 10:00:00 +0800 /posts/agent-skills-spec-and-evals/ 至少从 2025 年下半年到我写这篇（2026-05-06）这段产品叙事看，“Agent Skills"是一个在 AI 工具圈快速升温的概念：Anthropic 在 Claude / Claude Code 里推它，Cursor、GitHub Copilot、Gemini CLI、OpenCode、Goose、Roo Code 等一批工具也陆续宣布支持，agentskills.io 则把它整理成了一个开放标准。至少在叙事层面，它确实有点像 AI 工具圈想长出来的一个"USB-C 接口”。但热闹归热闹，更冷静的那一面是：skill 真的有用吗？什么时候有用？怎么知道它有用？这一篇我把三份资料串起来聊一下： agentskills.io 给出 skill 的开放定义和加载机制； SWE-Skills-Bench 用基准实测提醒我们：公开 skill 在真实仓库里未必会带来增益； Angular 社区开发者 Daniel Sogl 那篇 Skills Without Evals Are Just Markdown and Hope，把 skill 的两种隐性失败模式说得很透。我现在更愿意把 skill 拆成两个层面来看：规范层面，它解决的是上下文如何按需分发；工程效果层面，它解决的是这份指令包能不能在你当前仓库里产生净增益。前者解释它为什么会流行，后者决定它值不值得进你的工作流。 Agent Skills 是什么按照 agentskills.io 的定义，一个 skill 本质上就是一个文件夹 + 一个 SKILL.md： my-skill/ ├── SKILL.md # 必需：metadata + 指令 ├── scripts/ # 可选：可执行脚本 ├── references/ # 可选：参考文档 ├── assets/ # 可选：模板、资源 └── .