Ch. 4 — Notes · § 012025·04·12 · — words
Ch. 4

从 0 到 1 构建 Agent Skill:11 个开源项目复盘

§ 01
COLOPHON
Source Serif 4 · JetBrains Mono · Forge Codex
TOOLS
Next 15 · MDX · framer-motion

立开发者构建 11 个 AI Agent 工具的实战经验,从想法到发布的完整链路,包括 Claude Skill 设计模式与 Go CLI 实践

TL;DR: 过去几个月我构建了 11 个开源工具,涵盖 Claude Skill 与 Go CLI 两条线。这篇文章复盘每个项目的决策背景,提炼出可复用的设计模式。


§为什么要造这些工具

一句话:因为我自己需要

我是一个科技博主,每周写公众号文章。每次发文章的流程是:

  1. ·用 Markdown 写内容
  2. ·手动复制到微信编辑器
  3. ·一点一点调格式
  4. ·上传封面图
  5. ·预览、发布

这个流程每次要花 30-60 分钟。于是我写了 md2wechat,一行命令把 Markdown 转成微信排版,直接推到草稿箱。

从此一发不可收拾。

§11 个项目的故事

Claude Skill 系列:6 个工具

md2wechat:起点项目

解决我自己的排版痛点。从 Skill 版本(给 Claude Code 用)到 Go CLI 轻量版(md2wechat-lite),迭代了两个版本。

最关键的决策是 38+ 主题。用户持续提主题需求,这个数字是需求驱动出来的。事后证明,可选主题是这个工具最大的差异化点。

agora:最复杂的项目

6 个审议室、31 位思想家、3 轮结构化辩论,一个完整的 Multi-Agent 系统。

最大的挑战在于人格设计。31 位思想家里,每一位的回答风格都要有辨识度。孙子讲势,马基雅维利讲权力,费曼讲类比,这些「性格」全靠 SKILL.md 里的角色描述来控制。

any2card:分享工具

把文章变成卡片图,方便在社交平台扩散内容。核心诉求:一键生成,不需要打开设计软件。

interactive-learning:学习工具

苏格拉底式学习路径生成器。用提问代替讲解,让用户在对话中建立认知。这是 11 个项目里唯一一个「我觉得应该存在」的工具,自己使用频率相对低。

readme-generator:文档工具

自动生成专业 README,含 16:9 信息图,底层使用 Playwright 截图。解决的问题是:开发者写代码很快,写文档很慢。

travel-guidebook:行程工具

通过并行 Agent 和高德 MCP 生成旅行手册 PDF。这个项目验证了 MCP 工具链在实际场景里的可用性。

Go CLI 系列:5 个工具

imgcli:最有挑战的项目

零 CGO 依赖做图片处理。Go 社区的图片库大多依赖 C 库(libpng、libjpeg)。选择纯 Go 实现,牺牲一点性能,换来真正的跨平台。

gcli:最实用的项目

在服务器上读邮件。听起来简单,实际上最大的坑是 OAuth。

Google 的 OAuth 流程需要浏览器,但服务器没有浏览器。解决方案:PKCE 模式加设备授权流程,用户在手机上完成授权,CLI 自动获取 token。

jina-cli:Agent 的眼睛

给 AI Agent 用的网页阅读工具。把任意 URL 转成干净的 Markdown,让 Agent 能读网页内容而不被 HTML 噪声干扰。

md2wechat-lite:轻量版本

md2wechat 的 Go 版本,不依赖 Node.js。对于只需要基础排版功能的用户,这个版本的安装成本更低。

theatre:叙事引擎

沉浸式历史叙事 Skill,见证者视角,支持多剧本。把历史事件变成第一人称体验,这是探索 AI 叙事可能性的实验项目。

§复盘:做对的事

一行安装是硬指标

安装步骤超过 3 步,大部分用户会放弃。

我的标准:README 的第一个代码块就是安装命令。不需要 clone 仓库,不需要配环境。

先给自己用,再给别人用

11 个项目里,9 个是先解决我自己的问题。自己不用的工具很难持续维护,这一点在 interactive-learning 上体现得最明显。

Go 的分发优势是真实的

单二进制文件,不需要运行时。用户不需要装 Node、Python 或任何东西。curl | bash 一步到位。

§复盘:做错的事

文档永远不够

每个项目发布后,最多的 issue 不是 bug,是「怎么用」。README 写了不代表用户会看,README 够清楚不代表 AI 能理解。

过早扩展配置项

md2wechat 的 38 个主题,其中 30 个很少有人用。早期应该先做 3 个打磨过的主题,而不是 38 个粗糙的主题。

缺少结构化测试

Agent Skill 很难写自动化测试,输出是 AI 生成的,每次都不一样。但解析逻辑和输出格式至少应该有覆盖。

§下一步

我还在持续构建新的工具。目前的方向:

  • ·商业化验证:把成熟的 Skill 做成付费服务
  • ·社区驱动:让用户提需求,投票决定优先级
  • ·教程输出:帮助更多开发者构建自己的 Agent Skill

你可以在 技术工具一览 页面找到所有工具的安装命令和 GitHub 链接。

如果你也在做类似的事情,欢迎关注我的公众号「极客杰尼」或在 X 上找到我。


我是极客杰尼,独立开发者。每周分享 AI 实战经验。

§FAQ

问:怎么安装这些工具?

每个工具的安装方式不同。CLI 工具(imgcli、gcli 等)通过 curl | bash 安装预编译二进制;Claude Skill(md2wechat、agora 等)通过 npx skills add 安装。详细命令在每个工具的 GitHub README 首行。

问:这些工具在 Windows 上能用吗?

Go CLI 工具支持 Linux 和 macOS,暂不提供 Windows 预编译包,但可以在 WSL2 下运行。Claude Skill 系列跨平台,只要安装了 Claude Code 即可。

问:源码在哪里?

所有工具的源码都在 github.com/geekjourneyx,MIT 协议开源。

SIGNED北京 · 2025·04·12 · git dev