从 0 到 1 构建 Agent Skill:我的 8 个开源项目复盘
2025/04/12

从 0 到 1 构建 Agent Skill:我的 8 个开源项目复盘

独立开发者构建 8 个 AI Agent 工具的实战经验 — 从想法到发布的完整链路

从 0 到 1 构建 Agent Skill:我的 8 个开源项目复盘

过去几个月,我构建了 8 个开源项目:3 个 Agent Skill + 5 个 CLI 工具。这篇文章复盘整个过程,分享从想法到发布的真实经历。

为什么要造这些工具

一句话:因为我自己需要

我是一个科技博主,每周写公众号文章。每次发文章的流程是:

  1. 用 Markdown 写内容
  2. 手动复制到微信编辑器
  3. 一点一点调格式
  4. 上传封面图
  5. 预览、发布

这个流程每次要花 30-60 分钟。于是我写了 md2wechat — 一行命令把 Markdown 转成微信排版,直接推到草稿箱。

从此一发不可收拾。

8 个项目的故事

md2wechat — 第一个项目

解决我自己的排版痛点。从 Skill 版本(给 Claude Code 用)到 Go CLI 轻量版(md2wechat-lite),迭代了两个版本。

最关键的决策:38+ 主题。不是我想做这么多主题,是用户一直在提需求。事后证明,可选主题是这个工具最大的差异化。

agora — 最复杂的项目

6 个审议室、31 位思想家、3 轮结构化辩论。这是一个 Multi-Agent 系统。

最大的挑战不是技术,是人格设计。31 位思想家里,每一位的回答风格都要有辨识度。孙子讲势,马基雅维利讲权力,费曼讲类比 — 这些「性格」全靠 SKILL.md 里的角色描述来控制。

gcli — 最实用的项目

在服务器上读邮件。听起来简单,实际上最大的坑是 OAuth。

Google 的 OAuth 流程需要浏览器。但服务器没有浏览器。解决方案:PKCE 模式 + 设备授权流程。用户在手机上完成授权,CLI 自动获取 token。

imgcli — 最有挑战的项目

零 CGO 依赖做图片处理。Go 社区的图片库大多依赖 C 库(libpng、libjpeg)。我选择了纯 Go 实现,牺牲一点性能,换来真正的跨平台。

其他项目

  • any2card — 把文章变成卡片图,方便社交分享
  • interactive-learning — 苏格拉底式学习路径生成器
  • jina-cli — 给 Agent 的网页阅读工具

复盘:什么做对了

1. 一行安装是硬指标

如果安装步骤超过 3 步,大部分用户会放弃。

我的标准:README 的第一个代码块就是安装命令。不需要 clone 仓库,不需要配环境。

2. 先给自己用,再给别人用

8 个项目里,7 个是先解决我自己的问题。唯一的例外是 interactive-learning,这是一个「我觉得应该存在」的工具。事实证明,自己不用的工具很难持续维护。

3. Go 的分发优势是真的

单二进制文件,不需要运行时。用户不需要装 Node、Python 或任何东西。curl | bash 一步到位。

复盘:什么做错了

1. 文档永远不够

每个项目发布后,最多的 issue 不是 bug,是「怎么用」。README 写了不代表用户会看。README 够清楚不代表 AI 能理解。

2. 过早优化主题/配置

md2wechat 的 38 个主题,其中 30 个很少有人用。早期应该先做 3 个好主题,而不是 38 个凑合的主题。

3. 缺少自动化测试

Agent Skill 很难写自动化测试 — 输出是 AI 生成的,每次都不一样。但至少应该测试解析逻辑和输出格式。

下一步

我还在持续构建新的工具。目前的方向:

  1. 商业化验证 — 把成熟的 Skill 做成付费服务
  2. 社区驱动 — 让用户提需求,投票决定优先级
  3. 教程输出 — 帮助更多开发者构建自己的 Agent Skill

如果你也在做类似的事情,欢迎关注我的公众号「极客杰尼」或在 X 上找到我。


我是极客杰尼,独立开发者。每周分享 AI 实战经验。